Visualizing World Models with Project Genie | Vibe coding v Google AI Studio: Jak si stavím designové nástroje pro nový typ modelu

Futuristic holographic world model environment with interconnected glowing nodes and layered transparent frames, shown without any text

Když se řekne „world model“, snadno si to představím jako něco mezi hrou a simulací. Jenže v praxi to může být úplně jiný typ rozhraní pro AI: model, který není ani čistě hra, ani video, ale něco, co se dá „promptovat“ textem a obrázky a chovat se jako prostředí, které se dá zkoumat.

Tohle téma mě fascinuje už dlouho, protože skutečnou práci dělá nejen model samotný, ale i nástroje, které kolem něj postavím. A přesně tady se vynořuje vibe coding v Google AI Studio. Nejde jen o to „rychle něco zkusit“. Jde o to, že si dokážu vyrobit konkrétní interaktivní nástroje, které odpovídají tomu, jak přemýšlí design, jak přemýšlí inženýrství a jak přemýšlí celý tým.

V následujících odstavcích popisuju, jak by se dalo tento přístup uchopit a proč mi přijde tak praktický. Zároveň se opřu o konkrétní příklady z procesu tvorby Project Genie: od vizuálního brandingu jako refrakční 3D materiál, přes sliders a optické nastavení, až po timeline pro animace a sdílení přes JSON.

Obsah

🧭 Proč world model potřebuje víc než jen prompt

U většiny projektů s generativní AI je nejjednodušší cesta: zadám prompt, dostanu odpověď. Jenže u world modelu to často nestačí. Proč? Protože „world“ je vnímání prostoru v čase. Nejde jen o výsledný obrázek nebo krátkou sekvenci. Potřebuju rozhraní, které mi pomáhá:

  • modelovat vjem (jak má svět vypadat, jak se chová ve vizuální rovině),
  • iterovat rychle (zkusit varianty bez dlouhého cyklu),
  • ladit konzistenci (aby se výsledek dal přepnout do „produkční“ podoby),
  • komunikovat v týmu (design a engineering musí mluvit společnou řečí).

To je důvod, proč jsem začal brát design toolchain okolo modelů jako rovnocennou součást produktu. V Project Genie se právě kolem „brandingu světa“ řešila otázka: jak vizuálně zprostředkovat ideu prostoru, který se dá prozkoumávat.

✨ Vibe coding jako „most“ mezi designem a kódem

Vibe coding je pro mě hlavně způsob myšlení. Nejde o to, že by se tím obcházelo programování. Spíš používám nástroj, který mi dovolí rychle přetavit nápad do funkčního prototypu. V Google AI Studio jsem schopný postavit interaktivní nástroj a hned nad ním iterovat.

Z pohledu projektu Project Genie mi sedí tento princip: tým tvoří prototyp vizuálního efektu a zároveň tím získává přesnou specifikaci pro následnou implementaci na webu.

🎛️ Když design potřebuje „fyziku“ a inženýr potřebuje „parametry“

V designu se často používají slovní popisy typu „udělej to soupatější“, „změkči okraje“ nebo „ať to vypadá křehce“. To ale inženýrsky není vždy praktické. V ideálním případě si vytvořím nástroj s parametry, které mají význam pro obě strany.

Praktická analogie: místo „udělej to více wow“ vytvořím sadu sliderů, které pokrývají konkrétní vlastnosti efektu. A protože už sloužím týmové komunikaci, každý parametr může mít jasnou roli.

🔮 Crystal Ballifier: jak jsem si postavil refrakční 3D materiál jako brand světě

Jedním z nejzajímavějších prototypů, které se v Project Genie objevily, je efekt, který si ve výsledku říká „Crystal Ballifier“. Mám z toho dojem, že to byl přesně ten typ prototypu, který vznikne, když kombinuju kreativitu designerů s laděním přes parametry.

V řešení se řešila otázka brandingu modelu. Cílem bylo vyjádřit myšlenku „world“ skrze vizuální materiál. Návrh nebyl „jen“ estetický. Šlo o to, že refrakční 3D materiál se dá vyrobit v kódu, ověřit a pak i dál rozvíjet.

🧪 Proč právě slidere a experimentování v prototypu

V návrhu efektu se ukázalo, že slidere nejsou jen pohodlné. Jsou to nástroje pro objevování „in-between“ stavů, které bych běžně nedokázal vygenerovat pouhým textovým promptem ani posbírat z moodboardu.

Takový workflow vypadá typicky takto:

  1. Vytvořím základní efekt (tvar, materiálové vlastnosti, světlo, odlesky).
  2. Ke každé významné vlastnosti přidám slider.
  3. Iteruju: posouvám parametry a hledám mezizóny, které dávají nový charakter.
  4. Hledám „sweet spot“ (sladký bod), kde se kombinace vlastností trefí do přesně toho dojmu.

V konkrétním případě se tým posunul k tomu, co bylo popsané jako situace, kdy se roughness (drsnost) „fade out“, tedy postupně mizí do jemnějšího vzhledu. Výsledek byl efekt „soupy“, tedy jakási slizově měkká, tekutá průhlednost. A to byla designová výhra.

🔍 Z „koule“ se stala „čočka“

Jedna věc, která mě na tomto přístupu baví, je, že se tvar může v průběhu ladění změnit. V určité fázi se ukázalo, že efekt není jen koule. Stal se z něj „lens“, tedy čočka.

Tenhle posun dává smysl: když potřebuji přesné optické nastavení (odlesky, deformace, chování světla), tvar a parametry materiálu se mění tak, aby lépe odpovídaly tomu, co chci vidět.

Z praxe to čtu jako důležitý signál: nejde jen o „najít hezký výsledek“, ale o vytvořit kontrolovatelný systém. A ten pak může sloužit i dalším rolím v projektu.

🧩 Prototyp jako překladový software mezi designem a front-endem

V týmu se často stává, že designérka pošle poznámky a inženýr je musí převést do implementace. Jenže „převod“ může být subjektivní. A tím se zhoršuje inkluzivita procesu: každý popis je trochu jiný, každý to interpretuje jinak.

Když ale mají designéři slidere nebo parametry, jsou „všichni na stejné stránce“. Najednou se komunikace zjednoduší do formy, kterou můžu považovat za společný jazyk.

V Project Genie se efekt stal jakousi „translation layer“ mezi designem a engineeringem. Designér mohl například říct: „IUR value by měla být 3.5“ místo „udělej to trochu tlustší“ nebo „udělej to víc soupy kolem okrajů“.

Tohle je přesně to, co si chci v každém kreativně-technickém projektu pohlídat:

  • názvy a hodnoty parametrů mají být konzistentní,
  • tým musí vědět, co přesně znamená změna parametru,
  • k výsledkům se musí vracet,
  • ideálně musí jít versionovat i experimenty.

📦 Ukládání a načítání: JSON jako záchranná brzda pro iterace

Jedním z klíčových detailů, které se ukázaly jako překvapivě praktické, je práce se scénářem „ladím, uložím, pošlu“. Když si vytvořím prototypovací appku s parametry, potřebuju umět:

  • uložit aktuální nastavení (aby bylo možné se k němu vrátit),
  • načíst ho později (pro další experiment nebo pro produkční implementaci),
  • sdílet ho s ostatními (designéři, inženýři, případně další týmy).

Proto se v prototypu objevila možnost ukládat a načítat nastavení pomocí JSON souborů. Praktický důsledek: mohu poslat appku nebo konfiguraci inženýrům a oni ji mohou vzít jako „launch pad“ pro webovou implementaci.

V mém přístupu je JSON v tomhle typu práce vždy dobrá volba, protože:

  • je čitelný,
  • snadno se verzíruje v Git workflow,
  • dobře se mapuje na parametry v kódu i do UI.

🎞️ Timeline a klíčové snímky: animace jako součást stejné sady nástrojů

Pro brand a vizuální identitu většinou nestačí statický vzhled. Potřebuju animaci. V prototypu se objevila funkce timeline s keyframes. Tím se efekt přepíná mezi různými stavy a dá se animovat v čase.

Pro mě je to důležité, protože animace často odhalí věci, které v statickém snímku nevyniknou. Když se dívám jen na „frame 1“, můžu přehlédnout jitter, nepříjemné změny roughness nebo optické artefakty.

Timeline a klíčové snímky mi dávají možnost uvažovat o designu jako o systému, ne jako o jednorázové kouzelnické změně.

⚡ Co mě na timeline překvapilo

Bylo zdůrazněno, že se objevila „timeline“ funkce a fungovala relativně dobře. A to je přesně ten typ momentu, kdy vibe coding dává největší smysl: prototyp není jen jedna věc. Je to platforma, na které dokážu rychle přidávat vrstvy funkcionality.

🤝 Spontánní spolupráce: versionování myšlenek místo versionování nástrojů

Když tým pracuje kreativně, největší brzdou bývá „přetahování o prostředí“. Každý má svůj toolchain, každý zkouší trochu jinak, vzniká paralelní vývoj bez společného kontextu.

V Project Genie se popsalo, že se necílilo primárně na version-control tools, ale na version-control nápadů. V překladu: když někdo udělal prototyp, druhý ho zkopíroval, přidal feature, a v dalším kroku se do prototypu promítlo to, co jiný našel jako lepší variantu.

Konkrétně zaznělo, že bylo možné copyovat app, doplnit feature a potom ji zase navzájem rozvíjet. Příklad: jeden člověk navrhl přidat color correction a druhý na to navázal tak, že to šlo udělat „v jednom promptu“.

Pro mě je to zajímavé z hlediska procesu. Neznamená to, že se nepoužívá Git. Znamená to, že se nejdřív upřednostní rychlé skládání nápadů a až potom se řeší, jak to nejlépe udržet dlouhodobě.

🌐 Multiplayer live editing a GitHub sync: kam tohle směřuje

V rámci budoucího vývoje se mluvilo o tom, že přijde multi-way GitHub sync a multiplayer live editing spolupráce. Praktický dopad by byl velký: lidé nebudou muset čekat, až se někdo vrátí k jednomu stroji. Budou schopni importovat a synchronizovat práci přes GitHub a zároveň spolu upravovat v reálném čase.

To je přesně ten typ schopnosti, který promění vibe coding z osobního prototypování na plnohodnotný týmový „výzkum v pohybu“.

🛠️ Když AI Studio připomíná tvorbu design software znovu

V jednom momentu zaznělo, že občas může působit zvláštně, že se recreuje design software od nuly. U mě to ale vždycky překládá do jedné pravdy: když nemám přesně to UI, které potřebuji, musím ho postavit. A pokud to postavím rychle v prostředí, kde jsou modely blízko, získám konkurenční výhodu.

Co mi dává smysl, je ten důraz na idiosynkratický charakter nástrojů. Nejde o to vyrábět produkt pro milion lidí. Jde o to vyrobit nástroj pro sebe a své blízké kolegy.

V praxi to znamená, že software může být „hyper-specific“, tedy dělaný přesně pro daný efekt, daný styl, daný způsob práce. A paradoxně právě tohle umožní rychlejší iterace.

📽️ Od prototypu k dalším projektům: ASCII art filmmaking a generativní roguelike

Ještě zajímavější je, že tento mindset neskončil u Project Genie. V rozhovoru se zmínily i osobní projekty: například ASCII art filmmaking tool, kde člověk napíše skript a nástroj z něj dělá hudbu i scény.

Druhý příklad byl generativní roguelike, „lo-fi“ verze toho, co si někdo představuje, že by Genie mohlo být. Tady je vidět, že koncept „světa“ nemusí znamenat jen jeden konkrétní typ aplikace. Může to být i herní zážitek, kde svět generuji a zároveň ho procházím.

V obou případech je společné to, že AI Studio funguje jako tvůrčí canvas. Nejen pro jednorázové generování, ale pro budování malých nástrojů, které posouvají kreativní proces.

🔭 Jak tohle využít v praxi: moje doporučená šablona pro vibe coding nástrojů kolem AI

Nechci, ab to působilo jako inspirace bez návodu. Takže tady je konkrétní šablona, kterou bych použil, kdybych znovu stavěl něco jako „Crystal Ballifier“ pro nový svět model nebo jiný generativní systém.

1) Začnu problémem, ne efektem

Nejprve si ujasním, co přesně má „svět“ komunikovat. Je to materiálová identita? Atmosféra? Optika? Interaktivita?

2) Vyrobím první verzi s několika klíčovými parametry

Nečekám, až budu mít ideální UI. Udělám základní efekt a přidám jen pár sliderů, které nejspíš budou nejdůležitější. Pak teprve doplním další.

3) Iteruju hledáním sweet spotu

Slidery nejsou jen ovládání. Jsou to hledací nástroje. Posouvám je a hledám mezizóny, které se nedají přesně popsat promptem ani vybrat z moodboardu.

4) Zavedu ukládání konfigurace

Uložím nastavení do JSON. Tím zjednoduším spolupráci a vracení se k výsledkům. Bez ukládání jsem odsouzený k „paměťové“ práci.

5) Postavím timeline jen když dává smysl

Animace má smysl tehdy, když odhalí hodnotu. Pokud efekt reprezentuje svět v čase, timeline je přirozený krok.

6) Udělám z prototypu translation layer

Pokud spolupracuji s designem, vytvořím parametry tak, aby se o nich dalo mluvit. I když jdu jen po interním týmu, sdílený jazyk výrazně zlepší rychlost i srozumitelnost.

✅ Co mi z toho plyne o budoucnosti stavby AI produktů

Z celého přístupu mi nejvíc vychází jeden závěr: když mám AI Studio jako canvas a na jednom místě dostupné modely, mění se způsob, jakým produkty stavím. Nejenže můžu generovat, ale můžu stavět i nástroje, které dělají generování použitelným pro lidi.

V rozhovoru zazněla i myšlenka, že moment, kdy bude AI Studio „místem“ pro všechny modely, je právě ten okamžik, na který si lidé chtějí počkat. V překladu: místo aby se věci skládaly přes více služeb, nástrojů a kontextů, budu mít jeden pracovní prostor pro prototypování modelového chování i UI vrstvy.

A i když je můj současný projekt malý, podobný mindset mi pomáhá. Prototyp nemusí být jen „demo“. Může to být skutečný most mezi kreativním cílem a implementací.

📌 Shrnutí: proč mi vibe coding pro Project Genie dává smysl

  • World model potřebuje rozhraní, které se chová jako nástroj pro iteraci, ne jen jako generátor.
  • Vibe coding v Google AI Studio umožňuje rychle vyrobit přesné interaktivní nástroje (slidery, optické nastavení, timeline).
  • Refrakční 3D branding ukázal, že slidere odemykají „in-between“ stavy, které nejde snadno popsat promptem.
  • JSON ukládání pomáhá sdílet nastavení jako konkrétní specifikaci.
  • Translation layer zjednodušuje komunikaci design a engineeringu tím, že používá společný parametrický jazyk.
  • Spontánní spolupráce typu „copy, add feature, iterate“ je dobrá strategie pro rané fáze vývoje.
  • Budoucí multiplayer a GitHub sync posunou vibe coding z osobního prototypování směrem k týmové spolupráci.

Pokud si chci něco odnést pro vlastní projekty, tak právě tohle: nezačínej jen promptem. Začni rozhraním. Začni parametry. A vytvoř si způsob, jak se nápad dá sdílet, vracet a ladit tak dlouho, dokud z toho nevznikne něco, co má vizuální i technickou integritu.


AI World Vision

AI and Technology News