• AIWorldVision

    Jun 2, 2025

  • Google I/O '25 Keynote – Nejnovější AI inovace od Google

    Featured

    Jako autor a nadšenec do technologií jsem měl možnost sledovat fascinující přednášku Google I/O 2025, kde Sundar Pichai a tým Google představili dechberoucí novinky v oblasti umělé inteligence (AI), multimodálních modelů, pokročilých asistentů a nových zařízení. V tomto článku vás provedu vším, co bylo ohlášeno, včetně nejnovějších modelů Gemini, revolučních AI funkcí v Google Search, nových generací multimediálních nástrojů a také průlomových aplikací v XR zařízeních a dalších oblastech.

    🚀 Úvod do éry Gemini a AI revoluce

    Rok 2025 je bezpochyby rokem, kdy umělá inteligence mění způsob, jakým žijeme, pracujeme a tvoříme. Sundar Pichai otevřel keynote připomenutím, že Google je v současné době v „éře Gemini“ – nové generace AI modelů, které jsou nejen stále výkonnější, ale také dostupnější a rychleji implementované do produktů a služeb.

    Od posledního I/O Google oznámil přes tucet nových modelů a výzkumných průlomů, přičemž Gemini 2.5 Pro zaznamenal výrazný skok v kvalitě a výkonu. Na benchmarku Ella Marina tento model překonal všechny ostatní, včetně ChatGPT a GROC 3, což potvrzuje jeho vedoucí postavení v oblasti AI.

    Nejde však jen o výkon – Gemini 2.5 Pro exceluje také v programování, kde na platformě Cursor generuje stovky tisíc řádků kódu za minutu. Nejzajímavějším milníkem, který Sundar zmínil, bylo dokončení hry Pokémon Blue modelem Gemini, který úspěšně získal všech osm odznaků a porazil elitní čtyřku i šampiona. Tento výkon symbolizuje krok blíže k „API“ – umělé Pokémon inteligenci.

    🖥️ Výkonná infrastruktura a rychlost modelů

    Základem této rychlosti a kvality je špičková infrastruktura Google, zejména sedmá generace TPU s kódovým označením Ironwood, která přináší desetinásobný výkon oproti předchozí generaci a nabízí až 42,5 exaflopů výpočetního výkonu na port.

    Toto umožňuje nejen rychlé trénování modelů, ale i extrémně rychlé generování výstupů, což dokazují výsledky na benchmarku Ella Marina, kde modely Gemini drží tři první místa v rychlosti generování tokenů za sekundu. Navíc ceny za používání těchto modelů klesají, což znamená, že špičková AI je dostupná širšímu okruhu uživatelů.

    🌍 Masivní růst adopce AI a Gemini API

    Google zaznamenal skokový nárůst používání AI technologií. Zatímco před rokem bylo zpracováno zhruba 9,7 bilionu tokenů měsíčně, nyní to je již 480 bilionů – tedy 50násobný růst během jediného roku.

    Vývojáři také masivně adoptují Gemini API – již přes 7 milionů jich využívá modely Gemini na platformách Google AI Studio a Vertex AI, což představuje pětinásobný růst oproti minulému roku. Používání Gemini na Vertex AI se dokonce zvýšilo 40krát.

    V rámci koncových uživatelů se Gemini aplikace chlubí 400 miliony aktivních uživatelů měsíčně, přičemž u modelů 2.5 Pro je nárůst používání o 45 %.

    🗣️ Gemini Live a překlady v reálném čase 🌐

    Jednou z nejzajímavějších funkcí je Gemini Live, která nyní umožňuje sdílení kamery a obrazovky v reálném čase, což výrazně zlepšuje interaktivitu a přirozenost konverzací. Tato funkce je dostupná zdarma na Androidu a iOS.

    Příklad použití ukázal, jak může AI překládat rozhovor mezi hostem a pronajímatelem ubytování v Jižní Americe v reálném čase, přičemž zachovává tón a výraz mluvčích. Google právě zavádí překlady mezi angličtinou a španělštinou v Google Meet a plánuje rozšíření na další jazyky a firemní zákazníky.

    🧠 Projekt Astra: Univerzální AI asistent s kamerou a sdílením obrazovky 📱

    Projekt Astra představuje budoucnost AI asistenta, který rozumí světu kolem vás. Jeho schopnost využívat kameru a sdílet obrazovku umožňuje komunikovat o věcech, které vidíte, a dostávat okamžité odpovědi a rady.

    Demo ukázalo, jak asistent dokáže rozpoznat objekty v reálném světě – například odlišit konvertibil od popelnice nebo vysvětlit, že stín není skutečný sledovatel. Tato technologie je již k dispozici na Androidu a iOS a pomáhá uživatelům v každodenních situacích.

    🤖 Projekt Mariner: Multitaskingový AI agent pro práci na webu a počítači

    Projekt Mariner představuje schopného AI agenta, který dokáže provádět až deset úkolů současně a učit se z jedné ukázky, aby podobné úkoly zvládl samostatně v budoucnu. Díky tomu může například vyhledávat a filtrovat nabídky bytů, plánovat schůzky nebo provádět nákupy za uživatele.

    Mariner je již k dispozici vývojářům přes Gemini API a spolupracuje s firmami jako Automation Anywhere a UiPath. V létě bude dostupný širší veřejnosti.

    🛠️ Personalizace a kontext – budoucnost AI asistence 🎯

    Velký důraz je kladen na personalizaci AI. S vaším svolením může Gemini využívat relevantní data z různých Google aplikací, jako jsou Gmail, Drive nebo Docs, aby vám poskytoval odpovědi a návrhy, které odpovídají vašemu stylu a potřebám.

    Příklad z Gmailu ukázal, jak AI dokáže vytvořit odpověď na e-mail, která zní jako vy – používá vaše oblíbené fráze, tón i detaily z vašich poznámek a dokumentů. Tato funkce bude dostupná pro předplatitele již toto léto.

    🧑‍💻 Gemini 2.5 Pro a Flash – nové možnosti pro vývojáře 💻

    Gemini 2.5 Pro je nejinteligentnější model, který Google kdy představil, zatímco Gemini Flash je rychlý a efektivní model oblíbený u vývojářů. Nová verze Flash přináší lepší výkon, více jazyků a schopnost přepínat mezi hlasy a jazyky v reálném čase.

    Mezi další novinky patří „Thinking Budgets“, které dávají uživatelům kontrolu nad kvalitou a náklady generování odpovědí, a tzv. „thought summaries“, které přehledně shrnují, jak AI k odpovědi dospěla – což usnadňuje ladění a pochopení modelu.

    🎨 Kreativní AI nástroje: Imagine 4 a VO 3 s audio generací

    Google představil Imagine 4 – nový model pro generování obrazů, který přináší bohatší detaily, lepší texty a výraznější barvy. Je také desetkrát rychlejší než předchozí verze, což umožňuje rychlejší iterace při tvorbě designů, plakátů nebo pozvánek.

    Další revolucí je VO 3, nejnovější model generování videa, který kromě vyšší vizuální kvality umí generovat i zvuky, efekty a dokonce dialogy postav. To otevírá zcela nové možnosti pro filmaře a tvůrce obsahu, kteří mohou vytvářet realistické animace s autentickým zvukem a emocemi.

    📺 AI ve filmech a hudbě: Spolupráce s profesionály

    Google úzce spolupracuje s umělci a filmaři, například s režisérem Darrenem Aronofskym, který využívá VO modely k vytváření unikátních filmových zážitků. Nový nástroj Flow kombinuje generování obrazu, videa a zvuku a umožňuje tvůrcům snadno skládat a upravovat scény s vysokou mírou kontroly a kreativity.

    V hudbě Google nabízí Music AI Sandbox a model Lyria 2, schopný generovat profesionální audio se zpěvem a instrumentací, což otevírá nové možnosti pro hudebníky a skladatele.

    👓 Android XR: AI asistence v nových zařízeních a brýlích

    Android XR je nová platforma pro rozšířenou realitu, která bude pohánět zařízení od headsetů po lehké chytré brýle. Gemini AI asistent zde bude moci vidět, slyšet i rozumět vašemu okolí a poskytovat pomoc v reálném čase.

    Samsung Project Muhan je první headset na této platformě, který nabídne nekonečnou obrazovku a AI asistenta pro navigaci, informace a zábavu. Brýle Android XR zase umožní hands-free přístup k aplikacím, navigaci, překladům a dalším funkcím přímo před vašima očima.

    Ukázky z backstage Google I/O a živé demo ukázaly, jak lze přes brýle komunikovat, získávat informace o okolí, pořizovat fotky a ovládat zařízení hlasem. Partnerství s Gentle Monster a Warby Parker zajistí, že tyto brýle budou nejen chytré, ale i stylové.

    🔍 AI v Google Search: AI Mode a AI Overviews

    Google Search prochází zásadní transformací díky AI. AI Overviews, které používá Gemini, již využívá přes 1,5 miliardy uživatelů měsíčně a přináší rychlé a přesné shrnutí výsledků vyhledávání.

    Nový AI Mode je pak kompletně přepracovaný zážitek, který umožňuje klást delší a složitější otázky, získávat personalizované odpovědi, vizualizace a dokonce nechat AI za vás vyřídit úkoly, jako je nákup vstupenek nebo rezervace stolů v restauraci.

    Technologie „query fan out“ umožňuje AI rozdělit komplexní dotazy na podúkoly a paralelně je vyřešit, čímž zajišťuje rychlé a hluboké odpovědi. AI Mode navíc přináší nové funkce jako personalizované návrhy na základě vašich předchozích interakcí a možnost připojení dalších Google aplikací pro ještě lepší kontext.

    ⚾ Analýza dat a agenti ve vyhledávání

    Ukázka z baseballového prostředí demonstrovala, jak AI dokáže analyzovat komplexní data, například statistiky hráčů používajících nové typy pálky, a prezentovat je v přehledných tabulkách a grafech. To vše s možností následných dotazů v konverzačním stylu.

    Dále AI Mode umí využívat agentní schopnosti pro vyhledávání a nákup vstupenek, automaticky vyplňovat formuláře a vybírat nejlepší možnosti podle zadaných kritérií. Tyto funkce se brzy rozšíří i na rezervace restaurací a další lokální služby.

    🖼️ Multimodální vyhledávání a Search Live

    Google Lens, který umožňuje vyhledávání na základě fotek, nyní zaznamenává přes 1,5 miliardy uživatelů měsíčně. Novinkou je Search Live, který kombinuje vizuální vstupy s hlasovou interakcí v reálném čase. Díky němu můžete například při domácím vědeckém experimentu nebo opravě dostávat okamžité rady a odpovědi, jako byste byli na video hovoru s odborníkem.

    🛍️ Inteligentní nákupy s AI v Search

    Vyhledávání s AI nyní přináší také zcela nové zážitky v oblasti online nakupování. Můžete dostávat vizuální návrhy na produkty, které odpovídají vašemu vkusu a potřebám, například výběr koberce na základě barvy vašeho nábytku a životního stylu rodiny.

    Nová funkce „try on“ umožní virtuální vyzkoušení oblečení přímo z vašeho telefonu, kdy AI model realisticky zobrazí, jak bude daný kousek vypadat na vaší postavě. K tomu přibývá i agentní funkce sledování cen a automatického nákupu, která vám pomůže ulovit nejlepší nabídky bez námahy.

    🤝 Spolupráce s tvůrci a budoucnost AI

    Google nepřestává inovovat a spolupracuje s umělci, hudebníky a filmaři, aby AI technologie byly nejen výkonné, ale i etické a užitečné. Například Synth ID je technologie pro vodoznaky v generovaném obsahu, která pomáhá rozpoznat AI generované média a chránit originální tvůrce.

    Filmaři jako Darren Aronofsky využívají AI modely k rozšíření svých možností vyprávění, což otevírá nové cesty kreativity a emocionálního vyjádření.

    🌟 Závěr: AI jako nástroj pro lepší budoucnost

    Google I/O 2025 ukázal, že umělá inteligence je stále více integrovaná do našich každodenních životů – od produktivity, přes kreativitu, až po zábavu a nakupování. Gemini a související projekty představují komplexní a výkonnou platformu, která posouvá hranice možného a nabízí uživatelům a vývojářům nástroje, které jim umožní tvořit, učit se a žít lépe.

    Jako někdo, kdo sleduje vývoj AI dlouhodobě, jsem nadšený z rychlosti pokroku a širokého spektra aplikací, které Google představuje. Tato technologie není jen o číslech a benchmarkech, ale především o tom, jak může skutečně zlepšit životy lidí po celém světě.

    Pokud vás zajímá, jak AI změní váš každodenní život, určitě doporučuji sledovat další vývoj Gemini aplikací a nových funkcí v Google produktech, protože to, co jsme viděli na I/O, je jen začátek vzrušující cesty.