Google I/O 2025: Nový AI-native Google

Google I/O Gemini AI Android

Éra Gemini

Project Astra & Live API: Přirozená interakce s AI

Logan Kilpatrick zahájil prezentaci ukázkou, jak Project Astra míří k tomu, aby byla interakce s AI naprosto přirozená. Mnoho těchto schopností je nyní dostupných skrze Live API poháněné novým nativním audio modelem Gemini 2.5 Flash. Tento model je zdatnější v ignorování rušivých zvuků a nativně podporuje 24 jazyků, čímž otevírá cestu k intuitivnějším a citlivějším AI zážitkům.

Tvořte s Gemini: Reálná multimodální interakce

Paige Bailey demonstrovala sílu práce s Gemini v ukázce „Keynote Companion“. Pomocí Google AI Studio předvedla, jak AI rozumí mluveným příkazům, pracuje s živými daty (například zobrazení Shoreline Amphitheatre na mapě) a zvládá i komplexní dotazy, jako je hledání kaváren s Wi-Fi v okolí – a to vše v konverzačním toku. To ukazuje působivé multimodální schopnosti Gemini.

Gemini Keynote Companion Demo

Android se vyvíjí: Adaptivní UI, XR a AI asistence přímo v IDE

Adaptivní design: Compose a Android XR

Diana Wong zdůraznila závazek Googlu usnadnit tvorbu adaptivních uživatelských rozhraní. Novinky v knihovně Compose Adaptive Layouts, například rozšiřování panelů (Pane Expansion), pomáhají vývojářům vytvářet aplikace, které se bez problémů přizpůsobují různým velikostem obrazovek i form factorům. Tento adaptivní přístup se přímo přenáší i do Android XR, platformy rozšířené reality ve spolupráci se Samsungem. Vývojáři mohou už nyní tvořit pro připravované headsety jako Project Moohan s vědomím, že jejich adaptivní aplikace budou na novém poli rovnou fungovat.

Chytřejší programování: AI agenti v Android Studiu

Florina Muntenescu představila revoluční novinku pro Android vývojáře: nový AI agent, který brzy dorazí do Android Studia. Tento agent má pomáhat s rutinními úkony, například aktualizacemi verzí. V názorné ukázce AI agent analyzoval starý projekt, našel chyby při sestavování a následně využil Gemini k nalezení a implementaci řešení – dokud sestavení nebylo úspěšné. To slibuje výrazné zjednodušení vývojářského workflow.

Logo

Připraveni rozšířit své podnikání?

Začněte svou bezplatnou zkušební verzi ještě dnes a viďte výsledky během několika dní.

Web je chytřejší: On-device AI a lepší tvorba UI

Efektivní webové UI: Novinky pro komplexní komponenty

Una Kravets vyzdvihla nové možnosti webu, které usnadňují tvorbu běžných, ale překvapivě komplexních uživatelských prvků. Vývojáři nyní snadněji vytvoří robustní a přístupné komponenty jako jsou karusely nebo hover cards, což zlepšuje uživatelský zážitek na webu.

Gemini Nano na webu: Odemčené multimodální AI API

Addy Osmani oznámil, že Gemini Nano přináší nové multimodální schopnosti přímo do webu. Nová vestavěná multimodální AI API umožní uživatelům komunikovat s Gemini pomocí audia i obrázku. V demo ukázce „Cinemal“ uživatel vyfotil vstupenku přes webkameru a AI na zařízení okamžitě identifikovala jeho sekci sedadel v mapě sálu – skvělá ukázka zpracování přímo v zařízení.

Firebase & AI: Akcelerace vývoje aplikací

David East předvedl, jak Firebase integruje AI pro rychlejší vývoj aplikací. Vývojáři nyní mohou oživit Figma návrhy v Firebase Studiu pomocí Builder.io. A co je nejzajímavější? Nejde jen o hromadný export kódu – Figma exportuje oddělené, samostatné React komponenty. Pomocí Gemini ve Firebase Studiu David ukázal, jak snadno může požádat AI o přidání tlačítka „Přidat do košíku“ na produktovou stránku, což AI ihned provedla a aktualizovala kód i živý náhled webu.

Demokratizace AI: Nové open modely – Gemma 3n & SignGemma

Gemma 3n: Výkonná AI už na 2GB RAM

Gus Martins přinesl skvělou zprávu pro open-source komunitu s oznámením Gemma 3n. Tento mimořádně efektivní model běží už na 2GB RAM, což je mnohem rychlejší a úspornější pro mobilní zařízení než Gemma 3. Důležité je, že Gemma 3n nyní rozumí i audia, takže je skutečně multimodální.

SignGemma: Překonávání komunikačních bariér

Google rozšiřuje hranice přístupnosti i s SignGemma. Tato nová rodina modelů je trénovaná na překlad znakového jazyka (aktuálně americký znakový jazyk – ASL) do textu mluvené řeči, což otevírá nové možnosti komunikace a inkluze.

Nový Gemini 2.5 Flash ve FlowHunt

Zaujaly vás neuvěřitelné AI novinky z Google I/O? Chcete začít tvořit sofistikované AI agenty, kteří rozumí, uvažují a jednají?

FlowHunt je platforma poháněná AI, která vám umožní snadno tvořit výkonné AI agenty bez nutnosti být expertem na strojové učení. Navrhujte komplexní workflow, integrujte různé nástroje a nasazujte inteligentní agenty bez námahy.

A skvělá zpráva? Jak zaznělo v keynote, FlowHunt nyní podporuje průlomový Gemini 2.5 Flash! To znamená, že můžete okamžitě začít využívat jeho rychlost, efektivitu a pokročilé audio funkce k tvorbě ještě silnějších a pohotovějších AI agentů.

Vyzkoušejte Gemini 2.5 Flash ve FlowHunt

Vyzkoušejte nové modely nasazené ve FlowHunt za méně než 24 hodin – ihned!

Často kladené otázky

Yasha je talentovaný softwarový vývojář specializující se na Python, Javu a strojové učení. Yasha píše technické články o AI, inženýrství promptů a vývoji chatbotů.

Yasha Boroumand
Yasha Boroumand
CTO, FlowHunt

Vyzkoušejte Gemini 2.5 Flash ve FlowHunt

Zažijte sílu nového modelu Gemini 2.5 Flash ve FlowHunt a tvořte nové generace AI agentů s pokročilými multimodálními schopnostmi.

Zjistit více

ChatGPT Atlas, DeepSeek OCR a Claude Code Web
ChatGPT Atlas, DeepSeek OCR a Claude Code Web

ChatGPT Atlas, DeepSeek OCR a Claude Code Web

Prozkoumejte nejnovější AI inovace z října 2024 včetně prohlížeče ChatGPT Atlas, DeepSeek OCR s kompresí vize a textu, Claude Code web a nastupujících technolog...

12 min čtení
AI News LLMs +4