Google I/O 2025: Google AI bản địa mới

Google I/O 2025: Google AI bản địa mới

Khám phá cách Google I/O 2025 mở ra Kỷ nguyên Gemini với các cập nhật dựa trên AI trên toàn hệ sinh thái Google, và xem FlowHunt mang mô hình Gemini 2.5 Flash mới nhất đến các dự án AI của bạn như thế nào.

Kỷ nguyên Gemini

Project Astra & Live API: Khiến AI Tự Nhiên Như Cuộc Sống

Logan Kilpatrick mở màn bằng màn trình diễn về cách Project Astra hướng tới việc biến tương tác AI trở nên hoàn toàn tự nhiên. Nhiều khả năng này hiện đã có thể truy cập qua Live API, được vận hành bởi mô hình âm thanh bản địa Gemini 2.5 Flash mới. Mô hình này có khả năng bỏ qua tạp âm tốt hơn và hỗ trợ bản địa 24 ngôn ngữ, mở đường cho trải nghiệm AI trực quan và phản hồi hơn.

Xây dựng với Gemini: Tương tác Đa phương tiện Thời gian Thực

Paige Bailey đã trình diễn sức mạnh xây dựng với Gemini qua demo “Keynote Companion”. Sử dụng Google AI Studio, cô cho thấy AI có thể hiểu lệnh nói, tương tác với dữ liệu trực tiếp (như hiện vị trí Shoreline Amphitheatre trên bản đồ), thậm chí thực hiện các tìm kiếm phức tạp như tìm quán cà phê có Wi-Fi gần đó, tất cả trong một luồng hội thoại tự nhiên. Điều này nhấn mạnh khả năng đa phương tiện ấn tượng của Gemini.

Gemini Keynote Companion Demo

Android Tiến hóa: Giao diện Thích ứng, XR, và Trợ lý AI trong IDE

Thích ứng theo Thiết kế: Compose và Android XR

Diana Wong nhấn mạnh cam kết của Google trong việc giúp phát triển giao diện thích ứng dễ dàng hơn. Các tính năng mới trong thư viện Compose Adaptive Layouts, như Pane Expansion, được thiết kế để giúp lập trình viên tạo ứng dụng thích ứng linh hoạt trên nhiều kích thước màn hình và thiết bị. Triết lý thích ứng này còn mở rộng trực tiếp đến Android XR, nền tảng thực tế mở rộng hợp tác cùng Samsung. Các lập trình viên có thể bắt đầu xây dựng cho các kính thực tế như Project Moohan ngay bây giờ, đảm bảo ứng dụng thiết kế thích ứng của họ sẵn sàng cho kỉ nguyên nhập vai mới này.

Lập trình Thông minh hơn: AI Agent trong Android Studio

Florina Muntenescu đã công bố một thay đổi lớn cho lập trình viên Android: một AI agent mới sắp ra mắt trên Android Studio. Agent này được thiết kế để hỗ trợ các tác vụ nhàm chán như cập nhật phiên bản. Trong demo ấn tượng, AI agent phân tích một dự án cũ, phát hiện lỗi build, sau đó dùng Gemini để tìm cách sửa lỗi, lặp lại cho đến khi build thành công. Điều này hứa hẹn tối ưu hóa quy trình phát triển đáng kể.

Web Thông minh hơn: AI Trên Thiết bị và Xây dựng UI Nâng cao

Web UI Tinh gọn: Khả năng mới cho các thành phần phức tạp

Una Kravets giới thiệu các tính năng web mới giúp đơn giản hóa việc tạo các thành phần UI phổ biến nhưng phức tạp. Lập trình viên sẽ dễ dàng xây dựng các thành phần bền vững, dễ tiếp cận như carousels và hover cards, nâng cao trải nghiệm người dùng trên web.

Gemini Nano trên Web: Bùng nổ API AI Đa phương tiện

Addy Osmani thông báo rằng Gemini Nano đang mở khóa khả năng đa phương tiện mới trực tiếp trên web. Các API AI tích hợp đa phương tiện mới cho phép người dùng tương tác với Gemini bằng cả âm thanh và hình ảnh. Một demo “Cinemal” đã minh họa điều này, khi người dùng chụp ảnh vé bằng webcam, AI trên thiết bị lập tức xác định khu ghế trên bản đồ rạp – một ví dụ mạnh mẽ về xử lý trực tiếp trên thiết bị.

Firebase & AI: Tăng tốc Phát triển Ứng dụng

David East đã trình diễn cách Firebase tích hợp AI để thúc đẩy phát triển ứng dụng. Lập trình viên giờ đây có thể biến thiết kế Figma thành sản phẩm trên Firebase Studio với sự hỗ trợ của Builder.io. Điều ấn tượng? Xuất Figma không chỉ là dump code nguyên khối; mà là tạo ra các component React riêng biệt, độc lập. Sử dụng Gemini trong Firebase Studio, David đã dễ dàng yêu cầu AI thêm tính năng như nút “Thêm vào giỏ hàng” vào trang chi tiết sản phẩm, AI ngay lập tức triển khai, cập nhật code và cả bản xem trước trực tiếp.

Dân chủ hóa AI: Các mô hình mở mới – Gemma 3n & SignGemma

Gemma 3n: AI mạnh mẽ chỉ với 2GB RAM

Gus Martins mang tin vui cho cộng đồng mã nguồn mở với sự ra mắt của Gemma 3n. Mô hình siêu hiệu quả này chạy chỉ cần 2GB RAM, nhanh hơn, nhẹ hơn trên thiết bị di động so với Gemma 3. Đặc biệt, Gemma 3n đã có khả năng hiểu âm thanh, trở thành mô hình thực sự đa phương tiện.

SignGemma: Thu hẹp Khoảng cách Giao tiếp

Google cũng đang mở rộng khả năng tiếp cận với SignGemma. Dòng mô hình mới này được huấn luyện để dịch ngôn ngữ ký hiệu (hiện tập trung vào Ngôn ngữ ký hiệu Mỹ – ASL) sang văn bản ngôn ngữ nói, mở ra cơ hội giao tiếp và hòa nhập mới.

Gemini 2.5 Flash mới trên FlowHunt

Bạn bị truyền cảm hứng bởi những bước tiến AI tại Google I/O? Muốn bắt đầu tạo AI Agents thông minh có thể hiểu, suy luận và hành động?

FlowHunt là nền tảng AI giúp bạn tạo AI Agents mạnh mẽ một cách liền mạch mà không cần là chuyên gia học máy. Thiết kế quy trình phức tạp, tích hợp nhiều công cụ, triển khai agent thông minh dễ dàng.

Và tin vui? Đúng như sức mạnh các mô hình mới trong keynote, FlowHunt đã hỗ trợ Gemini 2.5 Flash đột phá! Giờ bạn có thể tận dụng ngay tốc độ, hiệu quả và khả năng âm thanh vượt trội của nó để xây dựng AI Agents mạnh mẽ, phản hồi hơn.

Trải nghiệm Gemini 2.5 Flash trên FlowHunt

Trải nghiệm các mô hình mới được tích hợp trên FlowHunt chỉ chưa đầy 24 tiếng!

Câu hỏi thường gặp

Trọng tâm chính của Google I/O 2025 là gì?

Google I/O 2025 nhấn mạnh sự chuyển đổi của công ty sang tương lai bản địa AI, với các mô hình Gemini là trung tâm của các sản phẩm và tính năng mới trên Android, web và công cụ lập trình.

Gemini 2.5 Flash là gì?

Gemini 2.5 Flash là mô hình AI âm thanh bản địa mới nhất của Google, mang đến khả năng xử lý âm thanh nhanh, hiệu quả và đa ngôn ngữ, hiện đã khả dụng cho lập trình viên và tích hợp vào các nền tảng như FlowHunt.

Gemma 3n và SignGemma là gì?

Gemma 3n là mô hình AI hiệu quả chạy chỉ với 2GB RAM cùng khả năng đa phương tiện (âm thanh). SignGemma là dòng mô hình dịch ngôn ngữ ký hiệu, tập trung vào ASL, sang văn bản ngôn ngữ nói.

FlowHunt tận dụng các mô hình Gemini mới như thế nào?

FlowHunt hiện đã hỗ trợ Gemini 2.5 Flash, cho phép người dùng tạo AI Agents tiên tiến với khả năng âm thanh, đa phương tiện nâng cao mà không cần chuyên môn về học máy.

Những tính năng AI mới trên Android và phát triển web là gì?

Android giới thiệu giao diện thích ứng, hỗ trợ XR, và AI agent trong Android Studio giúp lập trình thông minh hơn. Trên web, Gemini Nano mang đến API AI đa phương tiện cho đầu vào âm thanh và hình ảnh trực tiếp trên trình duyệt.

Yasha là một nhà phát triển phần mềm tài năng, chuyên về Python, Java và học máy. Yasha viết các bài báo kỹ thuật về AI, kỹ thuật prompt và phát triển chatbot.

Yasha Boroumand
Yasha Boroumand
CTO, FlowHunt

Trải nghiệm Gemini 2.5 Flash trên FlowHunt

Trải nghiệm sức mạnh của mô hình Gemini 2.5 Flash mới trên FlowHunt và xây dựng thế hệ AI Agents tiếp theo với các khả năng đa phương tiện tiên tiến.

Tìm hiểu thêm

Gemini Flash 2.0: AI với Tốc Độ và Độ Chính Xác Vượt Trội
Gemini Flash 2.0: AI với Tốc Độ và Độ Chính Xác Vượt Trội

Gemini Flash 2.0: AI với Tốc Độ và Độ Chính Xác Vượt Trội

Gemini Flash 2.0 đang thiết lập các tiêu chuẩn mới trong lĩnh vực AI với hiệu suất, tốc độ và khả năng đa phương thức vượt trội. Khám phá tiềm năng của nó trong...

4 phút đọc
AI Gemini Flash 2.0 +4
Khám Phá Các Tác Nhân AI: Gemini 1.5 Flash 8B Suy Nghĩ Như Thế Nào
Khám Phá Các Tác Nhân AI: Gemini 1.5 Flash 8B Suy Nghĩ Như Thế Nào

Khám Phá Các Tác Nhân AI: Gemini 1.5 Flash 8B Suy Nghĩ Như Thế Nào

Khám phá kiến trúc, quá trình suy nghĩ và hiệu suất thực tế của Gemini 1.5 Flash 8B—một tác nhân AI tiên tiến xuất sắc trong xử lý thông tin, suy luận và các nh...

14 phút đọc
AI Agents Gemini 1.5 Flash 8B +4
Suy Nghĩ Đằng Sau Các Tác Nhân AI: Gemini 1.5 Pro
Suy Nghĩ Đằng Sau Các Tác Nhân AI: Gemini 1.5 Pro

Suy Nghĩ Đằng Sau Các Tác Nhân AI: Gemini 1.5 Pro

Khám phá quy trình suy nghĩ, kiến trúc và cách ra quyết định của Gemini 1.5 Pro, một tác nhân AI đa năng, thông qua các nhiệm vụ thực tế và phân tích chuyên sâu...

15 phút đọc
AI Agents Reasoning +5