Google ra mắt loạt AI mới cùng kính thông minh đối đầu Meta và Apple

Khoa học và Công nghệ 20/05/2026 10:03

Sự kiện thường niên Google I/O 2026 vừa chính thức diễn ra tại Mỹ, đánh dấu một bước tiến lớn của ông lớn công nghệ Alphabet trong cuộc đua trí tuệ nhân tạo. Với việc công bố thế hệ mô hình Gemini 3.5 cùng hàng loạt công cụ đột phá, Google đang hiện thực hóa chiến lược dịch chuyển từ những chatbot phản hồi câu hỏi thông thường sang hệ sinh thái "AI agent" (tác tử AI) chủ động hành động, có khả năng tự xử lý các chuỗi công việc phức tạp thay cho con người.

Sức hút từ hệ sinh thái AI của Google được minh chứng rõ nét qua công bố của CEO Sundar Pichai: ứng dụng Gemini hiện đã cán mốc hơn 900 triệu người dùng hằng tháng, tăng gấp đôi chỉ trong vòng 12 tháng qua.

1_1779242560.jpeg
Google ra mắt loạt AI mới.

Gemini 3.5 và thế hệ trợ lý hành động thông minh

Trọng tâm của sự kiện năm nay là sự xuất hiện của Gemini 3.5 Flash - mô hình AI chú trọng vào tốc độ và sự gọn nhẹ nhưng sở hữu hiệu năng vượt trội. Số liệu kiểm thử do Google công bố cho thấy mô hình mới này đã vượt qua phiên bản tiền nhiệm Gemini 3.1 Pro trong nhiều bài đo hiệu suất chuyên sâu. Cụ thể, Gemini 3.5 Flash đạt tỷ lệ 76,2% ở tác vụ lập trình trên Terminal-Bench 2.1, đạt điểm tư duy tác nhân 1656 Elo trên GDPval-AA và dẫn đầu về khả năng hiểu dữ liệu đa phương thức với 84,2% trên bài kiểm tra lập luận CharXiv. Tốc độ xuất chuỗi ký tự của mô hình mới nhanh gấp bốn lần so với các AI cùng phân khúc, giải quyết triệt để bài toán đánh đổi giữa chất lượng câu trả lời và độ trễ hệ thống.

"Đây là mô hình lập trình và mang tính tác nhân mạnh mẽ nhất của chúng tôi từ trước đến nay", đại diện Google khẳng định.

Sự cân bằng giữa tốc độ và hiệu suất giúp Gemini 3.5 Flash vận hành mượt mà các tác vụ dài hạn đòi hỏi AI liên tục lập kế hoạch, thực hiện và điều chỉnh. Những quy trình phân tích phức tạp từng khiến các lập trình viên mất nhiều ngày hay kiểm toán viên tài chính mất nhiều tuần nay có thể rút ngắn đáng kể với chi phí tối ưu, chỉ bằng một nửa hoặc một phần ba so với các mô hình tiên tiến khác trên thị trường.

Đi kèm với đó, Google cũng giới thiệu Gemini Spark - một trợ lý AI cá nhân hoạt động dựa trên nền tảng Gemini 3.5 Flash. Không dừng lại ở việc trả lời câu hỏi, Gemini Spark có thể kết nối sâu vào hệ sinh thái Google Workspace (Gmail, Docs, Calendar, Tasks) để tự động quét lịch trình, nhắc việc, tạo bản tổng hợp hằng ngày (Daily Brief) và thay mặt người dùng thực hiện một số hành động số dưới sự chỉ đạo của con người. Bên cạnh đó, giao diện của ứng dụng Gemini cũng được tái thiết kế theo phong cách hiện đại mang tên Neural Expressive, giúp tối ưu hiển thị thông tin quan trọng bằng các mô hình trực quan, dòng thời gian tương tác và tích hợp tính năng đàm thoại Gemini Live ngay tại màn hình chính.

Sáng tạo video đa nguồn và giải pháp xác minh nguồn gốc nội dung số

Một điểm nhấn công nghệ khác thu hút sự chú ý tại Google I/O 2026 là Gemini Omni (với phiên bản đầu tiên là Gemini Omni Flash) - mô hình được thiết kế để mô phỏng thế giới vật lý và dự đoán các diễn biến tiếp theo dựa trên hành động của người dùng. Khác với các công cụ tạo video thông thường, Gemini Omni cho phép kết hợp đồng thời cả hình ảnh, âm thanh, văn bản và video đầu vào để tạo ra các thước phim chất lượng cao, có chiều sâu câu chuyện nhờ kho kiến thức am hiểu về lịch sử, khoa học và bối cảnh văn hóa.

Mô hình này có khả năng thấu hiểu trực quan các quy luật vật lý như trọng lực, động năng và động lực học chất lưu, giúp giữ vững tính nhất quán của nhân vật và bối cảnh. Người dùng hoàn toàn có thể quay một đoạn clip thực tế rồi trò chuyện bằng ngôn ngữ tự nhiên để yêu cầu AI chỉnh sửa hành động, thêm bớt vật thể hoặc biến đổi phong cách môi trường xung quanh. Hiện tại, Gemini Omni Flash đã bắt đầu được triển khai trên ứng dụng Gemini, Google Flow (nền tảng studio sáng tạo làm phim bằng AI) và được cung cấp miễn phí trên YouTube Shorts, YouTube Create.

Trước nguy cơ các công cụ AI tạo sinh bị lợi dụng để tạo nội dung giả mạo hoặc độc hại, Google đã công bố chiến lược mở rộng hệ sinh thái xác minh nguồn gốc nội dung SynthID. Đây là công nghệ đóng dấu mờ kỹ thuật số vô hình do Google phát triển từ năm 2023, giúp nhận diện hình ảnh, video hoặc âm thanh được tạo ra bởi AI mà không làm ảnh hưởng đến trải nghiệm của người xem.

Đáng chú ý, Google đã mở rộng hợp tác với các ông lớn công nghệ khác như OpenAI, Nvidia, Kakao và ElevenLabs để đưa công nghệ SynthID trở thành một chuẩn chung toàn cầu trên Internet. Đồng thời, hãng cũng ra mắt API phát hiện nội dung AI trên nền tảng Google Cloud và áp dụng bộ tiêu chuẩn hiển thị lịch sử chỉnh sửa nội dung số C2PA. Dòng smartphone Google Pixel 10 sắp tới sẽ là thiết bị đầu tiên tích hợp thông tin xác thực C2PA trực tiếp vào ứng dụng camera gốc để chứng minh hình ảnh được chụp từ ống kính thật.

Hệ sinh thái Android XR và bước đi chiến lược trên thiết bị đeo

Song song với các bước tiến về phần mềm, Google tiếp tục đặt cược vào thị trường thiết bị đeo thông minh thông qua nền tảng Android XR. Tại sự kiện, hãng đã hé lộ dự án kính thực tế hỗn hợp (MR) mang tên Project Aura hợp tác cùng Xreal, sở hữu thiết kế gọn nhẹ như kính râm nhưng tích hợp phần cứng mạnh mẽ, cho phép mở nhiều cửa sổ ứng dụng trong không gian ảo và phản chiếu màn hình máy tính không dây.

Đồng thời, để cạnh tranh trực tiếp với các đối thủ trong lĩnh vực kính AI, Google công bố đang hợp tác cùng Samsung, Qualcomm cùng các hãng thời trang kính mắt nổi tiếng như Gentle Monster và Warby Parker để phát triển dòng kính thông minh tập trung vào trải nghiệm âm thanh. Sản phẩm này dự kiến ra mắt vào mùa thu năm nay, hỗ trợ tương thích với cả hệ điều hành Android lẫn iOS.

Dòng kính mới này được thiết kế để cung cấp thông tin trực tiếp qua giọng nói truyền riêng vào tai người dùng thay vì hiển thị trên màn hình. Tích hợp sâu trợ lý Gemini, thiết bị cho phép người dùng ra lệnh bằng giọng nói để kết nối các ứng dụng dịch vụ, đọc tóm tắt tin nhắn, thêm sự kiện vào lịch, cung cấp chỉ đường theo thời gian thực hoặc hỏi đáp về bất cứ vật thể nào xuất hiện trong tầm mắt thông qua camera tích hợp.

Sự kết hợp đồng bộ giữa thế hệ mô hình Gemini 3.5, các công cụ sáng tạo đa phương thức và hệ điều hành Android XR cho thấy tầm nhìn dài hạn của Google trong việc xây dựng một môi trường công nghệ số thông minh, nơi AI không chỉ là công cụ hỗ trợ mà đã trở thành những cộng sự chủ động đồng hành cùng con người trong mọi trải nghiệm hằng ngày.

Mạnh Quỳnh