Startup Trung Quốc vượt mặt Nvidia, khiến giới công nghệ chấn động
Khi AI dần bước ra khỏi không gian số để hiện diện trong thế giới thực, cuộc đua phát triển “bộ não” hiện thân (embodied intelligence) cho thế hệ robot tiếp theo đang nổi lên như mặt trận công nghệ mới giữa Trung Quốc và Mỹ.
Chỉ 2 ngày sau khi gã khổng lồ chip Mỹ Nvidia ra mắt mô hình Cosmos 3 – được thiết kế để giúp AI vật lý “suy nghĩ trước khi hành động” – một startup Trung Quốc đã nhanh chóng thu hút sự chú ý của giới công nghệ.
Hôm 3/5, công ty Spirit AI (trụ sở tại thành phố Hàng Châu thuộc tỉnh Chiết Giang) cho biết mô hình nền tảng dành cho trí tuệ hiện thân Spirit v1.6 của hãng đã trở thành mô hình đầu tiên của Trung Quốc đứng đầu bảng xếp hạng toàn cầu RoboArena.
Spirit v1.6 đạt 1.924 điểm trên thang đánh giá này, vượt qua Cosmos3-Nano-Policy của Nvidia với 1.881 điểm. Đứng thứ 3 là DreamZero, một dự án khác của Nvidia được công bố hồi tháng 2, với 1.763 điểm.
RoboArena là bộ tiêu chuẩn đánh giá khả năng của AI trong việc điều khiển robot thực hiện các hành động ngoài đời thực. Hệ thống này được phát triển bởi Nvidia cùng các cơ sở nghiên cứu hàng đầu như Đại học Stanford và Đại học California, Berkeley.
Sự cạnh tranh ngày càng quyết liệt cho thấy một xu hướng rộng lớn hơn: robot đang trở thành biên giới phát triển tiếp theo của AI.
Điều này cũng được phản ánh qua các thỏa thuận hợp tác mà Nvidia công bố mới đây với Unitree Robotics của Trung Quốc và Sharpa, doanh nghiệp tiên phong của Singapore trong lĩnh vực bàn tay robot.
Mô hình AI vật lý là gì?
Khác với các mô hình ngôn ngữ lớn (LLM) được xây dựng để xử lý và tạo ra văn bản hoặc mã lập trình, AI vật lý cho phép máy móc – từ robot hình người, cánh tay robot cho đến xe tự hành – có khả năng cảm nhận, hiểu và tương tác với môi trường vật lý xung quanh.
AI vật lý dựa trên hai năng lực cốt lõi. Thứ nhất là năng lực chính sách, tức khả năng đưa ra hành động dựa trên những gì hệ thống quan sát được. Đây cũng là tiêu chí trọng tâm được bảng xếp hạng RoboArena sử dụng để đánh giá.
Thứ hai là năng lực thế giới, thể hiện khả năng mô phỏng và dự đoán điều gì sẽ xảy ra tiếp theo nếu một hành động cụ thể được thực hiện.
Mặc dù 2 chức năng này thường được phát triển tách biệt, ngành công nghiệp AI đang có xu hướng hợp nhất chúng. Tháng 9 năm ngoái, các nhà nghiên cứu Trung Quốc đã giới thiệu mô hình “Policy World Model”, cho phép robot vừa dự đoán những gì sẽ xảy ra trong môi trường xung quanh vừa tự lên kế hoạch hành động.
Không chỉ dẫn đầu ở mảng mô hình chính sách, Trung Quốc còn đang tạo dấu ấn trong lĩnh vực mô hình thế giới. Trên bảng xếp hạng WorldArena – hệ thống đánh giá các mô hình thế giới dành cho trí tuệ hiện thân – vị trí số một hiện thuộc về WorldScape-0.2 do startup Trung Quốc Manifold AI phát triển.
Mô hình này đã vượt qua Cosmos-Predict 2.5 của Nvidia trong hạng mục đánh giá năng lực dự đoán và mô phỏng hành động.








