Trong buổi giới thiệu tại California, CEO Sundar Pichai mô tả bước tiến mới của AI là “khó tin”, khi chỉ trong hai năm, công nghệ này đã vượt khỏi việc xử lý văn bản và hình ảnh để tiến tới khả năng nắm bắt tình huống theo thời gian thực. Gemini 3 được xem là bản tổng hợp toàn bộ năng lực của dòng Gemini kể từ thế hệ đầu tiên, nhưng với mức thông minh và độ chính xác cao hơn.

Theo Google, Gemini 3 được xây dựng để hiểu những ý niệm phức tạp: từ việc nhận ra chi tiết nhỏ trong câu chuyện sáng tạo, diễn giải các lớp ý nghĩa chồng chéo, cho tới rút gọn yêu cầu của người dùng mà vẫn trả lời trúng trọng tâm.
Demis Hassabis – lãnh đạo Google DeepMind cho biết phiên bản Gemini 3 Pro đạt điểm số 1501 trên bảng LMArena, thuộc nhóm mô hình có năng lực lập luận ngang trình độ tiến sĩ. Trong các phép thử nội bộ, Gemini 3 Pro vượt Gemini 2.5 Pro ở mọi hạng mục, trong đó nổi bật nhất là khả năng suy luận và phân tích hình ảnh không gian.
Một điểm được Google nhấn mạnh là mô hình mới bớt “nịnh hót” hơn. Các câu trả lời được tinh chỉnh để trực diện, giàu thông tin thay vì vòng vo hay tâng bốc quá mức điều mà hãng xem là lợi thế cạnh tranh so với GPT-5.1.
Gemini 3 còn hỗ trợ cửa sổ ngữ cảnh tới một triệu token, cho phép đọc hiểu tài liệu nghiên cứu dài, video bài giảng hoặc nhiều giờ nội dung học thuật liên tục. Trong các demo, mô hình có thể dịch và số hóa công thức nấu ăn viết tay thành sổ tay chia sẻ, phân tích video pickleball để gợi ý chi tiết kỹ thuật cần cải thiện, hoặc biến khóa học phức tạp thành thẻ học tương tác.
Bên cạnh Gemini 3, Google ra mắt nền tảng phát triển tác nhân AI Antigravity, đồng thời tích hợp mô hình mới vào Search, AI Mode và các dịch vụ của hãng ngay sau lễ công bố điều chưa từng xảy ra với các thế hệ Gemini trước đó.
Pichai cho biết Gemini hiện là một trong những dự án trọng điểm lớn nhất lịch sử Google. Ứng dụng Gemini đã đạt 650 triệu người dùng mỗi tháng, 70% khách hàng Google Cloud đang triển khai AI, và hơn 13 triệu lập trình viên xây dựng sản phẩm dựa trên mô hình tạo sinh của hãng.
Gemini 3, theo Google, sẽ là nền tảng mở đầu cho thế hệ AI có thể “quan sát, suy diễn, phản hồi” gần với cách con người xử lý tình huống hơn bao giờ hết.










