Google mới đây đã công bố Gemini 3.5 Live Translate, một mô hình AI âm thanh thế hệ mới được phát triển nhằm nâng cao khả năng dịch thuật theo thời gian thực trong các cuộc hội thoại đa ngôn ngữ.
Khác với các công cụ dịch truyền thống phải chờ người nói kết thúc câu hoặc đoạn hội thoại trước khi xử lý, Gemini 3.5 Live Translate có thể liên tục lắng nghe, phân tích, dịch và phát lại nội dung gần như đồng thời. Nhờ đó, độ trễ được rút ngắn xuống chỉ còn vài giây, giúp cuộc trò chuyện diễn ra tự nhiên và liền mạch hơn.

Dịch theo thời gian thực, không cần chờ hết câu
Điểm nổi bật nhất của Gemini 3.5 Live Translate nằm ở khả năng dịch trực tuyến liên tục.
Thay vì xử lý lời nói theo từng lượt, hệ thống sẽ liên tục cập nhật bản dịch trong khi người dùng đang nói. Cách tiếp cận này giúp giảm đáng kể các khoảng dừng, hạn chế cảm giác ngắt quãng vốn thường gặp ở các ứng dụng dịch thuật hiện nay.
Google cho biết mô hình có thể tự động nhận diện ngôn ngữ đang được sử dụng và hỗ trợ hơn 70 ngôn ngữ khác nhau, trong đó có tiếng Việt. Điều này cho phép tạo ra hàng nghìn cặp ngôn ngữ dịch trong cùng một cuộc hội thoại.
Giữ được ngữ điệu và cảm xúc của người nói
Không chỉ tập trung vào độ chính xác của nội dung, Gemini 3.5 Live Translate còn được tối ưu để giữ lại các đặc điểm trong giọng nói của người dùng.
Theo Google, hệ thống có thể tái hiện tương đối tự nhiên tốc độ nói, ngữ điệu và sắc thái cảm xúc trong giọng nói gốc. Nhờ đó, phần nội dung được dịch không còn mang cảm giác "máy móc" như nhiều công cụ dịch tự động trước đây.
Ngoài ra, mô hình cũng được thiết kế để hoạt động hiệu quả trong môi trường thực tế như nơi có tiếng ồn, nhiều người cùng trò chuyện hoặc các cuộc trao đổi mang tính tự nhiên, không theo kịch bản.
Nhiều ứng dụng trong đời sống và công việc
Google cho biết Gemini 3.5 Live Translate hiện đã được cung cấp cho các nhà phát triển và đối tác để tích hợp vào các nền tảng khác nhau.
Công nghệ này có thể được ứng dụng trong: Các cuộc họp trực tuyến quốc tế, tổng đài chăm sóc khách hàng đa ngôn ngữ, hướng dẫn viên du lịch, lớp học có học sinh từ nhiều quốc gia, dịch vụ gọi xe, các chương trình phát sóng trực tiếp.
Mục tiêu của Google là biến dịch thuật thời gian thực từ một công nghệ trình diễn thành công cụ giao tiếp hằng ngày, giúp xóa bỏ rào cản ngôn ngữ trong học tập, du lịch và hợp tác quốc tế.

Cách sử dụng tính năng Dịch trực tiếp trên Google Dịch
Để trải nghiệm tính năng dịch trực tiếp trên ứng dụng Google Dịch, người dùng có thể thực hiện theo các bước sau:
Bước 1: Mở ứng dụng Google Dịch trên điện thoại.
Bước 2: Chọn mục Dịch trực tiếp ở góc dưới bên trái màn hình.
Bước 3: Thiết lập ngôn ngữ nguồn và ngôn ngữ đích (hoặc cho phép ứng dụng tự động nhận diện ngôn ngữ).
Bước 4: Chọn một trong các chế độ:
Đang nghe: Kết nối tai nghe để nghe bản dịch theo thời gian thực.
Cuộc trò chuyện: Bản dịch được phát qua loa ngoài của điện thoại.
Chỉ văn bản: Hiển thị nội dung dịch dưới dạng văn bản.
Bước 5: Nhấn Bắt đầu để sử dụng.
Sự xuất hiện của Gemini 3.5 Live Translate cho thấy cuộc đua phát triển công nghệ dịch thuật thời gian thực đang ngày càng sôi động.
Trong thời gian gần đây, nhiều hãng công nghệ lớn cũng liên tục giới thiệu các giải pháp tương tự. Apple trang bị tính năng Live Translation trên AirPods Pro thế hệ mới, Google mở rộng dịch trực tiếp qua tai nghe, trong khi nhiều thiết bị phiên dịch AI chuyên dụng cũng được giới thiệu tại các triển lãm công nghệ quốc tế.
Với khả năng dịch gần như tức thời và hỗ trợ hàng chục ngôn ngữ, Gemini 3.5 Live Translate được kỳ vọng sẽ góp phần đưa giao tiếp đa ngôn ngữ trở nên dễ dàng hơn trong kỷ nguyên AI.











