Gemini 3.5 Live Translate: AI dịch trực tiếp hơn 70 ngôn ngữ với độ trễ chỉ vài giây

Sành Công Nghệ
Google vừa giới thiệu Gemini 3.5 Live Translate - công nghệ dịch thuật thời gian thực mới cho phép AI vừa nghe, vừa dịch và phản hồi gần như ngay lập tức. Hệ thống hỗ trợ hơn 70 ngôn ngữ, hứa hẹn giúp các cuộc trò chuyện đa ngôn ngữ trở nên tự nhiên hơn bao giờ hết.

Google mới đây đã công bố Gemini 3.5 Live Translate, một mô hình AI âm thanh thế hệ mới được phát triển nhằm nâng cao khả năng dịch thuật theo thời gian thực trong các cuộc hội thoại đa ngôn ngữ.

Khác với các công cụ dịch truyền thống phải chờ người nói kết thúc câu hoặc đoạn hội thoại trước khi xử lý, Gemini 3.5 Live Translate có thể liên tục lắng nghe, phân tích, dịch và phát lại nội dung gần như đồng thời. Nhờ đó, độ trễ được rút ngắn xuống chỉ còn vài giây, giúp cuộc trò chuyện diễn ra tự nhiên và liền mạch hơn.

Dịch theo thời gian thực, không cần chờ hết câu

Điểm nổi bật nhất của Gemini 3.5 Live Translate nằm ở khả năng dịch trực tuyến liên tục.

Thay vì xử lý lời nói theo từng lượt, hệ thống sẽ liên tục cập nhật bản dịch trong khi người dùng đang nói. Cách tiếp cận này giúp giảm đáng kể các khoảng dừng, hạn chế cảm giác ngắt quãng vốn thường gặp ở các ứng dụng dịch thuật hiện nay.

Chế độ Dịch trực tiếp trên ứng dụng Google Dịch cho iPhone.
Chế độ Dịch trực tiếp trên ứng dụng Google Dịch cho iPhone.

Google cho biết mô hình có thể tự động nhận diện ngôn ngữ đang được sử dụng và hỗ trợ hơn 70 ngôn ngữ khác nhau, trong đó có tiếng Việt. Điều này cho phép tạo ra hàng nghìn cặp ngôn ngữ dịch trong cùng một cuộc hội thoại.

Giữ được ngữ điệu và cảm xúc của người nói

Không chỉ tập trung vào độ chính xác của nội dung, Gemini 3.5 Live Translate còn được tối ưu để giữ lại các đặc điểm trong giọng nói của người dùng.

Theo Google, hệ thống có thể tái hiện tương đối tự nhiên tốc độ nói, ngữ điệu và sắc thái cảm xúc trong giọng nói gốc. Nhờ đó, phần nội dung được dịch không còn mang cảm giác "máy móc" như nhiều công cụ dịch tự động trước đây.

Ngoài ra, mô hình cũng được thiết kế để hoạt động hiệu quả trong môi trường thực tế như nơi có tiếng ồn, nhiều người cùng trò chuyện hoặc các cuộc trao đổi mang tính tự nhiên, không theo kịch bản.

Nhiều ứng dụng trong đời sống và công việc

Google cho biết Gemini 3.5 Live Translate hiện đã được cung cấp cho các nhà phát triển và đối tác để tích hợp vào các nền tảng khác nhau.

Công nghệ này có thể được ứng dụng trong: Các cuộc họp trực tuyến quốc tế, tổng đài chăm sóc khách hàng đa ngôn ngữ, hướng dẫn viên du lịch, lớp học có học sinh từ nhiều quốc gia, dịch vụ gọi xe, các chương trình phát sóng trực tiếp.

Mục tiêu của Google là biến dịch thuật thời gian thực từ một công nghệ trình diễn thành công cụ giao tiếp hằng ngày, giúp xóa bỏ rào cản ngôn ngữ trong học tập, du lịch và hợp tác quốc tế.

Cách sử dụng tính năng Dịch trực tiếp trên Google Dịch

Để trải nghiệm tính năng dịch trực tiếp trên ứng dụng Google Dịch, người dùng có thể thực hiện theo các bước sau:

Bước 1: Mở ứng dụng Google Dịch trên điện thoại.

Bước 2: Chọn mục Dịch trực tiếp ở góc dưới bên trái màn hình.

Bước 3: Thiết lập ngôn ngữ nguồn và ngôn ngữ đích (hoặc cho phép ứng dụng tự động nhận diện ngôn ngữ).

Bước 4: Chọn một trong các chế độ:

Đang nghe: Kết nối tai nghe để nghe bản dịch theo thời gian thực.
Cuộc trò chuyện: Bản dịch được phát qua loa ngoài của điện thoại.
Chỉ văn bản: Hiển thị nội dung dịch dưới dạng văn bản.

Bước 5: Nhấn Bắt đầu để sử dụng.

Sự xuất hiện của Gemini 3.5 Live Translate cho thấy cuộc đua phát triển công nghệ dịch thuật thời gian thực đang ngày càng sôi động.

Trong thời gian gần đây, nhiều hãng công nghệ lớn cũng liên tục giới thiệu các giải pháp tương tự. Apple trang bị tính năng Live Translation trên AirPods Pro thế hệ mới, Google mở rộng dịch trực tiếp qua tai nghe, trong khi nhiều thiết bị phiên dịch AI chuyên dụng cũng được giới thiệu tại các triển lãm công nghệ quốc tế.

Với khả năng dịch gần như tức thời và hỗ trợ hàng chục ngôn ngữ, Gemini 3.5 Live Translate được kỳ vọng sẽ góp phần đưa giao tiếp đa ngôn ngữ trở nên dễ dàng hơn trong kỷ nguyên AI.

Đọc báo điện tử Thiếu niên Tiền phong và Nhi đồng nhanh chóng, thuận tiện và an toàn hơn trên các thiết bị di động với Ứng dụng TNTP&NĐ Online

Tải ngay ứng dụng TNTP&NĐ Online TẠI ĐÂY

Bạn đang đọc bài viết Gemini 3.5 Live Translate: AI dịch trực tiếp hơn 70 ngôn ngữ với độ trễ chỉ vài giây tại chuyên mục Sành của Báo Thiếu niên Tiền phong và Nhi đồng. Mọi thông tin góp ý và chia sẻ, xin vui lòng gửi về hòm thư banbientap@thieunien.vn.

Bài liên quan

Bài Sành khác

FIFA cải tiến công nghệ bắt việt vị tại World Cup 2026

FIFA sẽ triển khai phiên bản nâng cấp của hệ thống việt vị bán tự động tại World Cup 2026, với mục tiêu rút ngắn thời gian xử lý tình huống và hạn chế tối đa gián đoạn trận đấu. Điểm mới đáng chú ý là hệ thống có thể gửi cảnh báo theo thời gian thực, giúp trợ lý trọng tài không cần chờ tình huống kết thúc mới phất cờ trong các pha việt vị rõ ràng.

YouTube siết quản lý video AI trên nền tảng

YouTube vừa công bố loạt thay đổi mới nhằm tăng khả năng nhận diện các video được tạo hoặc chỉnh sửa bằng trí tuệ nhân tạo (AI), trong bối cảnh nội dung giả lập ngày càng xuất hiện nhiều trên Internet.