Theo Alibaba Cloud, đơn vị điện toán đám mây của Alibaba, Qwen 2.5-Max vượt trội so với GPT-4o (OpenAI), DeepSeek-V3, và Llama-3.1-405B (Meta). Đây là những mô hình AI tiên tiến nhất hiện nay.
DeepSeek đã trở thành cái tên được nhắc đến nhiều nhất trong giới công nghệ khi tung ra DeepSeek-V3 (ngày 10/1) và DeepSeek-R1 (ngày 20/1). Chỉ sau vài ngày, DeepSeek-R1 vươn lên dẫn đầu bảng xếp hạng ứng dụng AI trên Apple App Store Mỹ, vượt qua cả các sản phẩm của OpenAI.
Với chi phí phát triển thấp hơn, sử dụng phần cứng hiệu suất vừa phải, DeepSeek đang thách thức chiến lược chi tiêu hàng tỷ USD của các công ty AI hàng đầu Mỹ như OpenAI, Meta, Anthropic. Nhiều nhà đầu tư lo ngại rằng mô hình AI giá rẻ của DeepSeek có thể làm lung lay sự thống trị của các gã khổng lồ công nghệ Mỹ.
Đáng chú ý, trong các bài kiểm tra từ bên thứ ba, DeepSeek-R1 được đánh giá vượt trội hơn các mô hình AI của OpenAI, Meta và Anthropic. Điều này làm dấy lên lo ngại tại Thung lũng Silicon rằng Trung Quốc có thể đang vượt mặt Mỹ trong cuộc đua AI.
Không chỉ tạo áp lực lên các công ty Mỹ, sự thành công của DeepSeek còn khiến các đối thủ nội địa phải gấp rút nâng cấp mô hình AI. Chỉ hai ngày sau khi DeepSeek-R1 ra mắt, ByteDance (công ty mẹ của TikTok) đã cập nhật mô hình AI hàng đầu của mình và tuyên bố nó vượt OpenAI o1 trong bài kiểm tra AIME – bài đánh giá khả năng hiểu và phản hồi các hướng dẫn phức tạp của AI.
Trước đó, vào tháng 5/2024, DeepSeek-V2 đã châm ngòi cho cuộc chiến giá AI tại Trung Quốc khi được phát hành với giá chỉ 1 nhân dân tệ (0,14 USD) mỗi triệu token. Điều này khiến Alibaba phải cắt giảm giá 97% cho hàng loạt mô hình AI của mình. Các gã khổng lồ khác như Baidu, Tencent cũng nhanh chóng nhập cuộc.
Mặc dù bị cuốn vào cuộc đua AI giá rẻ, Liang Wenfeng, nhà sáng lập bí ẩn của DeepSeek, khẳng định công ty không đặt nặng vấn đề chi phí mà tập trung vào mục tiêu cao hơn – AGI (trí tuệ nhân tạo tổng quát). Liang cho rằng các tập đoàn công nghệ lớn đang bị kìm hãm bởi chi phí cao và cấu trúc tổ chức cồng kềnh, trong khi DeepSeek vận hành tinh gọn, linh hoạt, chủ yếu tuyển dụng sinh viên tốt nghiệp và nghiên cứu sinh tiến sĩ từ các trường đại học hàng đầu Trung Quốc.
"Các mô hình AI lớn đòi hỏi sự đổi mới liên tục, nhưng các tập đoàn công nghệ lớn bị giới hạn bởi bộ máy quản lý cồng kềnh của họ", Liang nhận định.
Sự trỗi dậy nhanh chóng của DeepSeek đã thu hút sự chú ý từ Microsoft và chính quyền Mỹ. Theo Bloomberg, Microsoft đang điều tra liệu DeepSeek có thu thập trái phép dữ liệu từ API của OpenAI hay không. Microsoft, với khoản đầu tư 13 tỷ USD vào OpenAI, cho biết đã phát hiện một nhóm cá nhân nghi ngờ liên quan đến DeepSeek đang thu thập lượng lớn dữ liệu AI thông qua API của OpenAI. Nhà Trắng cũng tuyên bố đang xem xét các mối đe dọa an ninh quốc gia liên quan đến DeepSeek.
Phát biểu trên Fox News, David Sacks (quan chức Nhà Trắng phụ trách AI) cho rằng DeepSeek có thể đã sử dụng kỹ thuật "distillation" – một phương pháp học máy giúp mô hình AI học hỏi từ các mô hình khác. Trước những cáo buộc này, DeepSeek chưa đưa ra phản hồi chính thức.
Phản ứng trước sự trỗi dậy của DeepSeek, cựu Tổng thống Donald Trump tuyên bố: "Việc công ty Trung Quốc phát hành AI DeepSeek là lời cảnh tỉnh cho ngành công nghiệp Mỹ. Chúng ta cần tập trung tối đa vào cạnh tranh để giành chiến thắng". Ông cũng cho rằng nếu Trung Quốc có thể phát triển AI nhanh hơn, rẻ hơn, thì Mỹ cũng sẽ làm được.