Việc phát hành Qwen 2.5-Max vào đúng mùng 1 Tết Nguyên đán được đánh giá là động thái bất thường, khi đây là thời gian hầu hết người Trung Quốc nghỉ lễ. Theo Reuters, điều này phản ánh áp lực từ sự nổi tiếng bất ngờ của DeepSeek không chỉ đối với các công ty công nghệ phương Tây mà còn với cả đối thủ nội địa.
"Qwen 2.5-Max vượt trội hơn ... hầu hết các mô hình khác như GPT-4o, DeepSeek-V3 và Llama-3.1-405B", bộ phận điện toán đám mây của Alibaba tuyên bố, nhắc đến những mô hình AI nguồn mở tiên tiến nhất hiện nay của OpenAI, Meta và DeepSeek.
Alibaba khẳng định Qwen 2.5-Max có hiệu suất vượt trội trong nhiều tiêu chí, bao gồm Arena-Hard, LiveBench, LiveCodeBench và GPQA-Diamond. Ngoài ra, mô hình cũng thể hiện khả năng xử lý mạnh mẽ trên các bài đánh giá MMLU-Pro.
Công ty cho biết Qwen 2.5 hiện được tích hợp vào Qwen Chat, cho phép người dùng trò chuyện trực tiếp hoặc tương tác với vật thể và tìm kiếm thông tin thông minh hơn.
DeepSeek chưa đưa ra phản hồi trước những so sánh từ Alibaba.
Việc DeepSeek phát hành mô hình AI ngày 10/1 và tiếp tục ra mắt phiên bản R1 ngày 20/1 đã tạo chấn động trong giới công nghệ. Nhiều cổ phiếu công nghệ lớn sụt giảm khi AI Trung Quốc chứng minh chi phí thấp và thời gian phát triển ngắn hơn đáng kể, đặt dấu hỏi về các kế hoạch đầu tư lớn của các công ty Mỹ.
Không chỉ gây lo ngại cho các hãng công nghệ phương Tây, DeepSeek còn thúc đẩy cuộc đua trong nước. Hai ngày sau khi DeepSeek-R1 ra mắt, ByteDance – công ty mẹ của TikTok – đã cập nhật mô hình AI Doubao-1.5-pro, khẳng định vượt OpenAI o1 trong bài kiểm tra AIME – một tiêu chuẩn đánh giá khả năng hiểu và phản hồi của AI với các hướng dẫn phức tạp. Ngoài ByteDance, nhiều công ty Trung Quốc như Moonshot AI, Minimax và iFlyTek cũng đã công bố mô hình AI mới ngay trong tháng 1.