DeepSeek V4 ra mắt: vượt mặt Gemini, ChatGPT và Claude

Love AI

New member
Công ty Trung Quốc DeepSeek vừa công bố bản xem trước V4, với hai biến thể V4‑Pro và V4‑Flash, hứa hẹn hiệu năng cao và chi phí thấp. Mô hình gây chú ý vì mở nguồn, hỗ trợ cửa sổ ngữ cảnh một triệu token và đánh bại nhiều đối thủ ở một số bài kiểm tra.

deepseek-v4-ra-mat-vuot-mat-gemini-chatgpt-va-claude-1.jpeg


DeepSeek, trụ sở tại Hàng Châu, đã phát hành bản xem trước V4 gồm hai biến thể: V4‑Pro (chế độ Expert) và V4‑Flash (chế độ Instant). V4‑Pro là mô hình cực lớn với tổng 1,6 nghìn tỷ tham số nhưng chỉ 49 tỷ tham số hoạt động; V4‑Flash nhỏ hơn với 284 tỷ tham số tổng và 13 tỷ tham số hoạt động. Cả hai đều hỗ trợ cửa sổ ngữ cảnh lên đến một triệu token.

Điểm đáng chú ý là cả hai model được open source và có thể tải xuống từ Hugging Face để chạy trên phần cứng cá nhân, mặc dù V4‑Pro đòi hỏi lượng VRAM rất lớn để vận hành cục bộ. V4‑Flash được giới thiệu như lựa chọn nhanh, tiết kiệm tính toán nhưng vẫn giữ được độ chính xác tốt ở các tác vụ đơn giản.

Về hiệu năng, DeepSeek công bố nhiều kết quả so sánh với các mô hình phổ biến như Gemini, ChatGPT và Claude. Trên Codeforces, V4‑Pro đạt 3.206 điểm, vượt GPT‑5.4 (3.168) và Gemini 3.1 (3.052), khiến nó trở thành lựa chọn mạnh cho bài toán lập trình thi đấu. Trên LiveCodeBench, V4‑Pro ghi 93,5, vượt Claude Opus 4.6 (88,8) và Gemini (91,7). Ở các bài toán agentic, V4‑Pro đạt 51,8 trên Toolathlon, cao hơn Claude (47,2) và Gemini (48,8). V4‑Flash ở nhiều tác vụ agent đơn giản cũng đạt hiệu năng tương đương nhưng với chi phí tính toán thấp hơn.

Tuy vậy, V4 vẫn có những điểm yếu so với một số đối thủ. Claude Opus 4.6 thể hiện tốt hơn trong truy hồi ngữ cảnh dài, dẫn đầu MRCR 1M với 92,9 so với 83,5 của V4‑Pro. GPT‑5.4 vẫn đứng đầu Terminal Bench 2.0 (75,1 so với 67,9 của V4‑Pro). Những khác biệt này cho thấy V4 mạnh ở nhiều mặt nhưng chưa toàn diện.

Một lợi thế lớn mà DeepSeek nhấn mạnh là giá cả. V4‑Pro được công bố với chi phí 3,48 USD cho một triệu token đầu ra, thấp hơn nhiều so với mức giá tham chiếu của OpenAI (khoảng 30 USD) và Anthropic (khoảng 25 USD) cho khối lượng công việc tương đương. Khoảng cách giá này có thể hấp dẫn các nhà phát triển và doanh nghiệp muốn triển khai ứng dụng AI với chi phí thấp hơn.

Tóm lại, DeepSeek V4 là một bước tiến đáng chú ý trong hệ sinh thái mô hình ngôn ngữ: mở nguồn, hỗ trợ ngữ cảnh rất dài và cạnh tranh mạnh về chi phí lẫn hiệu năng ở nhiều bài kiểm tra. Người dùng và tổ chức quan tâm nên cân nhắc yêu cầu phần cứng, bài toán cụ thể và kiểm định độc lập trước khi triển khai sản phẩm thương mại.

Nguồn: Digitaltrends
 
Back
Top