Khoa học

DeepSeek ra mô hình V4

DeepSeek thông báo trên X ngày 24/4 rằng bản V4 sẽ có mặt dưới dạng bản xem trước (Preview), "có ngữ cảnh cực dài một triệu token, dẫn đầu trong cả lĩnh vực AI nguồn đóng và nguồn mở về khả năng tác nhân, kiến thức thế giới và hiệu suất suy luận".

V4 có hai phiên bản gồm V4 Pro và V4 Flash. Theo DeepSeek, V4 Pro cho phép xử lý trực tiếp kho mã nguồn khổng lồ hoặc tài liệu lưu trữ, không cần xây dựng thêm lớp truy xuất tăng cường (RAG) trong thời gian nhiều năm, giảm lỗi truy xuất và đơn giản hóa quy trình kỹ thuật. Phiên bản này sử dụng hệ thống định tuyến chuyên gia 16x16, giúp nâng điểm chuẩn MMLU - bộ đánh giá, kiểm tra kiến thức ở 57 lĩnh vực - lên 88,5%, cao hơn mức 85,5% của V3. DeepSeek áp giá 2,8 USD/triệu token đầu vào và 8,8 USD/triệu token đầu ra, thấp hơn so với các mô hình phương Tây.

"Trong các bảng xếp hạng sức mạnh toàn cầu, DeepSeek-V4-Pro vượt trội so với các mô hình mã nguồn mở khác và chỉ bị mô hình mã nguồn đóng hàng đầu là Gemini-Pro-3.1 của Google vượt qua một chút, nhưng chi phí lại rẻ hơn hẳn", DeepSeek cho biết.

Logo DeepSeek V4 trên một chiếc smartphone. Ảnh: Bảo Lâm

Logo DeepSeek V4 trên một chiếc smartphone. Ảnh: Bảo Lâm

Trong khi đó, bản Flash có tổng tham số 284 tỷ với 13 tỷ tham số hoạt động, là "lựa chọn nhanh chóng, hiệu quả và tiết kiệm", cạnh tranh với các mô hình như GPT-4o-mini của OpenAI hay Claude Haiku của Anthropic. DeepSeek áp mức giá 0,4 USD cho mỗi triệu token đầu vào và 1,2 USD cho mỗi triệu token đầu ra.

Theo EuroNews, sự xuất hiện của V4 hiệu năng cao và giá rẻ có thể khiến các công ty cung cấp AI tương tự phải xem lại bảng giá. Trong đó, cửa sổ ngữ cảnh một triệu token được xem là lời thách thức trực tiếp đối với vị thế dẫn đầu về ngữ cảnh dài của một số sản phẩm như Claude. Trang này cho rằng, rất có thể Anthropic hay OpenAI sẽ phải điều chỉnh tính năng hoặc giá bán để tăng sức hút trước AI từ Trung Quốc.

Đầu năm 2025, công ty khởi nghiệp Trung Quốc DeepSeek ra mắt mô hình R1 "mã nguồn mở 100%, rẻ hơn 96,4% so với OpenAI o1 trong khi vẫn mang lại hiệu suất tương tự", đồng thời miễn phí mô hình V3. Động thái này lập tức gây bão toàn cầu, khiến vốn hóa của Nvidia khi đó sụt gần 600 tỷ USD, còn Meta phải lập "phòng chiến tranh" để giải mã mô hình đang thay đổi cuộc chơi của Trung Quốc.

Dù chưa có nhiều đột phá sau cơn sốt đầu 2025, giới chuyên gia vẫn đánh giá rất cao DeepSeek, đặc biệt ở chi phí đầu vào thấp, phù hợp cho các công ty vừa và nhỏ vốn có nguồn lực cho AI hạn chế.

Theo TechCrunch, DeepSeek ra mắt V4 chỉ diễn ra vài giờ sau khi OpenAI tung ra GPT-5.5, được công ty gọi là "mô hình thông minh nhất và dễ sử dụng nhất". Nhà đồng sáng lập kiêm Chủ tịch OpenAI Greg Brockman tuyên bố GPT-5.5 đang đưa công ty tiến gần hơn một bước đến việc tạo ra "siêu ứng dụng" của OpenAI.

"Mô hình mới là bước tiến thực sự hướng tới loại hình điện toán đang được kỳ vọng", Brockman nói. "Nó có khả năng tư duy nhanh hơn, sắc bén hơn với ít token hơn so với một hệ thống như GPT-5.4. Nghĩa là, sẽ có nhiều công nghệ AI tiên tiến hơn dành cho doanh nghiệp và người tiêu dùng".

Mark Chen, Giám đốc nghiên cứu tại OpenAI, cho biết GPT-5.5 hoạt động tốt hơn các phiên bản trước đó trong việc xử lý công việc trên máy tính, cũng như "cho thấy tiến bộ đáng kể trong quy trình nghiên cứu khoa học và kỹ thuật". Ông nhấn mạnh mô hình mới có thể "thực sự giúp các nhà khoa học chuyên gia đạt được tiến bộ", nhất là ở lĩnh vực tìm thấy thuốc mới.

tổng hợp

Các tin khác

Xiaomi 17 Ultra đọ camera với Galaxy S26 Ultra

Xiaomi 17 Ultra đọ camera với Galaxy S26 Ultra

Đều là smartphone có thông số camera tốt hàng đầu, nhưng Xiaomi 17 Ultra có lợi thế với cảm biến lớn hơn, chất ảnh đặc trưng, trong khi ảnh chụp bởi S26 Ultra trung tính hơn.
Vì sao Internet Việt Nam vào Top 10 thế giới và điều gì đứng phía sau?

Vì sao Internet Việt Nam vào Top 10 thế giới và điều gì đứng phía sau?

Trong những năm gần đây, tốc độ Internet của Việt Nam liên tục được cải thiện và vươn lên nhóm dẫn đầu thế giới. Theo số liệu từ Ookla, tính đến đầu năm 2026, Internet băng rộng cố định của Việt Nam đã chính thức thiết lập vị trí vững chắc trong nhóm 10 quốc gia dẫn đầu toàn cầu.
Vì sao chúng ta thường tỉnh giấc trước khi báo thức reo?

Vì sao chúng ta thường tỉnh giấc trước khi báo thức reo?

Nhiều người từng trải qua cảm giác quen thuộc khi thức dậy trước báo thức vài phút, không cần bất kỳ âm thanh hay tác động bên ngoài nào. Hiện tượng này không phải ngẫu nhiên mà là hoạt động của 'đồng hồ sinh học' bên trong cơ thể.
Công nghệ phát hiện "trị" deepfake

Công nghệ phát hiện "trị" deepfake

Một "ngành công nghiệp nhỏ" gồm các startup chuyên phát hiện deepfake đang hình thành, chuyên phát triển công cụ AI này nhằm chống lại các nội dung giả, tạo bởi AI.