DeepSeek Thử Nghiệm Mô Hình 1 Triệu Ngữ Cảnh, Ngành Công Nghiệp Mong Đợi Ra Mắt Dịp Tết Âm Lịch
AI phân tích 5
Các điểm chính được AI trích xuất từ bài viết
-
1
DeepSeek thử nghiệm mô hình ngữ cảnh dài 1 triệu token
DeepSeek đã chính thức khởi động thử nghiệm mô hình ngữ cảnh dài mới, hỗ trợ lên tới 1 triệu token trên phiên bản web và ứng dụng. Đây là một bước tiến lớn so với phiên bản API hiện...
-
2
Thành tựu của DeepSeek với mô hình V3.2 và V3.2-Speciale
Năm ngoái, DeepSeek đã ra mắt hai mô hình chính thức: DeepSeek-V3.2 và DeepSeek-V3.2-Speciale. Mô hình V3.2 được cho là có hiệu năng tương đương với GPT-5 trên các chuẩn đánh giá suy luận công khai. Trong khi đó, phiên...
-
3
Nghiên cứu bộ nhớ có điều kiện của DeepSeek
DeepSeek đã công bố một nghiên cứu mới về bộ nhớ có điều kiện, được gọi là 'Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models'. Nghiên cứu này giới thiệu khái niệm bộ nhớ...
-
4
Dự đoán sản phẩm mới của DeepSeek dịp Tết Âm Lịch
Các chuyên gia trong ngành công nghệ dự đoán rằng DeepSeek có thể sẽ ra mắt một sản phẩm mới quan trọng vào dịp Tết Âm Lịch sắp tới. Điều này được kỳ vọng sẽ tái hiện thành công mà...
-
5
Thuật ngữ 'deepseek' trở thành Từ của Năm 2025
Thuật ngữ 'deepseek' đã được NetEase Youdao Dictionary bình chọn là Từ của Năm 2025, với hơn 8,672,940 lượt tìm kiếm hàng năm. Sự gia tăng đột biến về lượng tìm kiếm này bắt nguồn từ những đột phá của...
DeepSeek thử nghiệm mô hình ngữ cảnh dài 1 triệu token
Ngày 13/2, DeepSeek chính thức bắt đầu thử nghiệm mô hình ngữ cảnh dài mới, hỗ trợ lên tới 1 triệu token trên phiên bản web và ứng dụng của mình. Tuy nhiên, dịch vụ API hiện tại vẫn duy trì ở phiên bản V3.2 với ngữ cảnh 128K token.
Dự đoán ra mắt sản phẩm đột phá vào dịp Tết Âm Lịch
Giới quan sát trong ngành công nghệ nhận định DeepSeek có thể sẽ công bố một sản phẩm mới quan trọng trong dịp Tết Âm Lịch sắp tới, nhằm tái hiện thành công vang dội đã đạt được vào năm ngoái.
Nghiên cứu mới về bộ nhớ có điều kiện của DeepSeek
Vào ngày 12/1, DeepSeek công bố một bài nghiên cứu mang tên "Conditional Memory via Scalable Lookup: A New Axis of Sparsity for Large Language Models". Trong đó, nhà nghiên cứu Liang Wenfeng cùng các đồng nghiệp đã giới thiệu khái niệm bộ nhớ có điều kiện, tách biệt việc lưu trữ các mẫu tĩnh và tính toán động thông qua một module Engram.
Phương pháp này, với số lượng tham số và FLOPs tương đương, đã thể hiện hiệu suất vượt trội so với các mô hình MoE cơ bản.
Thành tựu và mô hình chính thức của DeepSeek năm trước
Ngày 1/12 năm ngoái, DeepSeek ra mắt hai mô hình chính thức: DeepSeek-V3.2 và DeepSeek-V3.2-Speciale. V3.2 được cho là đạt hiệu năng tương đương GPT-5 trên các chuẩn đánh giá suy luận công khai.
Trong khi đó, phiên bản V3.2-Speciale đã liên tiếp giành huy chương vàng tại các kỳ thi danh giá IMO 2025, CMO 2025, ICPC World Finals 2025 và IOI 2025.
"deepseek" trở thành Từ của Năm 2025 và tạo cú hích lớn về lượng tìm kiếm
Thuật ngữ "deepseek" được NetEase Youdao Dictionary bình chọn là Từ của Năm 2025 với hơn 8,672,940 lượt tìm kiếm hàng năm. Công ty cho biết lượng quan tâm đến DeepSeek tăng đột biến suốt năm, ban đầu nhờ đột phá "giảm chi phí" về hiệu quả tính toán, sau đó được củng cố bởi mỗi bản cập nhật sản phẩm lớn.
Nguồn: The Paper
Bài viết hay? Ấn để tương tác
Bình luận (0)
Hãy là người đầu tiên bình luận trong bài
Đăng nhập Đăng nhập để bình luận trong bài viết này