StepFun Ra Mắt Step 3.5 Flash - Mô Hình Nền Tảng Mã Nguồn Mở Dành Cho AI Agent
AI phân tích 4
Các điểm chính được AI trích xuất từ bài viết
-
1
StepFun giới thiệu Step 3.5 Flash cho AI agent
Công ty AI Trung Quốc StepFun đã ra mắt Step 3.5 Flash, một mô hình nền tảng mã nguồn mở mới nhất, được thiết kế đặc biệt cho các AI agent. Mô hình này nổi bật với khả năng suy...
-
2
Kiến trúc đổi mới của Step 3.5 Flash
Step 3.5 Flash áp dụng các đổi mới kiến trúc để cân bằng giữa hiệu quả và chi phí. Sử dụng Sparse Mixture-of-Experts, mỗi token chỉ kích hoạt khoảng 11 tỷ tham số trong tổng số 196 tỷ, giúp giảm...
-
3
Tính năng nổi bật của Step 3.5 Flash
Step 3.5 Flash của StepFun mang đến nhiều cải tiến đáng chú ý. Nó có khả năng suy luận với tốc độ lên tới 350 token mỗi giây, hiệu năng mạnh mẽ trong các kịch bản agent và suy luận...
-
4
Tầm nhìn và bước tiến tiếp theo của StepFun
StepFun đã phát hành hoàn chỉnh Step 3.5 Flash và đang tiến hành đào tạo mô hình Step 4. Công ty mời gọi các nhà phát triển và nhà nghiên cứu tham gia vào quá trình phát triển mở và...
StepFun chính thức ra mắt Step 3.5 Flash – Mô hình nền tảng thế hệ mới cho AI agent
Ngày 2 tháng 2, công ty AI Trung Quốc StepFun đã ra mắt công khai Step 3.5 Flash, mô hình nền tảng mở mới nhất và mạnh mẽ nhất của họ, được định vị là “sinh ra dành cho agent.” Theo công ty, mô hình cung cấp khả năng suy luận mạnh mẽ, độ ổn định cao cùng hiệu suất được tối ưu riêng cho các quy trình làm việc dựa trên agent.

Những điểm nổi bật chính của Step 3.5 Flash:
- Tốc độ nhanh hơn: đạt tốc độ suy luận lên tới 350 token mỗi giây cho các tác vụ lập trình yêu cầu một lần đầu vào.
- Hiệu năng mạnh mẽ: hoạt động trong các kịch bản agent và suy luận toán học tương đương các mô hình đóng nguồn hàng đầu.
- Độ ổn định cao hơn: xử lý các nhiệm vụ phức tạp, dài hạn, đa bước một cách hiệu quả.

Innovations kiến trúc giúp cân bằng hiệu quả và chi phí
Theo StepFun, thế hệ mô hình nền tảng tiếp theo không chỉ cần “thông minh” hơn mà còn phải đáng tin cậy, phản hồi nhanh và tối ưu chi phí. Để đạt được sự cân bằng này, Step 3.5 Flash áp dụng các đổi mới kiến trúc sau:
- Sparse Mixture-of-Experts (MoE): mỗi token chỉ kích hoạt khoảng 11 tỷ tham số trong tổng số 196 tỷ, giảm đáng kể chi phí tính toán.
- MTP-3 (Dự đoán đa token): mô hình dự đoán đồng thời 3 token trong mỗi bước, tăng gần gấp đôi hiệu suất suy luận.
- Hybrid Attention Architecture (SWA + Full Attention): tỉ lệ 3:1 giữa cửa sổ trượt và chú ý toàn phần cho phép mô hình tập trung vào những đoạn trọng yếu trong văn bản dài, xử lý ngữ cảnh đến 256K token với chi phí tính toán thấp.
Bước tiến tiếp theo và tầm nhìn của StepFun
Step 3.5 Flash hiện đã được phát hành hoàn chỉnh. StepFun cũng tiết lộ việc đào tạo mô hình Step 4 đã bắt đầu và mời gọi các nhà phát triển, nhà nghiên cứu cùng tham gia vào quá trình phát triển mở và đồng sáng tạo hệ sinh thái.
Với trọng tâm về trí tuệ agent, khả năng suy luận với ngữ cảnh dài và hiệu quả suy luận, Step 3.5 Flash thể hiện tham vọng của StepFun trong việc xây dựng nền tảng mã nguồn mở cạnh tranh cho hệ thống AI agent thế hệ tiếp theo.
Nguồn: IT Home
Bài viết hay? Ấn để tương tác
Bình luận (0)
Hãy là người đầu tiên bình luận trong bài
Đăng nhập Đăng nhập để bình luận trong bài viết này