Cộng đồng Việt Nam Nói Gì StepFun

StepFun Ra Mắt Step 3.5 Flash - Mô Hình Nền Tảng Mã Nguồn Mở Dành Cho AI Agent

Tuấn Lý February 02, 2026 2 phút đọc

StepFun công bố Step 3.5 Flash, mô hình nền tảng mã nguồn mở ưu tiên AI agent, đạt tốc độ suy luận lên đến 350 TPS, hỗ trợ ngữ cảnh 256K và hiệu suất tiệm cận các mô hình độc quyền hàng đầu.

Mã nguồn mở AI Agent Hiệu năng Step 3.5 Flash Tốc độ suy luận Độ ổn định Sparse Mixture-of-Experts MTP-3 Hybrid Attention Architecture Step 4

AI phân tích 4

Các điểm chính được AI trích xuất từ bài viết

1
StepFun giới thiệu Step 3.5 Flash cho AI agent

Công ty AI Trung Quốc StepFun đã ra mắt Step 3.5 Flash, một mô hình nền tảng mã nguồn mở mới nhất, được thiết kế đặc biệt cho các AI agent. Mô hình này nổi bật với khả năng suy...
2
Kiến trúc đổi mới của Step 3.5 Flash

Step 3.5 Flash áp dụng các đổi mới kiến trúc để cân bằng giữa hiệu quả và chi phí. Sử dụng Sparse Mixture-of-Experts, mỗi token chỉ kích hoạt khoảng 11 tỷ tham số trong tổng số 196 tỷ, giúp giảm...
3
Tính năng nổi bật của Step 3.5 Flash

Step 3.5 Flash của StepFun mang đến nhiều cải tiến đáng chú ý. Nó có khả năng suy luận với tốc độ lên tới 350 token mỗi giây, hiệu năng mạnh mẽ trong các kịch bản agent và suy luận...
4
Tầm nhìn và bước tiến tiếp theo của StepFun

StepFun đã phát hành hoàn chỉnh Step 3.5 Flash và đang tiến hành đào tạo mô hình Step 4. Công ty mời gọi các nhà phát triển và nhà nghiên cứu tham gia vào quá trình phát triển mở và...

StepFun chính thức ra mắt Step 3.5 Flash – Mô hình nền tảng thế hệ mới cho AI agent

Ngày 2 tháng 2, công ty AI Trung Quốc StepFun đã ra mắt công khai Step 3.5 Flash, mô hình nền tảng mở mới nhất và mạnh mẽ nhất của họ, được định vị là “sinh ra dành cho agent.” Theo công ty, mô hình cung cấp khả năng suy luận mạnh mẽ, độ ổn định cao cùng hiệu suất được tối ưu riêng cho các quy trình làm việc dựa trên agent.

Những điểm nổi bật chính của Step 3.5 Flash:

Tốc độ nhanh hơn: đạt tốc độ suy luận lên tới 350 token mỗi giây cho các tác vụ lập trình yêu cầu một lần đầu vào.
Hiệu năng mạnh mẽ: hoạt động trong các kịch bản agent và suy luận toán học tương đương các mô hình đóng nguồn hàng đầu.
Độ ổn định cao hơn: xử lý các nhiệm vụ phức tạp, dài hạn, đa bước một cách hiệu quả.

Innovations kiến trúc giúp cân bằng hiệu quả và chi phí

Theo StepFun, thế hệ mô hình nền tảng tiếp theo không chỉ cần “thông minh” hơn mà còn phải đáng tin cậy, phản hồi nhanh và tối ưu chi phí. Để đạt được sự cân bằng này, Step 3.5 Flash áp dụng các đổi mới kiến trúc sau:

Sparse Mixture-of-Experts (MoE): mỗi token chỉ kích hoạt khoảng 11 tỷ tham số trong tổng số 196 tỷ, giảm đáng kể chi phí tính toán.
MTP-3 (Dự đoán đa token): mô hình dự đoán đồng thời 3 token trong mỗi bước, tăng gần gấp đôi hiệu suất suy luận.
Hybrid Attention Architecture (SWA + Full Attention): tỉ lệ 3:1 giữa cửa sổ trượt và chú ý toàn phần cho phép mô hình tập trung vào những đoạn trọng yếu trong văn bản dài, xử lý ngữ cảnh đến 256K token với chi phí tính toán thấp.

Bước tiến tiếp theo và tầm nhìn của StepFun

Step 3.5 Flash hiện đã được phát hành hoàn chỉnh. StepFun cũng tiết lộ việc đào tạo mô hình Step 4 đã bắt đầu và mời gọi các nhà phát triển, nhà nghiên cứu cùng tham gia vào quá trình phát triển mở và đồng sáng tạo hệ sinh thái.

Với trọng tâm về trí tuệ agent, khả năng suy luận với ngữ cảnh dài và hiệu quả suy luận, Step 3.5 Flash thể hiện tham vọng của StepFun trong việc xây dựng nền tảng mã nguồn mở cạnh tranh cho hệ thống AI agent thế hệ tiếp theo.

Nguồn: IT Home

Tuấn LýBiên tập viên Xu hướng

Data analyst chuyển sang viết về công nghệ, với khả năng đọc dữ liệu thị trường và phát hiện xu hướng sớm. Tuấn phụ trách theo dõi và phân tích các xu hướng AI tại Transform.vn, từ AI Agents đến Ge...

Bài viết hay? Ấn để tương tác