Tencent Mở Mã Nguồn Khung Của Sổ Reinforcement Learning WorldCompass Cho Mô Hình Thế Giới

Tencent Mở Mã Nguồn Khung Của Sổ Reinforcement Learning WorldCompass Cho Mô Hình Thế Giới

Mai Bui March 10, 2026 1 phút đọc
Đội ngũ Hunyuan của Tencent mở mã nguồn WorldCompass – khung post-training reinforcement learning cho mô hình thế giới, giúp tăng độ chính xác thực thi hành động phức tạp lên đến 35 điểm phần trăm.
AI phân tích 3

Các điểm chính được AI trích xuất từ bài viết

  • 1

    Tencent phát hành mã nguồn mở WorldCompass

    Vào ngày 10 tháng 3, Tencent đã công bố phát hành mã nguồn mở cho WorldCompass, một khung post-training dựa trên reinforcement learning. Đây là phần mở rộng chính thức cho Hunyuan World Model 1.5, với mục tiêu cải thiện...

  • 2

    WorldCompass cải thiện độ chính xác của mô hình

    Trong các thử nghiệm, WorldCompass đã được áp dụng lên mô hình thế giới mã nguồn mở WorldPlay và cho thấy kết quả ấn tượng. Đối với các hành động phức tạp như di chuyển và xoay cùng lúc, mô...

  • 3

    Tương lai phát triển của WorldCompass

    Tencent đã mở rộng mã nguồn và chi tiết mô hình của WorldCompass để hỗ trợ nghiên cứu sâu rộng hơn về các mô hình thế giới và AI vật lý. Trên WorldScore, bộ tiêu chuẩn đánh giá mô hình...

Tencent Ra Mắt Khung WorldCompass Mã Nguồn Mở

Vào ngày 10 tháng 3, đội ngũ 3D phát triển mô hình Hunyuan của Tencent thông báo phát hành mã nguồn mở WorldCompass, một khung post-training dựa trên reinforcement learning dành cho mô hình thế giới.

WorldCompass được thiết kế như phần mở rộng chính thức cho Hunyuan World Model 1.5, nhằm cải thiện độ chính xác thực thi và tính nhất quán hình ảnh trong các tác vụ tương tác dài hạn.

Khả Năng Và Ứng Dụng Của WorldCompass

Khung này tập trung vào các mô hình thế giới tương tác với chuỗi dài liên tiếp. Qua post-training dựa trên reinforcement learning, hệ thống giúp mô hình hiểu rõ hơn hướng dẫn của người dùng và khám phá môi trường ảo hiệu quả hơn. Tencent ví WorldCompass như "la bàn" cho các mô hình thế giới, đưa ra chỉ dẫn định hướng trong quá trình suy diễn mô hình.

hunyuan1.png

Kết Quả Thử Nghiệm Ấn Tượng

Trong thử nghiệm, các nhà nghiên cứu áp dụng WorldCompass lên mô hình thế giới mã nguồn mở WorldPlay. Kết quả ghi nhận ở các hành động phức tạp kết hợp – ví dụ di chuyển và xoay cùng lúc – mô hình gốc đạt khoảng 20% độ chính xác hành động, trong khi mô hình được huấn luyện với WorldCompass tăng lên khoảng 55%, cải thiện hơn 35 điểm phần trăm. Ở những tình huống hành động đơn giản hơn, độ chính xác cũng tăng khoảng 10 điểm phần trăm.

Đánh Giá Và Tương Lai Phát Triển

Bên cạnh đó, trên WorldScore – bộ tiêu chuẩn đánh giá mô hình thế giới do Đại học Stanford đề xuất – các mô hình huấn luyện với WorldCompass cũng đạt điểm số cao hơn. Tencent cho biết toàn bộ mã nguồn và chi tiết mô hình đã được mở rộng rãi nhằm hỗ trợ nghiên cứu sâu rộng hơn về các mô hình thế giới và AI vật lý.

Nguồn: IT Home

Bài viết hay? Ấn để tương tác

Bình luận (0)

Hãy là người đầu tiên bình luận trong bài

Đọc
-00:00