MiniCPM-o4.5 Mã Nguồn Mở: MiniMax Ra Mắt AI Đa Phương Thức Biết Nhìn, Nghe và Chủ Động Giao Tiếp
AI phân tích 4
Các điểm chính được AI trích xuất từ bài viết
-
1
MiniCPM-o4.5: Bước tiến mới trong AI đa phương thức
MiniCPM-o4.5 là một mô hình AI đa phương thức mã nguồn mở do công ty MiniMax phát triển, cho phép giao tiếp tự nhiên và liên tục trong thời gian thực. Mô hình này kết hợp khả năng nhìn, nghe...
-
2
Kiến trúc đột phá của MiniCPM-o4.5
MiniCPM-o4.5 sử dụng kiến trúc mới với cơ chế streaming song công đa phương thức, cho phép xử lý liên tục dữ liệu video và âm thanh trong thời gian thực. Mô hình thực hiện đánh giá ngữ nghĩa ở...
-
3
Khả năng chủ động tương tác của MiniCPM-o4.5
MiniCPM-o4.5 thể hiện khả năng chủ động giao tiếp mà không cần lệnh kích hoạt từ người dùng. Trong các tình huống thực tế như khi nồi chiên không dầu báo hiệu hoàn thành, mô hình sẽ tự động thông...
-
4
MiniCPM-o4.5 và hướng đi tập trung vào Edge AI
MiniCPM-o4.5 là mô hình AI có 9 tỷ tham số, được thiết kế tối ưu cho các thiết bị biên (edge-native). MiniMax chú trọng phát triển giải pháp AI tại thiết bị biên, kết hợp chặt chẽ phần mềm và...
MiniCPM-o4.5 Mở Mã Nguồn - Bước Tiến Mới Trong AI Đa Phương Thức
Ngày 4 tháng 2 — Công ty AI Trung Quốc MiniMax đã chính thức phát hành mã nguồn mở của mô hình đa phương thức MiniCPM-o4.5. Mô hình này được thiết kế nhằm hỗ trợ giao tiếp tự nhiên, liên tục trong thời gian thực bằng cách kết hợp khả năng nhìn, nghe và nói đồng thời.
Việc ra mắt MiniCPM-o4.5 đánh dấu bước chuyển quan trọng từ mô hình AI truyền thống chỉ trả lời câu hỏi sang tương tác đối thoại chủ động và liên tục, mở ra hướng phát triển mới cho trí tuệ nhân tạo.
Khả Năng Chủ Động Tương Tác Thông Minh Trong Thực Tế
Trong các lần trình diễn trực tiếp, MiniCPM-o4.5 thể hiện khả năng chủ động giao tiếp mà không cần lệnh kích hoạt từ người dùng. Ví dụ:
- Khi nồi chiên không dầu báo hiệu hoàn thành bằng tiếng bíp, mô hình sẽ tự động thông báo nhiệt độ đã được làm nóng xong.
- Tại siêu thị, mô hình liên tục theo dõi kệ hàng thay đổi và phản hồi các truy vấn về giá cả ngay lập tức.
- Trong thang máy, AI nhận biết các tầng đi qua và chủ động thông báo khi đến điểm đến.
Kiến Trúc Mới Đột Phá Với Cơ Chế Streaming Song Công Đa Phương Thức
Đội ngũ MiniMax đã phát triển lại kiến trúc hệ thống, lần đầu tiên đưa vào cơ chế đa phương thức streaming song công, xử lý liên tục dữ liệu video và âm thanh trong thời gian thực. Điều này cho phép mô hình vừa nhận đầu vào, vừa tạo đầu ra song song mà không bị nghẽn.
Mô hình thực hiện việc đánh giá ngữ nghĩa ở tần suất khoảng 1 Hz, tự động quyết định thời điểm phù hợp để tham gia vào cuộc hội thoại thay vì dựa vào phát hiện im lặng. Nhờ vậy, MiniCPM-o4.5 có thể tự nhiên xen ngang hội thoại và phản hồi một cách chủ động, giống như con người.
Mô Hình AI 9 Tỷ Tham Số và Hướng Đi Tập Trung Vào Edge AI
MiniCPM-o4.5 là mô hình có 9 tỷ tham số và được thiết kế tối ưu cho các thiết bị biên (edge-native). MiniMax chú trọng phát triển giải pháp AI tại thiết bị biên kết hợp chặt chẽ phần mềm và phần cứng với sự hợp tác từ các hãng sản xuất chip.
Mô hình này sẽ được tích hợp cùng sản phẩm phần cứng AI đầu tiên của công ty — bảng phát triển “Pinea Pi”, dự kiến ra mắt trong năm nay — mang đến giải pháp plug-and-play giúp tăng tốc phát triển và ứng dụng các thiết bị thông minh tại biên mạng.
Nguồn: QbitAI
Bài viết hay? Ấn để tương tác
Bình luận (0)
Hãy là người đầu tiên bình luận trong bài
Đăng nhập Đăng nhập để bình luận trong bài viết này