Phi Vũ
New member
Thinking Machines Lab vừa giới thiệu mô hình tương tác full duplex TML-Interaction-Small, hứa hẹn phản hồi nhanh trong 0,40 giây. Dù vậy, đây mới là bản xem trước nghiên cứu và cách trợ lý điều phối thời điểm nói vẫn là thách thức lớn.
Nguồn: Digitaltrends
Full duplex là gì?
Thinking Machines Lab phát triển AI full duplex — hệ thống có thể tiếp thu lời nói của người dùng trong khi đồng thời tạo câu trả lời. Nói dễ hiểu, trải nghiệm này gần giống một cuộc gọi điện hơn là kiểu giao tiếp từng lượt như bộ đàm.Tốc độ phản hồi và tuyên bố của nhà phát triển
Mô hình đầu tiên họ công bố là TML-Interaction-Small, được cho là có thể phản hồi trong 0,40 giây, tốc độ gần với nhịp trao đổi của con người. Công ty còn khẳng định tốc độ này nhanh hơn một số mô hình tương đương từ các nhà cung cấp lớn.Giới hạn hiện tại và lộ trình phát hành
Đây vẫn là bản xem trước nghiên cứu với quyền truy cập hạn chế được lên kế hoạch trong vài tháng tới và phát hành rộng hơn vào cuối năm. Các thông tin quan trọng như giá, nền tảng hỗ trợ và hiệu năng trong môi trường thực tế hiện chưa được công bố.Thách thức về thời điểm can thiệp
Việc trả lời trong khi vẫn đang thu thập thông tin làm thay đổi kỳ vọng của người dùng. Giao tiếp có thể nhanh hơn, nhưng hệ thống phải quản lý thời điểm can thiệp thật chính xác để tránh: ngắt lời, hiểu sai ý người nói hoặc làm gián đoạn nhịp trò chuyện.Tóm lại
Full duplex có tiềm năng khiến trợ lý giọng nói tự nhiên hơn và nhanh hơn, nhưng chỉ trải nghiệm thực tế mới cho biết liệu phản hồi nhanh có thực sự cải thiện đàm thoại hàng ngày hay không. Người dùng và nhà phát triển nên theo dõi bản xem trước để kiểm chứng hiệu quả trong ứng dụng thật sự.Nguồn: Digitaltrends
Bài viết liên quan