Phi Vũ
New member
Nhóm nghiên cứu tại Đại học Binghamton vừa phát triển một hệ thống chó robot tích hợp GPT-4 nhằm giúp người khiếm thị di chuyển trong không gian trong nhà. Con robot không chỉ dẫn đường mà còn mô tả cảnh vật theo thời gian thực, tăng khả năng nhận biết tình huống cho người dùng.
Nhóm nghiên cứu do Shiqi Zhang, phó giáo sư ở School of Computing tại Đại học Binghamton, phát triển một hệ thống chó robot hướng dẫn được trang bị trí tuệ nhân tạo. Điểm khác biệt lớn của dự án là tích hợp các mô hình ngôn ngữ lớn (LLM) như GPT-4 để biến con robot thành thiết bị giao tiếp, trả lời và giải thích cho người dùng thay vì chỉ thực hiện các mệnh lệnh đơn giản.
Hệ thống cho phép người dùng ra lệnh bằng giọng nói và nhận được giải thích trước khi di chuyển, như mô tả các lộ trình khả dĩ và ước tính thời gian. Trong khi di chuyển, robot cung cấp 'mô tả cảnh vật bằng lời nói' (scene verbalization) — phản hồi bằng giọng nói về môi trường và chướng ngại vật phía trước, giúp người dùng hiểu rõ tình huống xung quanh. Ví dụ, robot có thể nói 'đây là một hành lang dài' khi dẫn tới phòng họp.
Theo nhóm nghiên cứu, việc dùng GPT-4 giúp chó robot có khả năng hội thoại mạnh hơn so với chó dẫn đường truyền thống, vốn chỉ phản ứng với một số lệnh cố định. Khả năng giải thích lộ trình và tương tác bằng ngôn ngữ giúp người khiếm thị có thêm lựa chọn và kiểm soát hơn trong quá trình di chuyển.
Để đánh giá hiệu quả, nhóm đã tuyển bảy người tham gia bị mù hợp pháp và để họ điều hướng trong một môi trường văn phòng nhiều phòng. Sau mỗi thử nghiệm, người dùng hoàn thành bảng hỏi đánh giá mức độ hữu ích, tính hiệu quả và độ dễ dàng khi giao tiếp với hệ thống. Kết quả cho thấy người dùng ưa thích cách tiếp cận kết hợp: giải thích lộ trình trước và tường thuật trực tiếp trong khi di chuyển.
Những kết quả ban đầu cho thấy mục tiêu không chỉ là đưa người dùng từ điểm A đến điểm B, mà còn nâng cao nhận thức tình huống và quyền kiểm soát của họ khi di chuyển trong không gian trong nhà. Đây là một ứng dụng tích cực của AI trong hỗ trợ người khuyết tật, dù vẫn cần nhiều thử nghiệm hơn về độ an toàn, độ tin cậy và áp dụng ở môi trường thực tế rộng hơn trong tương lai.
Nguồn: Digitaltrends
Nhóm nghiên cứu do Shiqi Zhang, phó giáo sư ở School of Computing tại Đại học Binghamton, phát triển một hệ thống chó robot hướng dẫn được trang bị trí tuệ nhân tạo. Điểm khác biệt lớn của dự án là tích hợp các mô hình ngôn ngữ lớn (LLM) như GPT-4 để biến con robot thành thiết bị giao tiếp, trả lời và giải thích cho người dùng thay vì chỉ thực hiện các mệnh lệnh đơn giản.
Hệ thống cho phép người dùng ra lệnh bằng giọng nói và nhận được giải thích trước khi di chuyển, như mô tả các lộ trình khả dĩ và ước tính thời gian. Trong khi di chuyển, robot cung cấp 'mô tả cảnh vật bằng lời nói' (scene verbalization) — phản hồi bằng giọng nói về môi trường và chướng ngại vật phía trước, giúp người dùng hiểu rõ tình huống xung quanh. Ví dụ, robot có thể nói 'đây là một hành lang dài' khi dẫn tới phòng họp.
Theo nhóm nghiên cứu, việc dùng GPT-4 giúp chó robot có khả năng hội thoại mạnh hơn so với chó dẫn đường truyền thống, vốn chỉ phản ứng với một số lệnh cố định. Khả năng giải thích lộ trình và tương tác bằng ngôn ngữ giúp người khiếm thị có thêm lựa chọn và kiểm soát hơn trong quá trình di chuyển.
Để đánh giá hiệu quả, nhóm đã tuyển bảy người tham gia bị mù hợp pháp và để họ điều hướng trong một môi trường văn phòng nhiều phòng. Sau mỗi thử nghiệm, người dùng hoàn thành bảng hỏi đánh giá mức độ hữu ích, tính hiệu quả và độ dễ dàng khi giao tiếp với hệ thống. Kết quả cho thấy người dùng ưa thích cách tiếp cận kết hợp: giải thích lộ trình trước và tường thuật trực tiếp trong khi di chuyển.
Những kết quả ban đầu cho thấy mục tiêu không chỉ là đưa người dùng từ điểm A đến điểm B, mà còn nâng cao nhận thức tình huống và quyền kiểm soát của họ khi di chuyển trong không gian trong nhà. Đây là một ứng dụng tích cực của AI trong hỗ trợ người khuyết tật, dù vẫn cần nhiều thử nghiệm hơn về độ an toàn, độ tin cậy và áp dụng ở môi trường thực tế rộng hơn trong tương lai.
Nguồn: Digitaltrends
Bài viết liên quan