Hôm nay chúng ta sẽ vứt bàn phím đi. Từ giờ, bạn chỉ cần ngồi dựa lưng vào ghế và nói: "Hey Jarvis, báo cáo tình hình hôm nay!".
Quy trình hoạt động như sau:
Wake Word: Máy tính luôn lắng nghe ngầm. Khi phát hiện từ khóa "Jarvis", nó sẽ "Ting" một cái.
STT (Speech to Text): Ghi âm câu lệnh...
Hãy tưởng tượng bạn đang rửa bát và muốn đổi bài hát.
Cách cũ: Lau khô tay -> Đi ra máy tính -> Bấm nút -> Nói "Next song".
Cách mới: Nói vọng ra: "Ê Trợ lý, đổi bài đi".
Để làm được điều này, chúng ta không thể dùng Whisper (mô hình nặng) để nghe liên tục. Chúng ta cần một "người gác cổng"...