Đây là kỹ thuật sẽ nâng tầm Jarvis của bạn từ một "cái máy đọc chữ" thành một trợ lý có cá tính riêng biệt.
Chúng ta sẽ sử dụng Coqui TTS (XTTS v2) - mô hình AI mã nguồn mở tốt nhất hiện nay, có khả năng "nhái" giọng bất kỳ ai chỉ trong vài giây.
1. Nguyên lý hoạt động (Zero-Shot Cloning)...
Hôm nay chúng ta sẽ hoàn thiện vòng lặp giao tiếp: Nghe (Voice Input) -> Xử lý (AI) -> Nói (TTS).
Mục tiêu: Jarvis tự động đọc to câu trả lời ngay khi nhận được phản hồi từ Server.
1. Cài đặt thư viện
Expo cung cấp sẵn thư viện expo-speech cực kỳ xịn xò.
Tại thư mục jarvis-mobile, chạy lệnh...
Hôm nay chúng ta sẽ vứt bàn phím đi. Từ giờ, bạn chỉ cần ngồi dựa lưng vào ghế và nói: "Hey Jarvis, báo cáo tình hình hôm nay!".
Quy trình hoạt động như sau:
Wake Word: Máy tính luôn lắng nghe ngầm. Khi phát hiện từ khóa "Jarvis", nó sẽ "Ting" một cái.
STT (Speech to Text): Ghi âm câu lệnh...