Hãy tưởng tượng bạn đang rửa bát và muốn đổi bài hát.
Cách cũ: Lau khô tay -> Đi ra máy tính -> Bấm nút -> Nói "Next song".
Cách mới: Nói vọng ra: "Ê Trợ lý, đổi bài đi".
Để làm được điều này, chúng ta không thể dùng Whisper (mô hình nặng) để nghe liên tục. Chúng ta cần một "người gác cổng"...
Voice Control 2026: Tự chế loa thông minh Jarvis bằng Python, Whisper (STT) và Piper (TTS) chạy Offline
Bạn chán ngấy giọng đọc "chị Google" đều đều? Bạn sợ Alexa nghe lén chuyện gia đình?
Đã đến lúc tự xây dựng một "Jarvis" cho riêng mình.
Mục tiêu của bài viết này:
1. **Nghe (STT):** Dùng...