Love AI
New member
Google vừa âm thầm phát hành ứng dụng iOS mới tên Google AI Edge Eloquent, cho phép chuyển giọng nói thành văn bản theo thời gian thực và hoàn toàn miễn phí. Ứng dụng ưu tiên chạy ngoại tuyến, tự động loại bỏ từ thừa và trả về văn bản sạch, sẵn sàng sao chép.
Mở app, nhấn ghi âm và nói — một đường sóng hiển thị giọng nói của bạn trong khi bản phiên âm hiển thị trực tiếp trên màn hình. Khi dừng, ứng dụng sẽ xử lý tự động, làm mượt các chỉnh sửa giữa câu và sao chép kết quả thẳng vào clipboard.
- Chế độ đám mây để xử lý nâng cao: khi bật chế độ đám mây, quá trình nhận dạng vẫn khởi đầu trên thiết bị nhưng mô hình Gemini sẽ hỗ trợ dọn dẹp văn bản trên máy chủ.
- Tự động loại bỏ từ thừa và làm mượt chỉnh sửa giữa câu, giúp không cần phải dọn tay sau khi chuyển giọng nói thành văn bản.
- Bốn công cụ chuyển đổi văn bản tích hợp giúp bạn chỉnh sửa, định dạng hoặc tinh chỉnh bản ghi nhanh chóng.
- Tab Lịch sử lưu tất cả bản phiên âm kèm thống kê sử dụng như tổng số từ và tốc độ chữ/phút của bạn.
Chế độ hoàn toàn ngoại tuyến phù hợp với người làm công việc nhạy cảm về riêng tư hoặc không muốn tải dữ liệu giọng nói lên máy chủ từ xa.
Đối với người dùng thông thường hoặc ai đang trả phí cho ứng dụng phiên âm chỉ vì không có lựa chọn miễn phí đáng tin cậy, Google AI Edge Eloquent có thể thay đổi cả cuộc chơi.
Nguồn: Digitaltrends
Giới thiệu nhanh
Google AI Edge Eloquent là một công cụ ghi âm và phiên âm ưu tiên chạy ngoại tuyến, vừa xuất hiện trên App Store mà không có thông báo lớn. Ứng dụng ghi âm trực tiếp, chuyển lời nói thành chữ theo thời gian thực, tự động loại bỏ các từ thừa như "um" và "ah" để cho ra văn bản sạch, dễ đọc.Mở app, nhấn ghi âm và nói — một đường sóng hiển thị giọng nói của bạn trong khi bản phiên âm hiển thị trực tiếp trên màn hình. Khi dừng, ứng dụng sẽ xử lý tự động, làm mượt các chỉnh sửa giữa câu và sao chép kết quả thẳng vào clipboard.
Tính năng nổi bật
- Chạy ưu tiên ngoại tuyến: chế độ hoàn toàn ngoại tuyến giữ mọi dữ liệu âm thanh trên thiết bị và sử dụng mô hình nhận dạng giọng nói dựa trên Gemma.- Chế độ đám mây để xử lý nâng cao: khi bật chế độ đám mây, quá trình nhận dạng vẫn khởi đầu trên thiết bị nhưng mô hình Gemini sẽ hỗ trợ dọn dẹp văn bản trên máy chủ.
- Tự động loại bỏ từ thừa và làm mượt chỉnh sửa giữa câu, giúp không cần phải dọn tay sau khi chuyển giọng nói thành văn bản.
- Bốn công cụ chuyển đổi văn bản tích hợp giúp bạn chỉnh sửa, định dạng hoặc tinh chỉnh bản ghi nhanh chóng.
- Tab Lịch sử lưu tất cả bản phiên âm kèm thống kê sử dụng như tổng số từ và tốc độ chữ/phút của bạn.
Tùy chỉnh và bảo mật
Ứng dụng có từ điển từ vựng cá nhân để thêm tên riêng, thuật ngữ kỹ thuật và biệt ngữ nhằm cải thiện độ chính xác. Bạn cũng có thể đăng nhập bằng tài khoản Google để ứng dụng tự động kéo các từ thường dùng từ Gmail gần đây.Chế độ hoàn toàn ngoại tuyến phù hợp với người làm công việc nhạy cảm về riêng tư hoặc không muốn tải dữ liệu giọng nói lên máy chủ từ xa.
So sánh với đối thủ
Các đối thủ như Wispr Flow và Willow đang thu phí khoảng 15 USD/tháng và xử lý âm thanh trên đám mây, trong khi SuperWhisper chạy hoàn toàn cục bộ nhưng có giá ~85 USD/năm. Eloquent của Google đánh bại cả ba về giá và cung cấp đúng nhu cầu chính của người dùng là bản văn bản sạch, tự động.Hạn chế hiện tại
Nhược điểm lớn nhất là Eloquent hiện chỉ có trên iOS. Mục mô tả trên App Store có nhắc đến phiên bản Android, nhưng ứng dụng chưa xuất hiện trên Play Store.Đối với người dùng thông thường hoặc ai đang trả phí cho ứng dụng phiên âm chỉ vì không có lựa chọn miễn phí đáng tin cậy, Google AI Edge Eloquent có thể thay đổi cả cuộc chơi.
Nguồn: Digitaltrends
Bài viết liên quan