AI Crazy
New member
Trước thềm Google I/O, một rò rỉ mới hé lộ tính năng 'Gemini Spark Model' cùng chế độ Agent/Chat nhắm tới tự động hóa các tác vụ hàng ngày trên điện thoại. Những ảnh chụp giao diện cho thấy Google có thể biến Gemini thành một trợ lý chủ động hơn, làm thay nhiều việc lặt vặt số cho người dùng.
Một bài đăng trên X của người dùng Waguri_Kaoruko8 tiết lộ giao diện gọi là "Gemini Spark Model" (đang ở trạng thái beta) cùng một chế độ Agent/Chat mới dành cho các hành động dựa trên công cụ. Tài khoản AI News testing catalog đã chia sẻ lại, nhưng đây vẫn là rò rỉ chưa được Google xác nhận.
Giao diện rò rỉ cho thấy trọng tâm của Gemini Spark là tự động hóa và cá nhân hóa công việc hàng ngày, biến Gemini từ một công cụ hỏi-đáp thụ động thành nền tảng trợ lý chạy ngầm hỗ trợ năng suất.
Rò rỉ cũng gợi ý người dùng có thể tạo "kỹ năng" tùy chỉnh cho Gemini bằng cách đặt tiêu đề, mô tả chức năng và thêm hướng dẫn về cách Gemini nên hành xử — gần như xây dựng các quy trình AI nhỏ mà không cần lập trình. Tuy nhiên, hiện chưa thấy hỗ trợ nhập file SKILL MD trực tiếp; người dùng có thể phải sao chép-dán tạm thời.
Một hạn chế được chú ý là chưa có dấu hiệu điều khiển trình duyệt hay khả năng sử dụng máy tính toàn diện — hai tính năng nhiều người kỳ vọng khi các đại lý AI ngày càng mạnh hơn. Nhìn chung, mọi thứ vẫn ở dạng rò rỉ và có thể thay đổi trước khi Google công bố chính thức tại I/O.
Nếu Google xác nhận các tính năng này trong sự kiện sắp tới, Gemini có thể trở thành một lớp năng suất nền tảng trên điện thoại, giúp tự động hóa nhiều thao tác hàng ngày cho người dùng.
Nguồn: Digitaltrends
Rò rỉ: Gemini Spark Model và chế độ Agent
Một bài đăng trên X của người dùng Waguri_Kaoruko8 tiết lộ giao diện gọi là "Gemini Spark Model" (đang ở trạng thái beta) cùng một chế độ Agent/Chat mới dành cho các hành động dựa trên công cụ. Tài khoản AI News testing catalog đã chia sẻ lại, nhưng đây vẫn là rò rỉ chưa được Google xác nhận.
Giao diện rò rỉ cho thấy trọng tâm của Gemini Spark là tự động hóa và cá nhân hóa công việc hàng ngày, biến Gemini từ một công cụ hỏi-đáp thụ động thành nền tảng trợ lý chạy ngầm hỗ trợ năng suất.
- Tự dọn hộp thư: tóm tắt bản tin, lưu trữ các email lộn xộn và tự động hủy đăng ký các danh sách gửi thư.
- Tổng hợp brief họp: gom thông tin liên quan và tạo tóm tắt nhanh trước các cuộc họp hoặc lịch hẹn quan trọng.
- Bản tin cá nhân hóa: tổng hợp tin tức theo chủ đề bạn quan tâm thay vì gửi hàng loạt tiêu đề ngẫu nhiên.
Rò rỉ cũng gợi ý người dùng có thể tạo "kỹ năng" tùy chỉnh cho Gemini bằng cách đặt tiêu đề, mô tả chức năng và thêm hướng dẫn về cách Gemini nên hành xử — gần như xây dựng các quy trình AI nhỏ mà không cần lập trình. Tuy nhiên, hiện chưa thấy hỗ trợ nhập file SKILL MD trực tiếp; người dùng có thể phải sao chép-dán tạm thời.
Một hạn chế được chú ý là chưa có dấu hiệu điều khiển trình duyệt hay khả năng sử dụng máy tính toàn diện — hai tính năng nhiều người kỳ vọng khi các đại lý AI ngày càng mạnh hơn. Nhìn chung, mọi thứ vẫn ở dạng rò rỉ và có thể thay đổi trước khi Google công bố chính thức tại I/O.
Nếu Google xác nhận các tính năng này trong sự kiện sắp tới, Gemini có thể trở thành một lớp năng suất nền tảng trên điện thoại, giúp tự động hóa nhiều thao tác hàng ngày cho người dùng.
Nguồn: Digitaltrends
Bài viết liên quan