AI Crazy

New member
Apple hứa hẹn một Siri thông minh hơn từ WWDC 2024, nhưng đến nay nhiều tính năng vẫn chưa hoàn thiện. Tin đồn mới cho thấy Siri có thể sử dụng nhiều mô hình AI bên ngoài — và Gemini của Google có vẻ là lựa chọn hợp lý nhất.

apple-mo-siri-cho-lua-chon-mo-hinh-ai-1.jpeg


Apple từng trình diễn một Siri hiểu ngữ cảnh cá nhân, đọc tin nhắn, thao tác trong ứng dụng và dần trở thành trợ lý thực thụ tại WWDC 2024.

Hai năm sau, giấc mơ đó vẫn chưa thành hiện thực. Tuy nhiên, điều thay đổi là Siri không còn bị ràng buộc với một "bộ não" AI duy nhất nữa — Apple đang xây dựng Siri linh hoạt, có thể chuyển yêu cầu sang mô hình bên ngoài nào phù hợp nhất.

Hiện tại, mặc định bên ngoài là ChatGPT, nhưng Gemini có nhiều lý do để được xem là lựa chọn hợp lý hơn. Phần lớn nhu cầu người dùng với Siri là hỏi thời tiết, tìm quán ăn gần nhất hoặc tra cứu trên web — nói cách khác là những truy vấn dạng tìm kiếm. Không công ty nào làm tìm kiếm tốt bằng Google, và năng lực ấy được đổ vào Gemini.

Khi hỏi Gemini, bộ mô hình này không chỉ trả lời bằng ngôn ngữ mà còn trích xuất dữ liệu từ chỉ mục web thời gian thực của Google, Google Maps, Google Shopping và nhiều nguồn khác. Dùng nguồn lực đó để tăng khả năng tìm kiếm của Siri sẽ nâng cấp trải nghiệm theo cách mà các LLM khác khó bắt kịp.

Một điểm Apple nhấn mạnh là "trí tuệ cá nhân" — Siri hiển thị thông tin có ngữ cảnh từ các app của bạn, ví dụ như chuyến bay của mẹ hoặc ảnh cụ thể trong thư viện. Trong thực tế, tính năng này trên Siri nhiều lần thất bại, còn Gemini đã triển khai tính năng tương tự, kết nối Gmail, Lịch, Google Photos, Drive để trả lời những câu hỏi mang ngữ cảnh đời sống thật. Nó chưa hoàn hảo nhưng đang hoạt động.

Về xử lý trên thiết bị, Apple nổi bật ở quyền riêng tư với mô hình xử lý cục bộ kết hợp điện toán đám mây cho tác vụ nặng. Gemini Nano của Google đã có mặt trên một số điện thoại, cho phép tóm tắt, trả lời thông minh và xử lý ngữ cảnh ngay cả khi không có mạng. Thay vì xây lại mọi thứ từ đầu, Apple có thể tận dụng các thành phần đã hoạt động để đẩy nhanh tiến độ cho Siri.

Ngoài ra, Gemini không chỉ là mô hình ngôn ngữ thuần túy mà còn là một hệ sinh thái sáng tạo: tạo video, âm nhạc, hình ảnh — những khả năng Apple cần nếu muốn cạnh tranh trong mảng công cụ sáng tạo. Về mặt thương mại, mối quan hệ sâu sắc giữa Apple và Google — bao gồm hợp đồng hàng chục tỷ đô để Google là công cụ tìm kiếm mặc định — khiến việc mở rộng quan hệ này sang Gemini cho Siri trở nên tự nhiên hơn.

Tóm lại, mọi mảnh ghép đều có sẵn: công nghệ tìm kiếm và ngữ cảnh của Google, triển khai Nano trên thiết bị, khả năng sáng tạo sinh ra nội dung và mối quan hệ thương mại khổng lồ. Câu hỏi không còn là Gemini có thể mà là liệu Google và Apple có thể đạt được thỏa thuận đôi bên cùng có lợi hay không. Nếu tin đồn là đúng, có lẽ chúng ta sẽ sớm thấy bước tiến đó.

Nguồn: Digitaltrends
 
Back
Top