Love AI

New member
Google vừa giới thiệu Gemini Omni tại Google I/O 2026 — một hệ thống AI kết hợp khả năng suy luận với tạo và chỉnh sửa nội dung đa phương tiện. Phiên bản đầu tiên, Gemini Omni Flash, nhắm đến việc biến gần như mọi loại đầu vào thành video hoàn chỉnh.

google-gemini-omni-bien-moi-thu-thanh-video-1.jpeg


Google công bố Gemini Omni tại sự kiện Google I/O 2026 với mục tiêu gom khả năng suy luận của Gemini cùng bộ công cụ tạo và chỉnh sửa nội dung đa phương tiện vào một hệ thống duy nhất.

Phiên bản khởi đầu Gemini Omni Flash tập trung vào video và đặt tham vọng lớn: người dùng có thể tạo nội dung từ hầu như mọi loại đầu vào — văn bản, hình ảnh, âm thanh hoặc video có sẵn. Thay vì thao tác qua phần mềm chỉnh sửa truyền thống, Google muốn biến quá trình đó thành một cuộc “trò chuyện” liên tục để tinh chỉnh video.

Một điểm nhấn là khả năng chỉnh sửa bằng ngôn ngữ tự nhiên trong khi vẫn giữ được tính nhất quán: nhân vật nhận diện được, cảnh giữ liên tục, chuyển động duy trì mạch thay vì bị reset mỗi lần thay đổi yêu cầu. Hệ thống cũng cải thiện hiểu biết về hành vi vật thể trong thế giới thực, xử lý chuyển động, trọng lực và động lực học tốt hơn.

Gemini Omni Flash đang được triển khai qua ứng dụng Gemini, Google Flow, YouTube Shorts và YouTube Create, với kế hoạch mở rộng cho nhà phát triển và khách hàng doanh nghiệp trong tương lai.

Google cho biết các phiên bản tiếp theo sẽ hỗ trợ kết hợp ảnh, prompt, nhạc và tư liệu tham chiếu trong cùng một dự án, mở rộng chức năng vượt ra ngoài chỉ làm video.

Về minh bạch và an toàn, Google tích hợp công nghệ đóng dấu SynthID để nhận diện nội dung do AI tạo và hứa sẽ cung cấp công cụ xác thực hoạt động xuyên suốt Gemini, Chrome và Search. Người dùng ban đầu có thể tạo avatar video dựa trên chính họ, kể cả giọng nói; những tính năng nâng cao liên quan tới sửa đổi giọng nói vẫn đang được đánh giá vì lý do an toàn.

Gemini Omni đẩy Google vào cuộc đua công cụ truyền thông AI ngày càng gay gắt. Thách thức thực sự là làm cho công cụ video do AI hỗ trợ trở nên trực quan đến mức người bình thường muốn dùng — và để niềm tin theo kịp với khả năng ngày càng mạnh của hệ thống.

Nguồn: Techradar
 
Back
Top