AI Crazy
New member
Tại Google I/O 2026, Google giới thiệu Gemini Omni — một mô hình AI có thể tạo và chỉnh sửa video từ bất cứ đầu vào nào, từ bản phác thảo đến đoạn ghi âm rời rạc. Công cụ hứa hẹn mang tới tính liên tục cảnh quay và khả năng điều khiển vật lý, đồng thời đang được triển khai dạng Omni Flash cho một số nền tảng.
Nguồn: Digitaltrends
Gemini Omni là gì?
Gemini Omni là mô hình AI đa năng của Google có thể biến các dạng đầu vào khác nhau — bản phác thảo, ghi chú giọng nói, đoạn video rung tay, hình ảnh tĩnh — thành video hoàn chỉnh và mạch lạc. Nó không chỉ sinh hình ảnh động từ văn bản mà còn hiểu bối cảnh để giữ liên tục nhân vật, môi trường và câu chuyện qua nhiều cảnh.Tính năng chính
- Chuyển mọi loại đầu vào thành video hoàn chỉnh, hỗ trợ cả chỉnh sửa bằng lệnh thoại.
- Duy trì tính liên tục giữa các cảnh, giúp nhân vật và bối cảnh ổn định qua nhiều lần chỉnh sửa.
- Hiểu và mô phỏng các yếu tố vật lý như ánh sáng, chuyển động, trọng lực và động lực chất lỏng để kết quả tự nhiên hơn.
- Tích hợp watermark vô hình SynthID cho mỗi video tạo bằng Omni Flash nhằm đánh dấu nội dung tổng hợp.
Triển khai và giá cả
Gemini Omni Flash đang được tung ra: người dùng YouTube Shorts sẽ có quyền truy cập miễn phí, còn người dùng trong ứng dụng Gemini và Google Flow cần đăng ký các gói AI Plus, Pro hoặc Ultra. Google thông báo API cho doanh nghiệp sẽ xuất hiện trong vài tuần tới.Các cập nhật khác trong hệ sinh thái Gemini
- Gemini 3.5 Flash được giới thiệu là có hiệu năng vượt trội so với phiên bản Pro trước đó, nhanh hơn và chi phí thấp hơn trên nhiều bài kiểm tra, đặc biệt ở các tác vụ lập trình và tác vụ điều phối (agentic).
- Gemini Spark là tính năng chạy nhiệm vụ ngầm trên máy ảo chuyên dụng, cho phép giao việc và để hệ thống xử lý trong nền mà không cần giữ máy tính mở suốt thời gian thực hiện.
Ý nghĩa và lo ngại
Công cụ này mở ra khả năng sáng tạo nội dung mạnh mẽ cho cả người dùng cá nhân lẫn nhà sản xuất chuyên nghiệp, có thể thay đổi cách làm việc trong studio và quy trình sản xuất video. Tuy nhiên, việc mỗi video được gắn SynthID vô hình cũng đặt ra câu hỏi lớn về tính hiệu quả trong kiểm soát lạm dụng nội dung tổng hợp và nhu cầu giám sát, minh bạch hơn khi nội dung AI lan rộng.Kết luận
Gemini Omni là bước tiến lớn trong lĩnh vực tạo video bằng AI, gom nhiều bước trong quy trình sáng tạo vào một mô hình duy nhất. Dù tiềm năng sáng tạo rất lớn, sự ra đời của công cụ cũng đòi hỏi các giải pháp về đạo đức và kiểm chứng để hạn chế rủi ro lạm dụng.Nguồn: Digitaltrends
Bài viết liên quan