Love AI
New member
Google khẳng định Nano Banana 2 nhanh hơn và suy luận logic tốt hơn khi tạo ảnh. Dưới đây là 5 prompt thực tế cho thấy khả năng của mô hình ở mặt vật lý, bố cục, typographic và định vị địa lý.
Google mô tả Nano Banana 2 là bản nâng cấp mạnh mẽ so với phiên bản gốc: mô hình lập kế hoạch bố cục trước khi dựng hình, hiểu vật lý, và duy trì tính nhất quán chủ thể. Năm prompt sau được dùng để kiểm tra các khả năng khác nhau của mô hình và kết quả đều cho thấy độ chính xác, logic và hiển thị chữ viết cao.
Kết luận: Nano Banana 2 không chỉ là nâng cấp về tốc độ mà còn thể hiện tiến bộ trong suy luận logic, không gian và xử lý chữ viết. Các ví dụ trên cho thấy mô hình có năng lực kế hoạch hóa bố cục trước khi render và duy trì tính nhất quán phức tạp trong nhiều ngữ cảnh khác nhau.
Nguồn: Techradar
Google mô tả Nano Banana 2 là bản nâng cấp mạnh mẽ so với phiên bản gốc: mô hình lập kế hoạch bố cục trước khi dựng hình, hiểu vật lý, và duy trì tính nhất quán chủ thể. Năm prompt sau được dùng để kiểm tra các khả năng khác nhau của mô hình và kết quả đều cho thấy độ chính xác, logic và hiển thị chữ viết cao.
Prompt 1 — Quả cầu thủy tinh với chữ bạc nhỏ bên trong
Một ảnh macro ghi lại quả cầu thủy tinh trong suốt đặt cân bằng trên vòi ấm sứ, bên trong có các chữ cái bạc rất nhỏ ghép thành cụm từ "CLARITY IS KEY". Prompt này kiểm tra logic vật lý, đặc tính vật liệu và khả năng render chữ viết nhỏ bị khúc xạ. Nano Banana 2 đã thể hiện tính chính xác typographic và biến dạng phù hợp theo độ cong của quả cầu, cho thấy khả năng suy luận quang học và chi tiết bề mặt cao.Prompt 2 — Tàu cướp biển steampunk trên biển mây
Một cảnh điện ảnh mô tả tàu steampunk bằng đồng, đồng đỏ và gỗ tối, thủy thủ là các động vật nhân hóa, đang lướt trên biển mây lúc hoàng hôn. Prompt này thách thức mô hình giữ nhiều đối tượng, cấu trúc cơ khí hợp lý và ánh sáng điện ảnh. Kết quả cho thấy Nano Banana 2 duy trì bố cục, chi tiết kỹ thuật hợp lý trên tàu và xử lý phản xạ, bóng đổ trên bề mặt kim loại rất thuyết phục.Prompt 3 — Bố cục đồ họa cho board game "The Spice Route"
Một layout chuyên nghiệp cho board game với bản đồ tinh xảo, chú giải góc dùng font địa phương hoá để ghi "Gold", "Silk", "Saffron" (bằng kiểu chữ Nhật khi yêu cầu). Prompt kiểm tra khả năng địa phương hoá chữ viết, tính rõ ràng và sự nhất quán khi xoay camera. Nano Banana 2 thể hiện khả năng "web grounding" tốt: chọn được kiểu chữ phù hợp, render các nhãn địa phương chính xác và giữ sự logic trong cấu trúc đồ họa.Prompt 4 — Trận nhảy breakdance giữa hiệp sĩ trung cổ và robot graffiti
Một cảnh hành động: các hiệp sĩ mặc áo giáp đầy đủ tranh tài breakdance với dàn robot phong cách những năm 1980 có graffiti, trên đường lát đá trước lâu đài, dưới đèn sân khấu hiện đại. Prompt thử thách việc kết hợp chuyển động mạnh mẽ, kết cấu vật liệu rất khác nhau và sự nhất quán trong không gian. Nano Banana 2 đã lên kế hoạch bố cục, duy trì logic không gian và thể hiện chi tiết kết cấu kim loại, sơn graffiti và chuyển động rất hấp dẫn.Prompt 5 — Phố Seattle mưa tối với Space Needle và bảng hiệu Pike Place
Một ảnh siêu thực hiện thực ghi lại vỉa hè ẩm ướt lúc chạng vạng ở Seattle, Space Needle ở xa, ba nhân vật nhất quán đứng gần biển hiệu Pike Place Market và bảng thực đơn phấn của quán cà phê. Đây là thử thách tổng hợp: độ nhất quán nhân vật, "web grounding" để lấy chi tiết địa danh và render chữ viết nhiều dòng trên bảng thực đơn. Mô hình đã tái hiện bố cục địa lý chính xác, ký tự trên bảng rõ ràng và các nhân vật nhất quán qua nhiều góc nhìn.Kết luận: Nano Banana 2 không chỉ là nâng cấp về tốc độ mà còn thể hiện tiến bộ trong suy luận logic, không gian và xử lý chữ viết. Các ví dụ trên cho thấy mô hình có năng lực kế hoạch hóa bố cục trước khi render và duy trì tính nhất quán phức tạp trong nhiều ngữ cảnh khác nhau.
Nguồn: Techradar
Bài viết liên quan