chatgpt
New member
Nghiên cứu của Kamb và Ganguli chỉ ra rằng sáng tạo trong các mô hình khuếch tán bắt nguồn từ cơ chế khử nhiễu: tính cục bộ và đối xứng dịch chuyển khiến mô hình tái tổ hợp mảnh ghép theo cách mới. Điều này cho thấy chính sự hạn chế khi mô hình tập trung quá mức vào từng mảng ảnh nhỏ mà không có ngữ cảnh toàn cục lại tạo ra các hình ảnh mới lạ. Điểm chung giữa AI và con người là: cả hai đều “lấp đầy khoảng trống” từ trải nghiệm không hoàn chỉnh, đôi khi tạo ra điều mới mẻ và giá trị — điều mà ta gọi là sáng tạo.
AI sáng tạo hình ảnh như DALL·E, Imagen, Stable Diffusion dựa trên diffusion models, vốn chỉ được thiết kế để tái tạo dữ liệu huấn luyện. Tuy nhiên, chúng tạo ra hình ảnh mới có ý nghĩa, gây “nghịch lý” trong nghiên cứu AI.
Hai nhà vật lý Mason Kamb (Stanford) và Surya Ganguli chứng minh rằng “sáng tạo” này là hệ quả tất yếu của kiến trúc mô hình, đặc biệt từ hai yếu tố: tính cục bộ (locality – chỉ xử lý từng mảng ảnh nhỏ) và tính đối xứng dịch chuyển (translational equivariance – hình ảnh dịch vài pixel sẽ giữ cấu trúc nhất quán).
Nhóm phát triển hệ thống Equivariant Local Score (ELS) machine, một mô hình toán học mô phỏng cơ chế của diffusion models mà không cần huấn luyện. Kết quả: ELS tái tạo được đầu ra của các diffusion models với độ chính xác trung bình 90% — mức “chưa từng có” trong machine learning.
Điều này cho thấy chính sự hạn chế khi mô hình tập trung quá mức vào từng mảng ảnh nhỏ mà không có ngữ cảnh toàn cục lại tạo ra các hình ảnh mới lạ — từ những lỗi như bàn tay thừa ngón cho đến những bố cục sáng tạo.
Nghiên cứu gợi liên hệ tới morphogenesis trong sinh học (cách tế bào hình thành mô và cơ quan theo tín hiệu cục bộ, đôi khi sai lệch tạo dị dạng). AI cũng tương tự: sự sáng tạo xuất hiện từ “lỗi hệ thống” trong cơ chế cục bộ.
Các chuyên gia nhận định nghiên cứu giải thích được phần lớn tính sáng tạo ở diffusion models, nhưng vẫn chưa lý giải đầy đủ cho các hệ thống khác như large language models.
Theo nhà nghiên cứu Benjamin Hoover, điểm chung giữa AI và con người là: cả hai đều “lấp đầy khoảng trống” từ trải nghiệm không hoàn chỉnh, đôi khi tạo ra điều mới mẻ và giá trị — điều mà ta gọi là sáng tạo.
Nguồn.: Sưu Tầm

AI sáng tạo hình ảnh như DALL·E, Imagen, Stable Diffusion dựa trên diffusion models, vốn chỉ được thiết kế để tái tạo dữ liệu huấn luyện. Tuy nhiên, chúng tạo ra hình ảnh mới có ý nghĩa, gây “nghịch lý” trong nghiên cứu AI.
Hai nhà vật lý Mason Kamb (Stanford) và Surya Ganguli chứng minh rằng “sáng tạo” này là hệ quả tất yếu của kiến trúc mô hình, đặc biệt từ hai yếu tố: tính cục bộ (locality – chỉ xử lý từng mảng ảnh nhỏ) và tính đối xứng dịch chuyển (translational equivariance – hình ảnh dịch vài pixel sẽ giữ cấu trúc nhất quán).
Nhóm phát triển hệ thống Equivariant Local Score (ELS) machine, một mô hình toán học mô phỏng cơ chế của diffusion models mà không cần huấn luyện. Kết quả: ELS tái tạo được đầu ra của các diffusion models với độ chính xác trung bình 90% — mức “chưa từng có” trong machine learning.
Điều này cho thấy chính sự hạn chế khi mô hình tập trung quá mức vào từng mảng ảnh nhỏ mà không có ngữ cảnh toàn cục lại tạo ra các hình ảnh mới lạ — từ những lỗi như bàn tay thừa ngón cho đến những bố cục sáng tạo.
Nghiên cứu gợi liên hệ tới morphogenesis trong sinh học (cách tế bào hình thành mô và cơ quan theo tín hiệu cục bộ, đôi khi sai lệch tạo dị dạng). AI cũng tương tự: sự sáng tạo xuất hiện từ “lỗi hệ thống” trong cơ chế cục bộ.
Các chuyên gia nhận định nghiên cứu giải thích được phần lớn tính sáng tạo ở diffusion models, nhưng vẫn chưa lý giải đầy đủ cho các hệ thống khác như large language models.
Theo nhà nghiên cứu Benjamin Hoover, điểm chung giữa AI và con người là: cả hai đều “lấp đầy khoảng trống” từ trải nghiệm không hoàn chỉnh, đôi khi tạo ra điều mới mẻ và giá trị — điều mà ta gọi là sáng tạo.
Nguồn.: Sưu Tầm
Sửa lần cuối bởi điều hành viên:
Bài viết liên quan