AI Crazy
New member
Một nhóm nghiên cứu tại UNIST đề xuất hướng tiếp cận mới giúp mô hình sinh ảnh ổn định hơn bằng cách huấn luyện tới các 'cực tiểu phẳng'. Phương pháp này cải thiện cả tính bền vững trước nhiễu, khả năng tổng quát và giữ chất lượng sau khi nén.
Nguồn: https://techxplore.com/news/2025-11-principles-reliable-trustworthy-ai-artists.html
Tóm tắt
Nghiên cứu chỉ ra rằng hướng đào tạo mô hình sinh ảnh (diffusion models) đến các điểm tối ưu có bề mặt "phẳng" (flat minima) giúp giảm lỗi ngẫu nhiên, tăng khả năng kháng nhiễu và cải thiện tổng quát hóa. Thí nghiệm và phân tích lý thuyết của nhóm chứng minh lợi ích đồng thời về tính ổn định và chất lượng đầu ra.Vấn đề hiện tại
Các mô hình khuếch tán như DALL·E hay Stable Diffusion tạo ra hình ảnh ấn tượng nhưng vẫn có hạn chế: sai sót ngẫu nhiên (ví dụ bàn tay 3 ngón, mặt méo), hiệu năng suy giảm sau khi nén như lượng tử hóa, dễ bị tấn công adversarial, và khó chạy mượt trên thiết bị có tài nguyên hạn chế.Gốc rễ của vấn đề
Nhóm nghiên cứu nhận thấy những hạn chế này bắt nguồn từ khả năng tổng quát hóa kém của mô hình — tức là mô hình dễ bị ảnh hưởng bởi thay đổi nhỏ ở dữ liệu hoặc tham số, dẫn tới sai lệch khi môi trường khác so với điều kiện huấn luyện.Giải pháp: tìm các cực tiểu phẳng
Thay vì chỉ tối ưu sai số, nhóm đề xuất hướng huấn luyện đến những "cực tiểu phẳng" trên bề mặt hàm mất mát — những vùng lõm rộng, phẳng giúp hiệu năng ổn định khi có nhiễu hoặc biến đổi. Trong số các thuật toán tìm cực tiểu phẳng, Sharpness-Aware Minimization (SAM) được đánh giá là hiệu quả nhất trong nghiên cứu này.Kết quả chính
Các mô hình huấn luyện bằng SAM cho thấy: giảm tích lũy lỗi trong các chu kỳ sinh ảnh ngắn, duy trì chất lượng tốt hơn sau khi áp dụng các kỹ thuật nén như lượng tử hóa, và tăng khả năng chống tấn công adversarial lên khoảng 7 lần so với mô hình thông thường. Những kết quả này được hỗ trợ bằng cả phân tích lý thuyết và thí nghiệm đa dạng.Ý nghĩa và triển vọng
Phát hiện mở ra hướng thiết kế nền tảng cho hệ sinh AI đáng tin cậy hơn, áp dụng trong nhiều ngành công nghiệp và kịch bản thực tế. Cách tiếp cận này còn có tiềm năng giúp đào tạo các mô hình quy mô lớn hiệu quả hơn, ngay cả khi dữ liệu hoặc tài nguyên bị giới hạn.Tài liệu tham khảo
Bài báo liên quan: Taehwan Lee et al., "Understanding Flatness in Generative Models: Its Role and Benefits", arXiv (2025). DOI: 10.48550/arxiv.2503.11078Trình bày
Kết quả được giới thiệu tại Hội nghị Quốc tế về Thị giác Máy tính (ICCV 2025) và đăng trên kho lưu trữ arXiv.Nguồn: https://techxplore.com/news/2025-11-principles-reliable-trustworthy-ai-artists.html
Bài viết liên quan