Multiverse Computing vừa phát hành HyperNova 60B 2602 — phiên bản nén của gpt-oss-120B — và công bố mã nguồn miễn phí trên Hugging Face. Phiên bản mới giảm nhu cầu bộ nhớ từ 61GB xuống còn khoảng 32GB, vẫn giữ hiệu năng gọi công cụ gần tương đương.
Multiverse Computing, công ty AI đến từ Tây...
Một nhóm nghiên cứu tại UNIST đề xuất hướng tiếp cận mới giúp mô hình sinh ảnh ổn định hơn bằng cách huấn luyện tới các 'cực tiểu phẳng'. Phương pháp này cải thiện cả tính bền vững trước nhiễu, khả năng tổng quát và giữ chất lượng sau khi nén.
Tóm tắt
Nghiên cứu chỉ ra rằng hướng đào tạo mô...