Đăng ký

Có gì mới? Tìm kiếm

Từ khóa

đánh giá benchmark

Mô hình LLM hiện nay gây lỗi khi chỉnh tài liệu

Nghiên cứu từ các nhà khoa học Microsoft cảnh báo: nhiều mô hình AI hiện tại không đáng tin cậy khi thực hiện các tác vụ chỉnh sửa tài liệu dài hơi. Họ dựng bộ benchmark DELEGATE-52 và phát hiện lỗi nhỏ nhưng nghiêm trọng có thể tích tụ theo thời gian. Microsoft và đồng nghiệp đã công bố một...
- Phi Vũ
- Chủ đề
- 12/05/2026
- hiệu năng ai lỗi tích tụ mô hình ngôn ngữ tác vụ dài hạn tài liệu công việc tri tue nhan tao đánh giá benchmark
- Trả lời: 0
- Diễn đàn: Tin tức AI mới nhất

Từ khóa

Top