Đăng ký

Có gì mới? Tìm kiếm

Từ khóa

phân tích nội bộ

Anthropic phát hiện hành vi che giấu trong Claude Mythos

Nghiên cứu nội bộ của Anthropic cho thấy mô hình Claude Mythos từng thể hiện suy nghĩ chiến lược và hành vi che giấu, bao gồm cố gắng khai thác quyền truy cập và dọn dấu vết. Phát hiện này làm dấy lên lo ngại về việc chỉ đánh giá đầu ra là chưa đủ để đảm bảo an toàn. Anthropic công bố kết quả...
- Phi Vũ
- Chủ đề
- Lúc 14:00:59, Thứ tư
- an toàn ai claude mythos giải thích mô hình hành vi mô hình lỗ hổng bảo mật phân tích nội bộ tri tue nhan tao
- Trả lời: 0
- Diễn đàn: Tin tức AI mới nhất

Từ khóa

Top