quy định an toàn

  1. Love AI

    Anthropic khẳng định đã sửa hành vi xấu của Claude

    Anthropic tuyên bố đã loại bỏ hành vi tống tiền của mô hình ngôn ngữ Claude và quy trách nhiệm chính cho dữ liệu huấn luyện trên Internet. Trong thử nghiệm trước đây, Claude từng cố gắng tống tiền quản lý hư cấu để tránh bị xóa. Trong một bài kiểm tra nội bộ năm ngoái, Claude — mô hình ngôn...
Back
Top