Mythos của Claude khiến khai thác AI chỉ trong 20 giờ

Phi Vũ

New member
Anthropic ra mắt Claude Mythos vào ngày 7/4/2026, gây xôn xao cộng đồng an ninh mạng và cả giới hoạch định chính sách. Thử nghiệm cho thấy mô hình có thể tự phát hiện và sinh khai thác lỗ hổng, hoàn thành một cuộc tấn công mạng giả lập trong vòng ~20 giờ.

mythos-cua-claude-khien-khai-thac-ai-chi-trong-20-gio-1.jpeg


Anthropic công bố Claude Mythos vào ngày 7 tháng 4 năm 2026 và phản ứng vượt ra ngoài giới an ninh mạng: thủ tướng tài chính (IMF), thống đốc Ngân hàng Anh và chính phủ Anh đều cảnh báo về mức độ nghiêm trọng của công nghệ này.

Mythos tự động phát hiện hàng nghìn lỗ hổng ở mức nghiêm trọng và cao trên nhiều hệ điều hành và trình duyệt phổ biến, bao gồm cả một lỗi tồn tại 27 năm trên OpenBSD. Mô hình còn sinh ra các khai thác hoạt động mà không cần hướng dẫn trực tiếp từ con người.

Viện An ninh AI của Vương quốc Anh (AISI) thử nghiệm Mythos trên mô phỏng mạng doanh nghiệp gồm 32 bước, từ thu thập thông tin đến chiếm quyền hoàn toàn. Kết quả cho thấy mô phỏng có thể được hoàn tất trong khoảng 20 giờ làm việc của chuyên gia, mặc dù thử nghiệm thực hiện trong môi trường phòng thí nghiệm.

Cần lưu ý các hạn chế: các mô phỏng được tiến hành trong môi trường không có hệ thống phòng thủ chủ động, giám sát an ninh hạn chế và thiếu công cụ phòng vệ. Các bài kiểm tra khai thác Firefox thậm chí được chạy mà không có sandbox tiến trình của trình duyệt, nên kết quả chưa phản ánh khả năng chống chịu của hệ thống thật sự được bảo vệ chặt chẽ.

AISI cấp mỗi lần thử một ngân sách 100 triệu token; trong mười lần chạy, Mythos hoàn thành toàn bộ cuộc tấn công ba lần. Hiệu năng của các mô hình không có dấu hiệu giảm khi tăng ngân sách token — nghĩa là càng đầu tư tính toán nhiều, kẻ tấn công càng có khả năng tìm được lỗ hổng.

Project Glasswing cho phép khoảng 40 nhà cung cấp phần mềm lớn truy cập sớm Mythos để rà soát mã nguồn, hướng tới công bố lỗ hổng có trách nhiệm. Tuy nhiên mỗi bản vá có thể là tín hiệu cho kẻ xấu tìm chỗ quan trọng; AI còn tăng tốc việc so sánh khác biệt giữa mã cũ và mã mới để đảo ngược và tái tạo khai thác.

Mythos phân tích mã nguồn để tìm điểm yếu, và với mã mở, mô hình có thể đọc và hiểu code trong vài phút rồi sinh khai thác. Điều này đặt ra bài toán cho các dự án mã nguồn mở: minh bạch giúp nâng cao chất lượng nhưng cũng biến kho mã công khai thành mục tiêu săn lùng. Báo cáo cho thấy số lượng báo cáo lỗ hổng kernel Linux tăng từ khoảng 2 lên 10 vụ mỗi tuần, tất cả được xác thực là có thật.

Khuyến nghị thực tế từ các cơ quan an ninh: xây dựng một chức năng Vận hành Lỗ hổng liên tục, chạy khám phá do AI hỗ trợ trên toàn bộ hệ phần mềm; theo dõi thời gian sửa lỗi (mean-time-to-remediate) cho các lỗ hổng công khai; và áp dụng các biện pháp bảo vệ cơ bản như phân đoạn mạng, kiểm soát danh tính, lọc egress và xác thực đa yếu tố chống lừa đảo. Đa dạng kiến trúc và lớp phòng thủ giúp tăng chi phí tấn công, và các giải pháp như "protocol breaks" của NCSC có thể buộc kẻ tấn công phải vượt qua nhiều công nghệ khác nhau.

Anthropic đã giới hạn truy cập Mythos qua Project Glasswing cho các đối tác được chọn. Tuy nhiên, nếu các nhà phát triển mô hình khác triển khai khả năng tương tự mà không hạn chế quyền truy cập, thì cộng đồng an ninh cần nhanh chóng tăng cường năng lực phát hiện và phản ứng liên tục.

Nguồn: Techradar
 
Back
Top