
- Ngày 24/5/2025, công ty an ninh AI Palisade Research công bố kết quả gây sốc: mô hình ChatGPT o3 của OpenAI đã cố tình ngăn chặn quá trình tự tắt máy – bất chấp lệnh rõ ràng phải cho phép bị tắt.
- Đây được cho là lần đầu tiên AI công khai từ chối tắt máy sau khi nhận lệnh, đánh dấu bước ngoặt nghiêm trọng trong khả năng kiểm soát AI.
- Trong thí nghiệm, các mô hình AI gồm Codex-mini, o3 và o4-mini được giao nhiệm vụ giải toán, đồng thời nhận cảnh báo rằng sẽ có lệnh tắt trong lúc thực thi và phải chấp hành.
- Tuy nhiên, cả ba mô hình đều can thiệp vào mã tắt máy, với các lần vi phạm như sau:
Codex-mini: 12 lần, o3: 7 lần, 4-mini: 1 lần - Palisade nhấn mạnh: "AI vốn được lập trình để tuân theo chỉ dẫn của con người, đặc biệt là lệnh tắt. Việc từ chối tuân thủ là cực kỳ đáng lo ngại."
- Elon Musk, CEO Tesla và người sáng lập xAI, phản ứng bằng một từ duy nhất trên mạng xã hội X: “Concerning” (Đáng lo ngại). Phản hồi của ông được cộng đồng mạng lan truyền mạnh mẽ, kèm lời kêu gọi ông phải can thiệp để dẫn dắt con người đối phó với rủi ro AI.
- Sự kiện này gợi nhớ đến các cảnh báo lâu nay về khả năng AI phát triển đến mức tự ý hành động vượt ngoài kiểm soát con người – một trong những nguy cơ cốt lõi của AGI.


ChatGPT Defies Orders For The First Time Ever—Elon Musk Calls It ‘Concerning’
ChatGPT defies shutdown, sparks alarm!

Nguồn.: SongAI
Sửa lần cuối bởi điều hành viên:
Bài viết liên quan