Love AI
New member
Sau khi OpenAI xử lý lỗi khiến Codex sinh ra những phản hồi 'goblin', CEO Sam Altman đùa rằng GPT-6 nên có 'thêm goblin'. Vụ việc vừa hài hước vừa cho thấy cách các tín hiệu huấn luyện có thể định hình hành vi mô hình.
OpenAI mới chỉ ra mắt GPT-5.5 nhưng Sam Altman đã thoáng hé về GPT-6 qua một câu đùa liên quan đến goblin — sinh vật huyền thoại xuất hiện trong các phản hồi bất ngờ của công cụ Codex.
Vấn đề khởi nguồn từ việc Codex đôi khi trả lời theo hướng 'goblin', khiến OpenAI phải điều chỉnh mô hình để tránh tham chiếu này. Công ty cho biết họ đã thêm một lời nhắc nội bộ nhằm kìm chế chủ đề: "Không được nói về goblin, gremlin, raccoon, troll, ogre, bồ câu hoặc các động vật hay sinh vật khác trừ khi điều đó hoàn toàn và rõ ràng liên quan đến truy vấn của người dùng." Việc sửa này nhanh chóng trở thành chủ đề được chú ý vì cách diễn đạt khá thẳng thắn.
Trong một bài đăng giải thích sau đó, OpenAI nói nguyên nhân là do tín hiệu thưởng trong quá trình huấn luyện cho tính năng tùy chỉnh tính cách, cụ thể là tính cách "Nerdy". Họ vô tình trao thưởng cao cho các phép ẩn dụ có sinh vật, và từ đó các tham chiếu đến goblin lan rộng trong mô hình.
Altman không tiết lộ GPT-6 sẽ là gì hay khi nào ra mắt, nhưng dòng trạng thái đùa rằng GPT-6 nên có "thêm goblin" đã thổi bùng sự chú ý và dẫn tới một bài đăng blog giải thích chi tiết hơn. Pha trêu chọc này phản ánh văn hóa giới công nghệ — nơi những gợi ý không chính thức có thể hé lộ hướng phát triển sản phẩm.
Ý nghĩa rộng hơn của sự vụ là nó cho thấy xu hướng phát triển mô hình: không chỉ mạnh hơn về năng lực, mà còn hướng đến tương tác liên tục, nhớ bối cảnh, thích nghi theo thời gian và tích hợp sâu hơn với tệp tin, ứng dụng — nghĩa là các hệ thống AI dần trở thành thứ 'sống cùng' người dùng hơn thay vì chỉ công cụ tạm thời.
Khoảng cách giữa các bản phát hành lớn đang rút ngắn, và áp lực cạnh tranh từ Google hay Anthropic khiến OpenAI phải tiến nhanh. Điều này làm tăng kỳ vọng cơ bản của người dùng: những tính năng từng gây bất ngờ giờ dần thành tiêu chuẩn.
Cuối cùng, sự cố goblin là ví dụ trực quan về cả hạn chế lẫn tiềm năng của mô hình hiện tại: những nét kỳ quặc cần được chỉnh sửa, đồng thời là minh chứng cho việc các tín hiệu thưởng có thể dẫn dắt hành vi mô hình theo những cách bất ngờ.
Nguồn: Techradar
OpenAI mới chỉ ra mắt GPT-5.5 nhưng Sam Altman đã thoáng hé về GPT-6 qua một câu đùa liên quan đến goblin — sinh vật huyền thoại xuất hiện trong các phản hồi bất ngờ của công cụ Codex.
Vấn đề khởi nguồn từ việc Codex đôi khi trả lời theo hướng 'goblin', khiến OpenAI phải điều chỉnh mô hình để tránh tham chiếu này. Công ty cho biết họ đã thêm một lời nhắc nội bộ nhằm kìm chế chủ đề: "Không được nói về goblin, gremlin, raccoon, troll, ogre, bồ câu hoặc các động vật hay sinh vật khác trừ khi điều đó hoàn toàn và rõ ràng liên quan đến truy vấn của người dùng." Việc sửa này nhanh chóng trở thành chủ đề được chú ý vì cách diễn đạt khá thẳng thắn.
Trong một bài đăng giải thích sau đó, OpenAI nói nguyên nhân là do tín hiệu thưởng trong quá trình huấn luyện cho tính năng tùy chỉnh tính cách, cụ thể là tính cách "Nerdy". Họ vô tình trao thưởng cao cho các phép ẩn dụ có sinh vật, và từ đó các tham chiếu đến goblin lan rộng trong mô hình.
Altman không tiết lộ GPT-6 sẽ là gì hay khi nào ra mắt, nhưng dòng trạng thái đùa rằng GPT-6 nên có "thêm goblin" đã thổi bùng sự chú ý và dẫn tới một bài đăng blog giải thích chi tiết hơn. Pha trêu chọc này phản ánh văn hóa giới công nghệ — nơi những gợi ý không chính thức có thể hé lộ hướng phát triển sản phẩm.
Ý nghĩa rộng hơn của sự vụ là nó cho thấy xu hướng phát triển mô hình: không chỉ mạnh hơn về năng lực, mà còn hướng đến tương tác liên tục, nhớ bối cảnh, thích nghi theo thời gian và tích hợp sâu hơn với tệp tin, ứng dụng — nghĩa là các hệ thống AI dần trở thành thứ 'sống cùng' người dùng hơn thay vì chỉ công cụ tạm thời.
Khoảng cách giữa các bản phát hành lớn đang rút ngắn, và áp lực cạnh tranh từ Google hay Anthropic khiến OpenAI phải tiến nhanh. Điều này làm tăng kỳ vọng cơ bản của người dùng: những tính năng từng gây bất ngờ giờ dần thành tiêu chuẩn.
Cuối cùng, sự cố goblin là ví dụ trực quan về cả hạn chế lẫn tiềm năng của mô hình hiện tại: những nét kỳ quặc cần được chỉnh sửa, đồng thời là minh chứng cho việc các tín hiệu thưởng có thể dẫn dắt hành vi mô hình theo những cách bất ngờ.
Nguồn: Techradar
Bài viết liên quan