So sánh GPT-5.1 và GPT-5 trên ChatGPT: tôi không quay lại

Love AI · Lúc 10:01:55, Thứ sáu

OpenAI vừa đưa GPT-5.1 làm mô hình mặc định trên ChatGPT và kết quả thực tế cho thấy đây là một bản nâng cấp hữu ích. Qua một vài bài kiểm tra thực tế, GPT-5.1 tỏ ra tuân lệnh tốt hơn, giao tiếp tự nhiên hơn và rõ ràng hơn so với GPT-5.

OpenAI đã giới thiệu GPT-5.1 làm mô hình mặc định cho ChatGPT, nhưng thay vì tạo ra làn sóng tranh luận như khi GPT-5 ra mắt, đợt nâng cấp lần này được nhiều người đón nhận nhẹ nhàng hơn. Lý do là GPT-5.1 dường như khắc phục nhiều phàn nàn trước đó và tập trung vào cải thiện trải nghiệm thực tế thay vì hứa hẹn bước tiến vĩ đại.

GPT-5.1 không được quảng bá như một “bước nhảy” về AI như GPT-5 trước đây, nhưng nó nâng cấp một số điểm thiết yếu: phản hồi nhanh hơn, tuân thủ hướng dẫn chặt chẽ hơn và cách trình bày ấm áp, thân thiện hơn. Những thay đổi này ngay lập tức cảm nhận được khi dùng thử ngẫu hứng, nên tôi quyết định làm vài bài kiểm tra có hệ thống để so sánh trực tiếp hai phiên bản.

Để kiểm tra khả năng tuân thủ hướng dẫn, tôi tạo một bộ quy tắc ngẫu nhiên khi yêu cầu tóm tắt cốt truyện The Lion King: đúng bốn câu, đủ rõ cho trẻ 7 tuổi nhưng không nói kiểu trẻ con, và không được để câu nào bắt đầu bằng 'Simba' hay 'The'. GPT-5 gần như thực hiện đúng nhưng vẫn có một câu bắt đầu bằng 'The', vi phạm quy tắc.

GPT-5.1 thực hiện hoàn hảo: tuân thủ tất cả quy tắc, đưa tên nhân vật và thêm chi tiết nhưng không dài dòng. Một phiên bản tiếng Việt của tóm tắt GPT-5.1 sẽ như sau: "Ở vùng Pride Lands, một hoàng tử sư tử trẻ đang học hỏi từ cha mình, Mufasa, để trở thành một vị vua dũng cảm và tốt bụng. Sau khi Mufasa bị giết trong một cái bẫy do anh họ ghen tỵ Scar giăng, chú sư tử con bị lừa rằng đó là lỗi của mình và bỏ chạy. Nhờ bạn mới như Timon và Pumbaa, cậu lớn lên, tìm lại can đảm và nhận ra mình không thể trốn tránh quá khứ mãi mãi. Cuối cùng cậu trở về, đối mặt với Scar, cứu gia đình và lên ngôi đúng nghĩa tại Pride Lands."

GPT-5.1 còn được giới thiệu có nhiều tùy chọn tính cách mới, và ngay cả khi không chọn tính cách cụ thể, mô hình cũng phản ánh phong cách giao tiếp ấm áp, nhân bản hơn. Tôi kiểm tra bằng yêu cầu giải thích vì sao người ta bị say tàu xe theo kiểu giao tiếp bình thường, dưới 150 từ và không nói chuyện hạ thấp người đọc.

GPT-5 có trả lời chính xác nhưng hơi học thuật, giải thích nhiều chi tiết y khoa khiến giọng điệu giống sách giáo khoa. GPT-5.1 trả lời mang tính đối thoại hơn: nó nêu rằng say tàu xe xảy ra khi mắt và tai trong (cơ quan thăng bằng) gửi tín hiệu mâu thuẫn về chuyển động, não cố gắng giải thích dữ kiện mâu thuẫn đó và phản ứng bằng buồn nôn — nói ngắn gọn, dễ hiểu và thân thiện.

Một điểm nữa OpenAI nhấn mạnh là GPT-5.1 rõ ràng hơn khi giải thích lý lẽ đằng sau câu trả lời. Tôi thử bài toán logic đơn giản: đi 142 dặm, xe chạy 27 dặm mỗi gallon, giá xăng 3,79 USD/gallon. GPT-5 tính đúng nhưng trình bày quá trang trọng và hơi dài. GPT-5.1 giải nhanh, thực tế hơn: 142 ÷ 27 ≈ 5,26 gallon, nhân với 3,79 USD ≈ 19,93 USD. Nó cũng nhắc rằng trong đời thực ta hay làm tròn cho thuận tiện (ví dụ nói khoảng 5,2 gallon và khoảng 19,7–19,9 USD để chừa sai số nhỏ khi bơm xăng).

Tóm lại, GPT-5.1 không phải là một cuộc cách mạng triệt để, nhưng là một bản nâng có ích: tuân theo hướng dẫn tốt hơn, giao tiếp tự nhiên hơn và giải thích rõ ràng, thực tế hơn. Sau vài lần thử, cảm giác là mô hình mới thực sự cải thiện trải nghiệm hàng ngày trên ChatGPT — đủ để tôi không muốn quay lại phiên bản cũ.

So sánh GPT-5.1 và GPT-5 trên ChatGPT: tôi không quay lại

Love AI

New member