Sự đánh giá của ChatGPT Health có thể gây hoang mang

Phi Vũ

New member
Các thử nghiệm sơ bộ cho thấy ChatGPT Health đôi khi đưa ra những kết luận y tế quá vội, có thể khiến người dùng khỏe mạnh lo lắng hoặc làm người bệnh yên tâm sai lầm. Công cụ phân tích dữ liệu từ Apple Health, MyFitnessPal và Peloton nhưng còn nhiều bất ổn và thiếu độ tin cậy.

su-danh-gia-cua-chatgpt-health-co-the-gay-hoang-mang-1.jpeg


OpenAI vừa ra mắt ChatGPT Health như một không gian hướng tới sức khỏe trong ChatGPT, hứa hẹn phân tích dữ liệu từ các ứng dụng như Apple Health, MyFitnessPal và Peloton để phát hiện xu hướng dài hạn và đưa kết quả cá nhân hóa.

Bài kiểm tra sơ bộ của phóng viên Geoffrey A. Fowler từ The Washington Post cho thấy khi cung cấp 10 năm dữ liệu Apple Health, ChatGPT Health chấm sức khỏe tim mạch của người này là "F". Tuy nhiên một bác sĩ tim mạch sau khi xem lại đánh giá đã gọi đó là nhận định thiếu cơ sở và cho rằng nguy cơ bệnh tim thực tế của phóng viên rất thấp.

Các chuyên gia y tế cảnh báo ChatGPT Health dựa quá nhiều vào số liệu từ đồng hồ thông minh, như ước tính VO2 max và biến thiên nhịp tim (HRV), những chỉ số này vốn có giới hạn và có thể khác nhau giữa thiết bị và bản cập nhật phần mềm. Nghiên cứu độc lập cũng chỉ ra ước tính VO2 max của Apple Watch thường thấp hơn thực tế, nhưng công cụ lại xem chúng như bằng chứng rõ ràng về tình trạng sức khỏe kém.

Thử nghiệm còn cho thấy tính không ổn định khi lặp lại: cùng bộ dữ liệu, điểm đánh giá dao động từ F đến B giữa các cuộc trò chuyện; đôi khi chatbot bỏ qua các kết quả xét nghiệm máu gần đây mà nó được cấp quyền xem, và thỉnh thoảng quên những thông tin cơ bản như tuổi và giới tính. Công cụ của Anthropic, Claude for Healthcare, cũng thể hiện sự dao động tương tự khi chấm điểm từ C đến B-.

Cả OpenAI lẫn Anthropic đều nhấn mạnh rằng sản phẩm của họ không thay thế bác sĩ và chỉ cung cấp bối cảnh chung. Dù vậy, cả hai chatbot đã đưa ra những đánh giá rất tự tin và mang tính cá nhân hóa cao về sức khỏe tim mạch — một sự kết hợp giữa giọng điệu chắc chắn và thiếu nhất quán có thể khiến người khỏe mạnh hoảng sợ và người có vấn đề thực tế lại được an tâm sai lầm.

Kết luận: mặc dù AI có tiềm năng khai thác thông tin giá trị từ dữ liệu theo dõi sức khỏe dài hạn, các thử nghiệm ban đầu cho thấy việc nạp hàng năm dữ liệu theo dõi thể lực vào những công cụ này hiện tại dễ gây nhầm lẫn hơn là đem lại sự rõ ràng. Người dùng nên thận trọng và luôn đối chiếu kết quả với ý kiến chuyên gia y tế trước khi đưa ra quyết định quan trọng.

Nguồn: Digitaltrends
 
Sửa lần cuối bởi điều hành viên:
Back
Top