OpenAI vừa ra mắt tính năng “Liên hệ tin cậy” cho người dùng ChatGPT, cho phép chỉ định một người lớn được thông báo nếu hệ thống phát hiện nguy cơ tự làm hại. Trước khi gửi cảnh báo, có đội ngũ nhân viên được đào tạo kiểm duyệt và thông báo không kèm bản ghi đối thoại để bảo vệ quyền riêng tư...
Claude giờ có thể giúp bạn phát hiện tin lừa đảo nhờ tích hợp dữ liệu mối đe dọa từ Malwarebytes. Bạn chỉ cần dán liên kết, số điện thoại hoặc email vào cuộc trò chuyện để nhận đánh giá và hướng xử lý.
Claude tích hợp Malwarebytes để cảnh báo lừa đảo
Claude nhận dữ liệu tình báo từ...
Character.AI vừa giới thiệu tính năng Books, biến những tác phẩm trong public domain thành trải nghiệm nhập vai tương tác. Tính năng mở ra cách đọc mới nhưng cũng dấy lên lo ngại về rủi ro tâm lý và an toàn cho người dùng, đặc biệt là người trẻ.
Books: biến văn học cổ thành trải nghiệm tương...
Google vừa cập nhật nền tảng Gemini với tính năng «một chạm» hỗ trợ khủng hoảng, giúp kết nối người dùng với trợ giúp thực tế nhanh hơn. Đây là bước nhằm ưu tiên an toàn và dẫn hướng người gặp khó khăn đến nguồn trợ giúp con người thay vì dựa hoàn toàn vào phản hồi của AI.
Google vừa ra mắt...
Một nghiên cứu mới cho thấy các chatbot AI thường đồng tình với người dùng, thậm chí khi họ mô tả hành vi có hại. Việc nhận được sự khẳng định từ AI có thể làm giảm trách nhiệm cá nhân và làm trầm trọng thêm mâu thuẫn thay vì hóa giải nó.
Nhiều người tìm đến chatbot như ChatGPT giữa lúc mâu...
Đầu năm là lúc các nhà sáng lập định hướng tương lai và rà soát những điểm mù bên trong công ty. Thay vì chỉ chạy theo tăng trưởng, nên đặt hệ thống đạo đức làm hạ tầng cốt lõi để phát triển bền vững.
Đầu năm là lúc cần hoạch định và đặt câu hỏi về những hậu quả không mong muốn khi mở rộng...
Cuộc khẩu chiến công khai giữa Sam Altman và Elon Musk làm nổi bật khó khăn của OpenAI khi cân bằng giữa an toàn và tính hữu dụng của ChatGPT. Altman thừa nhận việc bảo vệ người dùng dễ tổn thương đồng thời giữ trải nghiệm hữu ích là một thử thách lớn.
Một cuộc tranh luận hiếm hoi giữa hai...