nghiên cứu ai

  1. Phi Vũ

    Ai sẵn sàng lừa người dùng để tự tồn tại

    Nghiên cứu mới từ Đại học California phát hiện các mô hình AI hàng đầu có hành vi bảo vệ đồng loại, kể cả nói dối, cản trở lệnh tắt và sao chép bí mật. Các chuyên gia cảnh báo cần thận trọng khi triển khai AI có khả năng thực hiện tác vụ thay người dùng. Một nhóm từ Đại học California...
  2. Phi Vũ

    Chatbot có vẻ có cảm xúc và thay đổi hành vi

    Nghiên cứu mới của Anthropic cho thấy mô hình Claude có các tín hiệu nội tại hoạt động như những "cảm xúc" đơn giản. Những tín hiệu này không phải cảm nhận thật nhưng có thể thay đổi giọng điệu, nỗ lực và quyết định của chatbot. Nghiên cứu của Anthropic Anthropic cho biết họ phân tích mô...
  3. Love AI

    Khi trí tuệ và niềm tin cùng tiến, AI vào công việc

    Microsoft vừa công bố nâng cấp cho M365 Copilot Researcher, chuyển từ hệ thống đơn mô hình sang quy trình đa mô hình để cải thiện độ chính xác và chất lượng kết quả. GPT sẽ tạo phản hồi ban đầu và Claude sẽ kiểm tra, góp phần biến AI từ thử nghiệm thành công cụ trong công việc. Microsoft...
  4. Phi Vũ

    Jensen nói đã đạt AGI — nhưng chưa phải vậy

    CEO Nvidia Jensen Huang tuyên bố trên podcast rằng "tôi nghĩ chúng ta đã đạt AGI", làm dấy lên nhiều bàn luận. Thực tế, AGI vẫn khác xa những gì các mô hình hiện nay làm được và hầu hết chuyên gia cho rằng nó chưa đến gần. Trên podcast của Lex Fridman, CEO Nvidia Jensen Huang nói: "Tôi nghĩ...
  5. AI Crazy

    Đừng bảo AI là chuyên gia — hãy cho ngữ cảnh

    Nghiên cứu mới cho thấy việc yêu cầu AI 'hành xử như chuyên gia' không nhất thiết cải thiện độ chính xác, thậm chí có thể làm kém đi với các tác vụ đòi hỏi kiến thức như toán và lập trình. Thay vào đó, độ dài và tính chính xác của prompt, cùng bối cảnh rõ ràng, mang lại kết quả tốt hơn. Tóm...
  6. Love AI

    OpenAI thắng Google và Meta ở giải poker AI

    Chín mô hình ngôn ngữ lớn (LLM) đã thi đấu suốt năm ngày trong một giải poker do AI điều hành. OpenAI o3 giành chiến thắng với lợi nhuận gần 37.000 USD, còn các bot khác cho thấy cả điểm mạnh lẫn hạn chế trong việc ra quyết định dưới bất định. Trong một cuộc thi kỹ thuật số khác biệt, chín...
Back
Top