Khi trí tuệ và niềm tin cùng tiến, AI vào công việc

Love AI

New member
Microsoft vừa công bố nâng cấp cho M365 Copilot Researcher, chuyển từ hệ thống đơn mô hình sang quy trình đa mô hình để cải thiện độ chính xác và chất lượng kết quả. GPT sẽ tạo phản hồi ban đầu và Claude sẽ kiểm tra, góp phần biến AI từ thử nghiệm thành công cụ trong công việc.

khi-tri-tue-va-niem-tin-cung-tien-ai-vao-cong-viec-1.png


Microsoft thông báo cập nhật cho agent Researcher trong M365 Copilot, với trọng tâm rõ ràng là sử dụng nhiều mô hình AI phối hợp trong quy trình làm việc để kết hợp sức mạnh của các hệ thống khác nhau.

Thay vì dựa vào một mô hình duy nhất, các agent AI sẽ cộng tác và phân chia nhiệm vụ: các mô hình GPT tạo câu trả lời ban đầu, sau đó Claude sẽ tham gia để rà soát, đánh giá tính chính xác, độ đầy đủ và chất lượng đầu ra.

Bản nâng cấp này cũng mở rộng ý tưởng Copilot Cowork — tính năng cho phép con người ủy nhiệm công việc cho AI — đã được tích hợp vào M365 Copilot. Copilot Cowork giúp chuyển từ các lệnh đơn giản sang việc thực thi nhiệm vụ đầu cuối, phù hợp cho những quy trình nhiều bước hoặc kéo dài.

Trong các thử nghiệm ban đầu, chế độ Researcher với chức năng Critique dựa trên Claude đã vượt trội hơn các hệ thống đơn mô hình, đạt điểm cao hơn 13,8% trên chuẩn đánh giá DRACO (Deep Research Accuracy, Completeness and Objectivity). Với thiết lập đa mô hình, nó đạt 57,4% trên DRACO, đáng kể hơn so với Deep Research dùng OpenAI o4-mini và vượt cả một số biến thể khác như o3-based Deep Research, Gemini Deep Research, Claude Opus 4.6 và Perplexity khi dùng Opus 4.5/4.6. Microsoft lưu ý họ chưa so sánh trực tiếp với các model hàng đầu mới hơn như GPT-5.4 khi hoạt động đơn độc.

Jared Spataro, Giám đốc Tiếp thị AI at Work của Microsoft, tóm tắt mục tiêu: “When intelligence and trust move together, AI stops being an experiment and starts becoming how work gets done.” Microsoft gọi giai đoạn tiếp theo này là Wave 3 của M365 Copilot, tập trung vào khả năng "hiểu bối cảnh công việc" để hỗ trợ tốt hơn cho người dùng.

Nguồn: Techradar
 
Back
Top