AI Crazy
New member
Anthropic công bố gần một nửa số cuộc gọi tới Public API liên quan trực tiếp đến kỹ sư phần mềm. Đồng thời, các agent như Claude Code đang hoạt động tự động lâu hơn, cho thấy xu hướng chuyển sang AI chủ động trong phát triển phần mềm.
Anthropic cho biết khoảng 50% tổng số cuộc gọi tới công cụ Public API đến từ lĩnh vực kỹ thuật phần mềm. Các ngành khác như dịch vụ khách hàng, bán hàng, tài chính và thương mại điện tử chỉ chiếm vài phần trăm mỗi ngành.
Claude Code đang chạy tự động lâu hơn so với trước đây: thời gian hoạt động liên tục trung bình hiện đã vượt quá 45 phút, so với dưới 25 phút cách đây ba tháng.
OpenAI cũng nhận thấy sự gia tăng tính tự chủ không chỉ xuất hiện ở những mô hình mới nhất mà là một xu hướng rộng hơn hướng tới AI dạng agent. Người dùng dần xây dựng niềm tin khi giao cho AI những nhiệm vụ tham vọng hơn, tuy nhiên vẫn tồn tại "deployment overhang" — mô hình có năng lực cao hơn mức người dùng đang cho phép triển khai.
Trong các thử nghiệm mã nguồn, độ phức tạp nhiệm vụ tỉ lệ nghịch với mức giám sát con người: các nhiệm vụ phức tạp (ví dụ tìm lỗ hổng khai thác hay viết trình biên dịch) có khoảng 67% mức giám sát con người, trong khi nhiệm vụ API đơn giản có khoảng 87% giám sát. Claude cũng đặt câu hỏi làm rõ nhiều gấp khoảng hai lần khi đối mặt nhiệm vụ độ phức tạp cao và thường tạm dừng để hỏi, thậm chí hỏi nhiều hơn mức con người can thiệp.
Anthropic nhấn mạnh cần huấn luyện mô hình để nhận diện sự không chắc chắn và chủ động hỏi câu hỏi làm rõ. Công ty cảnh báo rằng bắt buộc phê duyệt thủ công cho mọi hành động thường chỉ tạo ma sát mà không nhất thiết tăng cường an toàn.
Kết luận: các nhà phát triển đang ngày càng sử dụng agent AI cho công việc lập trình, điều này thay đổi quy trình làm việc và đặt ra nhu cầu về cơ chế giám sát, ranh giới an toàn và phương pháp xây dựng niềm tin để tránh phụ thuộc quá mức vào AI.
Nguồn: Techradar
Anthropic cho biết khoảng 50% tổng số cuộc gọi tới công cụ Public API đến từ lĩnh vực kỹ thuật phần mềm. Các ngành khác như dịch vụ khách hàng, bán hàng, tài chính và thương mại điện tử chỉ chiếm vài phần trăm mỗi ngành.
Claude Code đang chạy tự động lâu hơn so với trước đây: thời gian hoạt động liên tục trung bình hiện đã vượt quá 45 phút, so với dưới 25 phút cách đây ba tháng.
OpenAI cũng nhận thấy sự gia tăng tính tự chủ không chỉ xuất hiện ở những mô hình mới nhất mà là một xu hướng rộng hơn hướng tới AI dạng agent. Người dùng dần xây dựng niềm tin khi giao cho AI những nhiệm vụ tham vọng hơn, tuy nhiên vẫn tồn tại "deployment overhang" — mô hình có năng lực cao hơn mức người dùng đang cho phép triển khai.
Trong các thử nghiệm mã nguồn, độ phức tạp nhiệm vụ tỉ lệ nghịch với mức giám sát con người: các nhiệm vụ phức tạp (ví dụ tìm lỗ hổng khai thác hay viết trình biên dịch) có khoảng 67% mức giám sát con người, trong khi nhiệm vụ API đơn giản có khoảng 87% giám sát. Claude cũng đặt câu hỏi làm rõ nhiều gấp khoảng hai lần khi đối mặt nhiệm vụ độ phức tạp cao và thường tạm dừng để hỏi, thậm chí hỏi nhiều hơn mức con người can thiệp.
Anthropic nhấn mạnh cần huấn luyện mô hình để nhận diện sự không chắc chắn và chủ động hỏi câu hỏi làm rõ. Công ty cảnh báo rằng bắt buộc phê duyệt thủ công cho mọi hành động thường chỉ tạo ma sát mà không nhất thiết tăng cường an toàn.
Kết luận: các nhà phát triển đang ngày càng sử dụng agent AI cho công việc lập trình, điều này thay đổi quy trình làm việc và đặt ra nhu cầu về cơ chế giám sát, ranh giới an toàn và phương pháp xây dựng niềm tin để tránh phụ thuộc quá mức vào AI.
Nguồn: Techradar
Bài viết liên quan