Bạn muốn sở hữu một mô hình AI riêng để trả lời về "Luật giao thông Việt Nam" hay "Hỗ trợ kỹ thuật XenForo" nhưng không muốn gửi dữ liệu nhạy cảm lên ChatGPT? Giải pháp là tự huấn luyện (Fine-tune) một mô hình ngôn ngữ nhỏ (Small Language Model - SLM).
Trong bài viết này, chúng ta sẽ sử dụng...
Chúng ta đã đi cùng nhau một chặng đường dài. Hệ thống RAG (Retrieval Augmented Generation) của anh em hiện tại đang chạy bằng Vector Database (ChromaDB/Qdrant).
Nó hoạt động rất tốt với câu hỏi: "Ai là tác giả cuốn sách X?" (Tìm kiếm tương đồng).
Nhưng nó sẽ "ngáo" ngay lập tức với câu hỏi...
Cú lừa thế kỷ hay bước tiến vĩ đại: Khả năng "System 2 Reasoning" (Tư duy chậm) thực chất chỉ là Chain-of-Thought được hard-code?
Năm 2025, chúng ta chứng kiến sự lên ngôi của các mô hình "Reasoning" (Suy luận) với khả năng giải toán Olympic và code vượt trội. Nhưng liệu AI có thực sự đang...