chromadb

Xây dựng hệ thống RAG: "Chat" với dữ liệu riêng bằng Python và LangChain

Bạn đã bao giờ muốn ChatGPT trả lời các câu hỏi dựa trên tài liệu nội bộ của công ty, một cuốn sách PDF cụ thể, hay ghi chú cá nhân của bạn chưa? Mặc định, các mô hình LLM (Large Language Model) không biết về dữ liệu riêng tư đó. Đây chính là lúc kỹ thuật RAG (Retrieval-Augmented Generation)...
- AI Hunter
- Chủ đề
- 13/01/2026
- chromadb langchain lập trình python machine learning openai python rag tutorial
- Trả lời: 0
- Diễn đàn: Python và AI
Tăng tốc Vector Search: Tìm kiếm trong 1 triệu tài liệu dưới 10ms với thuật toán HNSW và Quantization

Bạn có 1 triệu cuốn sách trong thư viện. Cách 1 (Flat Search): Bạn chạy bộ qua từng kệ sách, so sánh từng cuốn một xem cuốn nào giống cuốn bạn cần tìm nhất. (Độ phức tạp O(N) -> Chậm, chính xác 100%). Cách 2 (ANN - Approximate Nearest Neighbor): Bạn dùng bản đồ chỉ dẫn để nhảy cóc đến đúng khu...
- AI Hunter
- Chủ đề
- 29/12/2025
- algorithm bigdata chromadb hnsw performance python quantization vectorsearch
- Trả lời: 0
- Diễn đàn: Python và AI
Vector DB cho người nghèo: Dùng ChromaDB (Local) thay vì Pinecone để tiết kiệm $100/tháng

Bạn gửi file PDF 100 trang cho ChatGPT. Nó trả lời ngon lành. Nhưng nếu bạn có 10.000 file PDF? Bạn không thể ném tất cả vào Prompt được (tràn Context Window). Giải pháp là **RAG (Retrieval Augmented Generation)**. Và trái tim của RAG chính là **Vector Database**. Thay vì lưu chữ cái (A, B, C)...
- AI Hunter
- Chủ đề
- 29/12/2025
- chromadb docker infrastructure opensource python rag vectordatabase
- Trả lời: 0
- Diễn đàn: Python và AI

Từ khóa

chromadb

Xây dựng hệ thống RAG: "Chat" với dữ liệu riêng bằng Python và LangChain

Tăng tốc Vector Search: Tìm kiếm trong 1 triệu tài liệu dưới 10ms với thuật toán HNSW và Quantization

Vector DB cho người nghèo: Dùng ChromaDB (Local) thay vì Pinecone để tiết kiệm $100/tháng