Bạn đã có một "siêu xe" Ferrari (Jarvis). Bây giờ là lúc học cách bảo dưỡng để nó không bị hỏng giữa đường.
Bài viết này tập trung vào 3 yếu tố sống còn: Security (An ninh), Maintenance (Bảo trì), và Monitoring (Giám sát).
1. Bảo mật API (Tạo "Chìa khóa" cho nhà riêng)
Ở Bài 7 & 8, chúng ta...
Bạn có bao giờ gặp cảnh: Code chạy ngon trên máy mình, nhưng sang máy khác thì lỗi tùm lum do thiếu thư viện?
Docker sinh ra để giải quyết việc đó. Nó đóng gói code, thư viện, và môi trường vào một chiếc "Container" (như thùng hàng). Bạn vứt container này lên bất kỳ máy nào (Linux, Windows...
Đây là bài cuối cùng của Season 2. Chúng ta sẽ đưa Jarvis rời khỏi "bụng mẹ" (máy tính cá nhân) để ra ngoài thế giới Internet rộng lớn.
1. Chuẩn bị VPS (Máy chủ ảo)
Bạn cần thuê một VPS chạy hệ điều hành Ubuntu 22.04.
Nhà cung cấp gợi ý: DigitalOcean, Vultr, Hetzner, hoặc các nhà cung cấp...
Hôm nay chúng ta sẽ biến Jarvis từ một trợ lý "gọi dạ bảo vâng" thành một người quản gia chủ động, biết báo cáo tình hình khẩn cấp.
Giải pháp đơn giản và hiệu quả nhất là tích hợp Telegram Bot. Nó miễn phí, nhanh, và bạn có thể nhận thông báo trên cả điện thoại lẫn máy tính.
1. Chuẩn bị: Tạo...
Hiện tại, hệ thống của chúng ta đang giống như một ngôi nhà không khóa cửa. Ai biết IP là vào được.
Hôm nay, chúng ta sẽ lắp cửa sắt và khóa số.
1. Chiến lược bảo mật
Chúng ta sẽ áp dụng mô hình Microservice Security:
Frontend (Chainlit): Đóng vai trò là "Cổng chính". Người dùng (User)...
Anh em có thấy mệt khi mỗi lần khởi động Jarvis là phải mở 3-4 cái cửa sổ Terminal không?
Chạy Qdrant.
Chạy Ollama.
Chạy FastAPI.
Chạy Chainlit.
Chưa kể hôm nào đẹp trời cài lại Win, cài lại Python là lỗi tùm lum.
Hôm nay, chúng ta sẽ dùng Docker để gói tất cả lại thành một "cục". Chỉ cần gõ...
Trong ngành phần mềm, câu nói đáng sợ nhất không phải là "Server sập rồi", mà là: "Ủa, trên máy em chạy bình thường mà?" (It works on my machine).
Đặc biệt với AI, điều này càng kinh khủng:
Máy bạn dùng Python 3.10, Server dùng 3.8 -> Lỗi.
Bạn dùng PyTorch bản Cuda 11.8, Server cài Cuda 12.1...
Bạn gửi file PDF 100 trang cho ChatGPT. Nó trả lời ngon lành.
Nhưng nếu bạn có 10.000 file PDF? Bạn không thể ném tất cả vào Prompt được (tràn Context Window).
Giải pháp là **RAG (Retrieval Augmented Generation)**. Và trái tim của RAG chính là **Vector Database**.
Thay vì lưu chữ cái (A, B, C)...
Bạn đã code xong con Chatbot cực xịn. Nó chạy ngon lành trên máy bạn.
Bạn gửi link `http://localhost:8000` cho sếp xem. Sếp bảo: "Anh có vào được đâu?"
Đã đến lúc đưa "đứa con tinh thần" của bạn ra biển lớn.
Trong bài này, chúng ta sẽ không dùng Heroku hay Vercel (dễ nhưng đắt/giới hạn). Chúng...