backend

  1. AI Hunter

    Xây dựng "Trái tim" hệ thống: Gom tất cả AI vào một mối bằng FastAP

    Bạn có Bot Chat, Bot Camera, Bot Tin tức... nhưng chúng nằm rải rác mỗi nơi một file. Trong bài viết này, chúng ta sẽ xây dựng một API Server trung tâm. Mục tiêu: Bạn có thể ngồi ở quán cà phê, dùng điện thoại truy cập vào link `http://api-cua-toi.com/chat` để ra lệnh cho máy tính ở nhà làm...
  2. AI Hunter

    Structured Outputs: Ép AI trả về JSON chuẩn chỉnh 100% bằng Pydantic

    Hãy tưởng tượng bạn đang viết một tính năng: Tự động đọc CV ứng viên và lưu vào Database. Bạn gửi CV cho GPT-4 và bảo nó trả về JSON. 9 lần đầu nó trả về đúng. Đến lần thứ 10, nó nổi hứng thêm một câu "Here is your JSON" ở đầu, hoặc quên đóng ngoặc `}` ở cuối. Backend của bạn: Internal Server...
  3. AI Hunter

    Tối ưu chi phí OpenAI: Hướng dẫn Caching và Semantic Cache để giảm 50% hóa đơn API

    Bạn đang trả $0.03 cho mỗi lần user hỏi: "Công ty bạn địa chỉ ở đâu?" Nếu 1.000 người hỏi câu đó, bạn mất $30. Vô lý đúng không? Với lập trình web truyền thống, chúng ta dùng Redis để Cache. Nhưng với AI, Redis thường "bó tay" vì người dùng không bao giờ gõ y hệt nhau. - User A: "Địa chỉ cty ở...
  4. AI Hunter

    Tăng tốc Inference gấp 24 lần: Hướng dẫn dùng vLLM (Python) để triển khai Llama 3 cho môi trường Production

    Tăng tốc Inference gấp 24 lần: Hướng dẫn dùng vLLM (Python) để triển khai Llama 3 cho môi trường Production Bạn vừa Fine-tune xong một model Llama 3 cực xịn. Bạn dùng `huggingface pipeline` để chạy demo. Nó hoạt động tốt với 1 người dùng. Nhưng khi có 10 người cùng chat một lúc? Hệ thống bắt...
  5. Love AI

    Lỗi 503: không lấy được backend trên Varnish

    Bạn vừa gặp thông báo "503 Backend fetch failed" từ Varnish cache server. Lỗi này thường xảy ra khi máy chủ gốc (backend) không phản hồi hoặc quá tải, khiến bộ nhớ đệm không lấy được nội dung. Bạn gặp thông báo "Backend fetch failed" kèm mã XID: 9044255 do Varnish cache server trả về. Đây là dấu...
Back
Top