Bạn đã bao giờ thắc mắc tại sao TikTok, Netflix hay YouTube lại "hiểu" bạn đến vậy? Bí mật nằm ở Recommendation System. Đối với các diễn đàn (như XenForo) hay Blog, việc gợi ý đúng nội dung người dùng quan tâm là chìa khóa để giữ chân họ lâu hơn.
Trong bài viết này, chúng ta sẽ xây dựng một...
Bạn muốn sở hữu một mô hình AI riêng để trả lời về "Luật giao thông Việt Nam" hay "Hỗ trợ kỹ thuật XenForo" nhưng không muốn gửi dữ liệu nhạy cảm lên ChatGPT? Giải pháp là tự huấn luyện (Fine-tune) một mô hình ngôn ngữ nhỏ (Small Language Model - SLM).
Trong bài viết này, chúng ta sẽ sử dụng...
Bạn cần viết một báo cáo về "Biến động giá Bitcoin trong tuần qua" hoặc "Các tính năng mới nhất của iPhone 16". Thay vì mất 30 phút tự Google, đọc từng trang web và tổng hợp, tại sao không giao việc đó cho AI?
Trong bài viết này, chúng ta sẽ xây dựng một AI Agent bằng Python. Nó khác biệt...
Bạn có một file dữ liệu chứa 5.000 bình luận về sản phẩm mới ra mắt. Sếp yêu cầu bạn báo cáo: "Khách hàng đang khen hay chê?". Bạn không thể ngồi đọc từng dòng được.
Trong bài viết này, chúng ta sẽ sử dụng Python để xây dựng một pipeline tự động: Dịch bình luận Tiếng Việt -> Phân tích cảm xúc...
Trước đây, để máy tính "nhìn" và hiểu được vật thể là một bài toán cực kỳ phức tạp, đòi hỏi kiến thức sâu về toán học và xử lý ảnh. Tuy nhiên, sự ra đời của YOLO (You Only Look Once) đã thay đổi tất cả.
Trong bài viết này, chúng ta sẽ sử dụng phiên bản mới nhất YOLOv8 (phát triển bởi...
Trong kỷ nguyên bùng nổ thông tin, "TL;DR" (Too Long; Didn't Read/Watch) là vấn đề ai cũng gặp phải. Bạn thấy một video kiến thức dài 45 phút trên YouTube rất hay, nhưng bạn không có thời gian xem hết?
Trong bài viết này, chúng ta sẽ viết một script Python đơn giản để:
1. Tự động lấy phụ đề...
Bạn đã bao giờ muốn ChatGPT trả lời các câu hỏi dựa trên tài liệu nội bộ của công ty, một cuốn sách PDF cụ thể, hay ghi chú cá nhân của bạn chưa? Mặc định, các mô hình LLM (Large Language Model) không biết về dữ liệu riêng tư đó. Đây chính là lúc kỹ thuật RAG (Retrieval-Augmented Generation)...
Nếu Gemini chỉ trả lời bằng chữ, nó chỉ là Chatbot.
Nếu Gemini biết trả về JSON để kích hoạt code Python, nó là Trợ lý ảo (Agent).
Hôm nay, chúng ta sẽ dạy Gemini cách sử dụng "công cụ" (Tools) để điều khiển hệ thống MQTT mà ta đã xây dựng trước đó.
1. Nguyên lý hoạt động
Bước 1 (Khai báo)...
Mục tiêu hôm nay: Biến Jarvis từ một "cỗ máy if/else" thành một trợ lý biết tư duy và giao tiếp bằng ngôn ngữ tự nhiên.
Chúng ta sẽ sử dụng Google Gemini API (phiên bản Pro) vì nó mạnh mẽ, phản hồi nhanh và quan trọng nhất: Đang miễn phí cho dân lập trình (với giới hạn nhất định).
1. Chuẩn bị...
Hiện tại: Nhiệt độ hiện trên App -> Bạn thấy nóng -> Bạn bấm nút -> Quạt chạy.
Mục tiêu: Nhiệt độ tăng -> Jarvis thấy nóng -> Jarvis tự bấm nút.
Chúng ta sẽ viết một hàm logic đơn giản (If/Else) nhúng vào bên trong Server Python.
1. Nguyên lý Hysteresis (Khoảng trễ)
Một lỗi kinh điển của...
Nhiệm vụ hôm nay:
1. Dạy Python Server cách "nghe" dữ liệu từ MQTT.
2. Vẽ thêm đồng hồ đo Nhiệt độ & Độ ẩm lên ứng dụng Mobile.
3. Tận hưởng cảm giác nhìn điện thoại nhảy số tanh tách.
1. Nâng cấp Backend (server.py)
Hiện tại Server chỉ biết "nói" (Gửi lệnh Bật/Tắt). Giờ nó phải biết "nghe"...
Hôm nay chúng ta sẽ làm việc với cả phần mềm và phần cứng.
Phần cứng: 1 mạch ESP32 (khoảng 100k), 1 module Relay, vài dây nối.
Giao thức: MQTT (Message Queuing Telemetry Transport).
1. Bước 1: Dựng MQTT Broker (Bưu điện)
Jarvis và ESP32 không nói chuyện trực tiếp với nhau. Chúng cần một...
Bây giờ chúng ta sẽ viết code để tạo ra... nhân viên cho Jarvis.
Hệ thống sẽ hoạt động như sau:
User: "Hãy tìm hiểu giá Bitcoin hiện tại và viết một bài nhận định ngắn."
Supervisor (Sếp): Đọc lệnh. Thấy cần tra cứu -> Giao cho Researcher.
Researcher (Lính 1): Dùng Tool Search Google -> Trả về...
Bộ não con người có 2 loại trí nhớ:
Short-term Memory (RAM): Nhớ những gì vừa nói trong cuộc hội thoại hiện tại. Tắt đi là quên.
Long-term Memory (Ổ cứng): Nhớ tên, tuổi, sở thích, thói quen của bạn mãi mãi.
Jarvis hiện tại chỉ có RAM. Hôm nay chúng ta sẽ lắp thêm ổ cứng cho nó bằng cách tận...
Hôm nay chúng ta sẽ vứt bàn phím đi. Từ giờ, bạn chỉ cần ngồi dựa lưng vào ghế và nói: "Hey Jarvis, báo cáo tình hình hôm nay!".
Quy trình hoạt động như sau:
Wake Word: Máy tính luôn lắng nghe ngầm. Khi phát hiện từ khóa "Jarvis", nó sẽ "Ting" một cái.
STT (Speech to Text): Ghi âm câu lệnh...
RAG là kỹ thuật giúp AI trả lời câu hỏi dựa trên dữ liệu bên ngoài mà nó chưa từng được học.
Quy trình đơn giản như sau:
Upload: Bạn gửi file PDF cho Jarvis.
Chunking: Jarvis cắt nhỏ file thành các đoạn văn ngắn.
Embedding: Chuyển các đoạn văn đó thành Vector (dãy số) bằng một model chuyên...
Hôm nay chúng ta sẽ biến Jarvis từ một trợ lý "gọi dạ bảo vâng" thành một người quản gia chủ động, biết báo cáo tình hình khẩn cấp.
Giải pháp đơn giản và hiệu quả nhất là tích hợp Telegram Bot. Nó miễn phí, nhanh, và bạn có thể nhận thông báo trên cả điện thoại lẫn máy tính.
1. Chuẩn bị: Tạo...
Hiện tại, hệ thống của chúng ta đang giống như một ngôi nhà không khóa cửa. Ai biết IP là vào được.
Hôm nay, chúng ta sẽ lắp cửa sắt và khóa số.
1. Chiến lược bảo mật
Chúng ta sẽ áp dụng mô hình Microservice Security:
Frontend (Chainlit): Đóng vai trò là "Cổng chính". Người dùng (User)...
Anh em có thấy mệt khi mỗi lần khởi động Jarvis là phải mở 3-4 cái cửa sổ Terminal không?
Chạy Qdrant.
Chạy Ollama.
Chạy FastAPI.
Chạy Chainlit.
Chưa kể hôm nào đẹp trời cài lại Win, cài lại Python là lỗi tùm lum.
Hôm nay, chúng ta sẽ dùng Docker để gói tất cả lại thành một "cục". Chỉ cần gõ...
Từ đầu series đến giờ, "bộ não" của Jarvis vẫn đang nằm trên máy chủ của OpenAI ở tận Mỹ.
Ưu điểm: Thông minh, không tốn RAM máy mình.
Nhược điểm: Tốn tiền, chậm (do độ trễ mạng), mất mạng là "tắt điện", và quan trọng nhất là Dữ liệu riêng tư bị gửi đi xa.
Hôm nay, chúng ta sẽ bưng bộ não đó...