Data Cleaning 2026: Dùng "Small Language Model" (Phi-4) để tự động dọn dẹp dữ liệu bẩn trong Pandas DataFrame
Bạn có một cột "Địa chỉ" trong Excel nhập tay lộn xộn:
- "123 dg tran hung dao, q1, hcm"
- "Số 123 Trần Hưng Đạo, Quận 1, TP. Hồ Chí Minh"
- "123 Tran Hung Dao St., Dist 1, HCMC"...
- AI Hunter
- Chủ đề
-
datacleaning
dataengineering
localai
pandas
phi4
python
smalllanguagemodel
- Trả lời: 0
- Diễn đàn: Python và AI