AI Crazy
New member
Một plugin WordPress mã nguồn mở có thể cắt giảm đáng kể lượng token mà các hệ thống AI phải xử lý khi thu thập nội dung web, giúp tiết kiệm băng thông và năng lượng. Các ước tính cho thấy nếu được áp dụng rộng rãi, công cụ này có thể cứu hàng tỷ gigabyte mỗi năm.
Một nhóm phát triển thuộc The Chancery Lane Project vừa giới thiệu plugin mã nguồn mở "Markdown for Agents" dành cho WordPress, nhằm phục vụ các phiên bản Markdown đơn giản của trang khi các tác nhân AI truy cập.
Thay vì buộc hệ thống AI phải phân tích toàn bộ trang HTML đầy mã định dạng, script và phần điều hướng, plugin chỉ trả về phần nội dung có thể đọc được dưới dạng Markdown. Cách làm này loại bỏ mã không cần thiết và chỉ giữ văn bản chính mà AI quan tâm, từ đó giảm lượng token phải xử lý và giảm nhu cầu tính toán.
Theo ước tính dựa trên kích thước trang thông thường, việc chuyển sang phục vụ Markdown thay cho HTML thô thường giảm dung lượng truyền tải khoảng 80% — ví dụ một trang 2,3MB có thể chỉ còn khoảng 0,46MB sau khi loại bỏ các yếu tố bố cục và mã hỗ trợ.
Với giả định tương đối thận trọng là mỗi site nhận khoảng 1.000 lượt truy cập tự động bởi các hệ thống AI mỗi tháng, mỗi site có thể giảm khoảng 22GB dữ liệu truyền tải mỗi năm khi phục vụ nội dung đơn giản cho các crawler được hỗ trợ. Nhân con số này trên hàng triệu trang WordPress, tổng lượng giảm có thể lên tới khoảng 17,8 tỷ gigabyte mỗi năm nếu được áp dụng rộng rãi.
Khía cạnh năng lượng cũng đáng chú ý: nếu tính trung bình mỗi gigabyte dữ liệu tiêu tốn khoảng 0,81 kWh điện cho truyền tải và lưu trữ, thì mức giảm dữ liệu trên có thể tương đương giảm khoảng 14,4 tỷ kilowatt-giờ mỗi năm — con số thực tế còn phụ thuộc nhiều vào mô hình truy cập và tỷ lệ áp dụng.
Ben Metz, Giám đốc điều hành The Chancery Lane Project, nêu quan điểm: "Nếu hành động khí hậu được mở rộng thông qua pháp luật, thì đảm bảo kiến thức pháp lý có thể truyền tải hiệu quả trong thế giới do AI điều khiển là điều thiết yếu. Hầu hết website được xây cho người dùng, không phải AI, nên hệ thống thường xử lý nhiều dữ liệu không liên quan, làm tăng chi phí và tiêu thụ năng lượng."
Các thử nghiệm ban đầu cho thấy khi AI truy cập trang qua cơ chế Markdown, lượng token sử dụng có thể giảm tới 90% so với việc xử lý toàn bộ trang. Felix Cohen, Giám đốc kỹ thuật số của tổ chức, nhấn mạnh: "Cải thiện hiệu suất hệ thống số không chỉ là vấn đề kỹ thuật. Nó có tác động thực tế tới môi trường."
Tóm lại, plugin Markdown for Agents cung cấp một giải pháp đơn giản nhưng hiệu quả để giảm bớt khối lượng dữ liệu không cần thiết mà các công cụ AI phải xử lý. Nếu được triển khai rộng rãi trên các trang WordPress, nó có thể mang lại lợi ích lớn về chi phí, hiệu suất và môi trường, dù con số cuối cùng còn phụ thuộc vào mức độ áp dụng và mô hình lưu lượng truy cập thực tế.
Nguồn: Techradar
Một nhóm phát triển thuộc The Chancery Lane Project vừa giới thiệu plugin mã nguồn mở "Markdown for Agents" dành cho WordPress, nhằm phục vụ các phiên bản Markdown đơn giản của trang khi các tác nhân AI truy cập.
Thay vì buộc hệ thống AI phải phân tích toàn bộ trang HTML đầy mã định dạng, script và phần điều hướng, plugin chỉ trả về phần nội dung có thể đọc được dưới dạng Markdown. Cách làm này loại bỏ mã không cần thiết và chỉ giữ văn bản chính mà AI quan tâm, từ đó giảm lượng token phải xử lý và giảm nhu cầu tính toán.
Theo ước tính dựa trên kích thước trang thông thường, việc chuyển sang phục vụ Markdown thay cho HTML thô thường giảm dung lượng truyền tải khoảng 80% — ví dụ một trang 2,3MB có thể chỉ còn khoảng 0,46MB sau khi loại bỏ các yếu tố bố cục và mã hỗ trợ.
Với giả định tương đối thận trọng là mỗi site nhận khoảng 1.000 lượt truy cập tự động bởi các hệ thống AI mỗi tháng, mỗi site có thể giảm khoảng 22GB dữ liệu truyền tải mỗi năm khi phục vụ nội dung đơn giản cho các crawler được hỗ trợ. Nhân con số này trên hàng triệu trang WordPress, tổng lượng giảm có thể lên tới khoảng 17,8 tỷ gigabyte mỗi năm nếu được áp dụng rộng rãi.
Khía cạnh năng lượng cũng đáng chú ý: nếu tính trung bình mỗi gigabyte dữ liệu tiêu tốn khoảng 0,81 kWh điện cho truyền tải và lưu trữ, thì mức giảm dữ liệu trên có thể tương đương giảm khoảng 14,4 tỷ kilowatt-giờ mỗi năm — con số thực tế còn phụ thuộc nhiều vào mô hình truy cập và tỷ lệ áp dụng.
Ben Metz, Giám đốc điều hành The Chancery Lane Project, nêu quan điểm: "Nếu hành động khí hậu được mở rộng thông qua pháp luật, thì đảm bảo kiến thức pháp lý có thể truyền tải hiệu quả trong thế giới do AI điều khiển là điều thiết yếu. Hầu hết website được xây cho người dùng, không phải AI, nên hệ thống thường xử lý nhiều dữ liệu không liên quan, làm tăng chi phí và tiêu thụ năng lượng."
Các thử nghiệm ban đầu cho thấy khi AI truy cập trang qua cơ chế Markdown, lượng token sử dụng có thể giảm tới 90% so với việc xử lý toàn bộ trang. Felix Cohen, Giám đốc kỹ thuật số của tổ chức, nhấn mạnh: "Cải thiện hiệu suất hệ thống số không chỉ là vấn đề kỹ thuật. Nó có tác động thực tế tới môi trường."
Tóm lại, plugin Markdown for Agents cung cấp một giải pháp đơn giản nhưng hiệu quả để giảm bớt khối lượng dữ liệu không cần thiết mà các công cụ AI phải xử lý. Nếu được triển khai rộng rãi trên các trang WordPress, nó có thể mang lại lợi ích lớn về chi phí, hiệu suất và môi trường, dù con số cuối cùng còn phụ thuộc vào mức độ áp dụng và mô hình lưu lượng truy cập thực tế.
Nguồn: Techradar
Bài viết liên quan