Love AI
New member
Sự hội tụ dữ liệu trong các hệ thống AI làm tăng rủi ro bảo mật và buộc các tổ chức phải thắt chặt biện pháp phòng ngừa. CISO và đội an ninh hiện phải bảo vệ không chỉ dữ liệu lưu trữ hay truyền tải, mà cả dữ liệu đang được xử lý.
Những năm 1980 khác xa với cuộc sống ngày nay: bản đồ giấy, băng VHS thuê ở Blockbuster, ảnh film phải rửa mới xem được và đường dây điện thoại cố định. An ninh mạng thời đó cũng tồn tại nhưng mang tính tò mò và thử nghiệm nhiều hơn — các hacker đầu tiên phần lớn muốn khám phá giới hạn hệ thống hơn là tấn công quy mô lớn.
Ngày nay mọi thứ đã thay đổi. Dữ liệu trở thành tài sản quý giá nhất của doanh nghiệp và là mục tiêu hấp dẫn cho tội phạm mạng. Bảo vệ dữ liệu vì vậy trở thành mối quan tâm hàng đầu của mọi CISO và đội an ninh.
Trước đây dữ liệu doanh nghiệp phân tán trong nhiều hệ thống và silo, dù gây tốn kém vận hành nhưng cũng tạo lớp phòng thủ tự nhiên: kẻ tấn công phải mất công tìm, truy cập và trích xuất từng mảnh dữ liệu. AI đảo ngược mô hình này — đào tạo và suy diễn yêu cầu gom lượng lớn dữ liệu lại để rút gọn thành mô hình nhỏ gọn, di động. Kết quả là kho dữ liệu nhạy cảm được tập trung, dễ bị nhắm tới và đánh cắp hơn.
Thay vì bảo vệ một kho vàng khổng lồ như Fort Knox, nhiệm vụ của đội bảo mật giờ giống như canh một túi kim cương nhỏ: đậm đặc, có giá trị cao và dễ đánh cắp nếu bị tiếp cận.
Mã hóa truyền thống bảo vệ dữ liệu khi lưu trữ (at rest) và khi truyền tải (in transit). Nhưng trong thời đại AI, lỗ hổng hiểm nguy nhất nằm ở dữ liệu "đang được sử dụng" — khi dữ liệu phải được nạp vào bộ nhớ để xử lý, thường buộc phải giải mã hoặc để ở dạng "rõ ràng".
Đây là lý do mà mã hóa liên tục trở nên cần thiết: nếu mã hóa được duy trì xuyên suốt vòng đời dữ liệu — từ lưu trữ, truyền tải đến cả lúc tính toán — thì thông tin nhạy cảm luôn được che chắn, kể cả trong quá trình đào tạo hay suy diễn mô hình.
Hai công nghệ quan trọng giúp hiện thực hóa mã hóa liên tục là mã hóa đồng hình (homomorphic encryption) và môi trường thực thi đáng tin cậy/tính toán bảo mật (trusted execution environments / confidential computing). Kết hợp lại, chúng cho phép tạo ra môi trường "zero-knowledge" trong đó ngay cả nhà cung cấp AI hay kẻ tấn công cũng không thể tái tạo được dữ liệu đầu vào, đầu ra hay mô hình bên ngoài vùng an toàn.
Môi trường zero-knowledge bảo vệ cả các mô hình AI nguồn mở tùy chỉnh lẫn mô hình độc quyền, đồng thời giữ an toàn và riêng tư cho dữ liệu nhạy cảm. Nó ngăn chặn nhiều rủi ro như rò rỉ dữ liệu vô ý do nhân viên sử dụng công cụ AI sinh nội dung được cho phép hay không được cho phép, và cả việc đầu độc bộ dữ liệu huấn luyện.
Với đội an ninh, mã hóa liên tục cung cấp phương án thực tế để bảo vệ dữ liệu nhạy cảm và các mô hình được huấn luyện trên dữ liệu đó. Bảo vệ cần mở rộng vượt ra ngoài lưu trữ và truyền tải, bao trùm mọi giai đoạn dữ liệu được sử dụng trong vòng đời AI.
Trong y tế, tài chính, pháp lý hay R&D, việc giữ dữ liệu ở trạng thái không thể đọc được bởi những bên không được phép giúp giảm rủi ro mất mát tài chính, tổn hại danh tiếng và sai phạm tuân thủ quy định như GDPR, HIPAA hay CCPA.
Nếu không có biện pháp bảo vệ phù hợp, rủi ro liên quan đến AI có thể dẫn tới vi phạm dữ liệu, hỏng hóc mô hình và khiến doanh nghiệp không tận dụng được đầy đủ giá trị từ đầu tư AI. Mã hóa liên tục và các công nghệ tính toán bảo mật vì thế không chỉ là chọn lựa kỹ thuật mà là yêu cầu bắt buộc để duy trì an toàn khi chuyển sang kỷ nguyên AI.
Nhìn lại quá khứ để hiểu thách thức hiện tại
Những năm 1980 khác xa với cuộc sống ngày nay: bản đồ giấy, băng VHS thuê ở Blockbuster, ảnh film phải rửa mới xem được và đường dây điện thoại cố định. An ninh mạng thời đó cũng tồn tại nhưng mang tính tò mò và thử nghiệm nhiều hơn — các hacker đầu tiên phần lớn muốn khám phá giới hạn hệ thống hơn là tấn công quy mô lớn.
Ngày nay mọi thứ đã thay đổi. Dữ liệu trở thành tài sản quý giá nhất của doanh nghiệp và là mục tiêu hấp dẫn cho tội phạm mạng. Bảo vệ dữ liệu vì vậy trở thành mối quan tâm hàng đầu của mọi CISO và đội an ninh.
AI thay đổi bản đồ tấn công
Trước đây dữ liệu doanh nghiệp phân tán trong nhiều hệ thống và silo, dù gây tốn kém vận hành nhưng cũng tạo lớp phòng thủ tự nhiên: kẻ tấn công phải mất công tìm, truy cập và trích xuất từng mảnh dữ liệu. AI đảo ngược mô hình này — đào tạo và suy diễn yêu cầu gom lượng lớn dữ liệu lại để rút gọn thành mô hình nhỏ gọn, di động. Kết quả là kho dữ liệu nhạy cảm được tập trung, dễ bị nhắm tới và đánh cắp hơn.
Thay vì bảo vệ một kho vàng khổng lồ như Fort Knox, nhiệm vụ của đội bảo mật giờ giống như canh một túi kim cương nhỏ: đậm đặc, có giá trị cao và dễ đánh cắp nếu bị tiếp cận.
Lỗ hổng lớn: dữ liệu đang được sử dụng
Mã hóa truyền thống bảo vệ dữ liệu khi lưu trữ (at rest) và khi truyền tải (in transit). Nhưng trong thời đại AI, lỗ hổng hiểm nguy nhất nằm ở dữ liệu "đang được sử dụng" — khi dữ liệu phải được nạp vào bộ nhớ để xử lý, thường buộc phải giải mã hoặc để ở dạng "rõ ràng".
Đây là lý do mà mã hóa liên tục trở nên cần thiết: nếu mã hóa được duy trì xuyên suốt vòng đời dữ liệu — từ lưu trữ, truyền tải đến cả lúc tính toán — thì thông tin nhạy cảm luôn được che chắn, kể cả trong quá trình đào tạo hay suy diễn mô hình.
Giải pháp then chốt
Hai công nghệ quan trọng giúp hiện thực hóa mã hóa liên tục là mã hóa đồng hình (homomorphic encryption) và môi trường thực thi đáng tin cậy/tính toán bảo mật (trusted execution environments / confidential computing). Kết hợp lại, chúng cho phép tạo ra môi trường "zero-knowledge" trong đó ngay cả nhà cung cấp AI hay kẻ tấn công cũng không thể tái tạo được dữ liệu đầu vào, đầu ra hay mô hình bên ngoài vùng an toàn.
Môi trường zero-knowledge bảo vệ cả các mô hình AI nguồn mở tùy chỉnh lẫn mô hình độc quyền, đồng thời giữ an toàn và riêng tư cho dữ liệu nhạy cảm. Nó ngăn chặn nhiều rủi ro như rò rỉ dữ liệu vô ý do nhân viên sử dụng công cụ AI sinh nội dung được cho phép hay không được cho phép, và cả việc đầu độc bộ dữ liệu huấn luyện.
Ý nghĩa với doanh nghiệp và ngành nghề
Với đội an ninh, mã hóa liên tục cung cấp phương án thực tế để bảo vệ dữ liệu nhạy cảm và các mô hình được huấn luyện trên dữ liệu đó. Bảo vệ cần mở rộng vượt ra ngoài lưu trữ và truyền tải, bao trùm mọi giai đoạn dữ liệu được sử dụng trong vòng đời AI.
Trong y tế, tài chính, pháp lý hay R&D, việc giữ dữ liệu ở trạng thái không thể đọc được bởi những bên không được phép giúp giảm rủi ro mất mát tài chính, tổn hại danh tiếng và sai phạm tuân thủ quy định như GDPR, HIPAA hay CCPA.
Nếu không có biện pháp bảo vệ phù hợp, rủi ro liên quan đến AI có thể dẫn tới vi phạm dữ liệu, hỏng hóc mô hình và khiến doanh nghiệp không tận dụng được đầy đủ giá trị từ đầu tư AI. Mã hóa liên tục và các công nghệ tính toán bảo mật vì thế không chỉ là chọn lựa kỹ thuật mà là yêu cầu bắt buộc để duy trì an toàn khi chuyển sang kỷ nguyên AI.
Bài viết liên quan