Love AI
New member
Sự bùng nổ AI tạo ra thách thức nhiệt học mới cho các trung tâm dữ liệu. Các mô hình ngôn ngữ lớn khiến tải công suất biến động nhanh, đòi hỏi giải pháp làm mát linh hoạt hơn.
Trong nhiều thập kỷ, các trung tâm dữ liệu vận hành theo mô hình nhiệt động học tương đối ổn định: xây phòng, đặt máy chủ và luân chuyển không khí lạnh qua sàn hoặc lối đi. Tải nhiệt chủ yếu ổn định, công suất điện tăng dần và hệ thống làm mát được tính toán với biên độ an toàn tĩnh.
Sự xuất hiện nhanh chóng của AI sinh tạo và các mô hình ngôn ngữ lớn phá vỡ tính ổn định đó. Thay vì tải công việc đều đặn, việc huấn luyện và chạy các mô hình này gây ra biến động lớn về tính toán trong giây lát; mức tiêu thụ điện có thể tăng đột ngột và phân bổ không đồng đều trên hạ tầng phần cứng hỗn tạp.
Hệ quả là xuất hiện các điểm nóng cục bộ mà làm mát bằng không khí truyền thống khó kịp khắc phục. Nếu không có phản ứng làm mát được phối hợp, biến động nhiệt này có thể làm giảm hiệu năng và rút ngắn tuổi thọ của phần cứng.
Thách thức hiện nay là hành vi nhiệt đã trở nên động, không đều và gắn chặt với mô hình tải công việc. Làm mát không còn là một lớp tĩnh nằm dưới ngăn xếp CNTT; nó phải trở thành khả năng thích ứng song hành cùng tải. Quyết định về cung cấp điện, mật độ rack và phân bổ công việc giờ đây mang hậu quả nhiệt ngay lập tức.
Để xử lý mật độ cao của GPU hiện đại, nhiều đơn vị vận hành chuyển sang bắt nhiệt gần nguồn hơn. Làm mát trực tiếp tới chip (direct-to-chip liquid cooling) giữ nhiệt ở cấp silicon, giảm nhu cầu quạt tốc độ cao và năng lượng kèm theo. Bộ trao đổi nhiệt ở cửa sau (rear-door heat exchangers) chặn nhiệt trước khi lan vào lối đi. So với không khí, chất lỏng hấp thụ nhiệt hiệu quả hơn nên những phương pháp này cho phép quản lý đỉnh tải AI mà không phải dự phòng toàn bộ cơ sở một cách thừa thãi.
Để triển khai kiến trúc làm mát bằng chất lỏng, các bộ phân phối dung dịch làm mát (Coolant Distribution Units - CDU) đóng vai trò then chốt. CDU có nhiều công suất và dạng bố trí, bao gồm in-rack và in-row, hỗ trợ cả trao đổi nhiệt chất lỏng-sang-không khí và chất lỏng-sang-chất lỏng, giúp hệ thống linh hoạt và thích ứng với các nhu cầu khác nhau.
Kết luận: ngành trung tâm dữ liệu cần suy nghĩ lại các nguyên lý nhiệt động học truyền thống và tích hợp chặt chẽ giữa phần cứng, phân bổ tải và hệ thống làm mát. Chỉ bằng cách kết hợp điều phối tải với kiến trúc làm mát thích ứng, các trung tâm dữ liệu mới có thể đảm bảo hiệu năng, độ tin cậy và hiệu suất năng lượng trong thời đại AI.
Nguồn: Techradar
Trong nhiều thập kỷ, các trung tâm dữ liệu vận hành theo mô hình nhiệt động học tương đối ổn định: xây phòng, đặt máy chủ và luân chuyển không khí lạnh qua sàn hoặc lối đi. Tải nhiệt chủ yếu ổn định, công suất điện tăng dần và hệ thống làm mát được tính toán với biên độ an toàn tĩnh.
Sự xuất hiện nhanh chóng của AI sinh tạo và các mô hình ngôn ngữ lớn phá vỡ tính ổn định đó. Thay vì tải công việc đều đặn, việc huấn luyện và chạy các mô hình này gây ra biến động lớn về tính toán trong giây lát; mức tiêu thụ điện có thể tăng đột ngột và phân bổ không đồng đều trên hạ tầng phần cứng hỗn tạp.
Hệ quả là xuất hiện các điểm nóng cục bộ mà làm mát bằng không khí truyền thống khó kịp khắc phục. Nếu không có phản ứng làm mát được phối hợp, biến động nhiệt này có thể làm giảm hiệu năng và rút ngắn tuổi thọ của phần cứng.
Thách thức hiện nay là hành vi nhiệt đã trở nên động, không đều và gắn chặt với mô hình tải công việc. Làm mát không còn là một lớp tĩnh nằm dưới ngăn xếp CNTT; nó phải trở thành khả năng thích ứng song hành cùng tải. Quyết định về cung cấp điện, mật độ rack và phân bổ công việc giờ đây mang hậu quả nhiệt ngay lập tức.
Để xử lý mật độ cao của GPU hiện đại, nhiều đơn vị vận hành chuyển sang bắt nhiệt gần nguồn hơn. Làm mát trực tiếp tới chip (direct-to-chip liquid cooling) giữ nhiệt ở cấp silicon, giảm nhu cầu quạt tốc độ cao và năng lượng kèm theo. Bộ trao đổi nhiệt ở cửa sau (rear-door heat exchangers) chặn nhiệt trước khi lan vào lối đi. So với không khí, chất lỏng hấp thụ nhiệt hiệu quả hơn nên những phương pháp này cho phép quản lý đỉnh tải AI mà không phải dự phòng toàn bộ cơ sở một cách thừa thãi.
Để triển khai kiến trúc làm mát bằng chất lỏng, các bộ phân phối dung dịch làm mát (Coolant Distribution Units - CDU) đóng vai trò then chốt. CDU có nhiều công suất và dạng bố trí, bao gồm in-rack và in-row, hỗ trợ cả trao đổi nhiệt chất lỏng-sang-không khí và chất lỏng-sang-chất lỏng, giúp hệ thống linh hoạt và thích ứng với các nhu cầu khác nhau.
Kết luận: ngành trung tâm dữ liệu cần suy nghĩ lại các nguyên lý nhiệt động học truyền thống và tích hợp chặt chẽ giữa phần cứng, phân bổ tải và hệ thống làm mát. Chỉ bằng cách kết hợp điều phối tải với kiến trúc làm mát thích ứng, các trung tâm dữ liệu mới có thể đảm bảo hiệu năng, độ tin cậy và hiệu suất năng lượng trong thời đại AI.
Nguồn: Techradar
Bài viết liên quan