NVIDIA bổ sung các Liquid-Cooled GPU dành cho điện toán bền vững và hiệu quả

NVIDIA A100 PCIe làm mát bằng chất lỏng là GPU đầu tiên trong dòng GPU dành cho các máy chủ phổ thông đáp ứng nhu cầu của khách hàng về các trung tâm dữ liệu xanh, hiệu suất cao

Trong nỗ lực toàn cầu nhằm ngăn chặn biến đổi khí hậu, Zac Smith là một phần của phong trào đang phát triển nhằm xây dựng các trung tâm dữ liệu mang lại hiệu suất cao và hiệu quả về năng lượng.

Ông là người đứng đầu của Hạ tầng biên tại Equinix – một nhà cung cấp dịch vụ toàn cầu, quản lý hơn 240 trung tâm dữ liệu và cam kết trở thành tổ chức đầu tiên trong lĩnh vực của mình trung lập với khí hậu.

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

“Chúng tôi có 10.000 khách hàng trông cậy vào mình để được giúp đỡ trong hành trình này. Họ yêu cầu nhiều dữ liệu hơn và thông minh hơn, thường là với AI và họ muốn nó theo một cách bền vững” – Smith cho biết.

Đánh dấu tiến độ về hiệu quả

Tính đến tháng 4, Equinix đã phát hành 4,9 tỷ USD trái phiếu xanh. Chúng là những công cụ ở cấp độ đầu tư mà Equinix sẽ áp dụng để giảm thiểu tác động môi trường thông qua việc tối ưu hóa hiệu quả sử dụng năng lượng (PUE), một số liệu ngành về lượng năng lượng mà trung tâm dữ liệu sử dụng trực tiếp đến các tác vụ tính toán.

Các nhà vận hành trung tâm dữ liệu đang cố gắng giảm tỷ lệ đó gần hơn với mức lý tưởng là 1.0 PUE. Các cơ sở của Equinix có mức trung bình là 1.48 PUE với các trung tâm dữ liệu mới tốt nhất đạt mức dưới 1.2.


Equinix đang đạt được tiến độ ổn định trong hiệu quả năng lượng của trung tâm dữ liệu của mình được đo bằng PUE (inset).

Trong một bước tiến khác, Equinix đã mở ra một cơ sở chuyên dụng vào tháng 1 để theo đuổi các cải tiến trong hiệu quả năng lượng. Một phần của công việc đó là tập trung vào việc làm mát bằng chất lỏng.

Ra đời trong kỷ nguyên của máy tính lớn (mainframe), làm mát bằng chất lỏng đang trưởng thành trong thời đại của AI. Nó hiện được sử dụng rộng rãi bên trong các siêu máy tính nhanh nhất thế giới với kiểu dáng hiện đại được gọi là làm mát chip trực tiếp (direct-chip cooling).

Làm mát bằng chất lỏng là bước tiếp theo trong Điện toán tăng tốc cho các GPU NVIDIA vốn đã mang lại hiệu quả năng lượng tốt hơn gấp 20 lần trên các công việc HPC và suy luận AI so với CPU.

Hiệu quả thông qua tăng tốc

Nếu bạn chuyển đổi tất cả các máy chủ chỉ dùng CPU chạy AI và HPC trên toàn thế giới sang các hệ thống được tăng tốc bằng GPU, bạn có thể tiết kiệm được lượng năng lượng khổng lồ – 11 nghìn tỷ W/h mỗi năm. Điều đó giống như tiết kiệm năng lượng mà hơn 1.5 triệu gia đình tiêu thụ trong một năm.

Hôm nay, NVIDIA bổ sung vào những nỗ lực bền vững của mình với việc phát hành GPU PCIe trung tâm dữ liệu sử dụng công nghệ làm mát chip trực tiếp đầu tiên của mình

Equinix nhận thấy GPU A100 80GB PCIe Liquid-Cooled là đủ tiêu chuẩn để sử dụng trong các trung tâm dữ liệu của mình như một phần của cách tiếp cận toàn diện để làm mát và thu nhiệt bền vững, các GPU sẽ có sẵn vào mùa hè này.

Tiết kiệm nước và điện năng

Smith cho biết: “Điều này đánh dấu GPU làm mát bằng chất lỏng đầu tiên được giới thiệu đến phòng thí nghiệm của chúng tôi và điều đó thật thú vị vì khách hàng của chúng tôi khao khát những cách bền vững để khai thác AI”.

Các nhà vận hành nhắm đến việc loại bỏ các thiết bị làm lạnh làm bay hơi hàng triệu gallon nước mỗi năm để làm mát không khí bên trong các trung tâm dữ liệu. Làm mát bằng chất lỏng sẽ giúp tái chế một lượng nhỏ chất lỏng trong các hệ thống kín, tập trung vào các điểm nóng chính.

“Chúng tôi sẽ biến chất thải thành tài sản”.

Cùng hiệu suất, ít điện năng hơn

Trong các thử nghiệm riêng biệt, cả Equinix và NVIDIA đều nhận thấy một trung tâm dữ liệu sử dụng làm mát bằng chất lỏng có thể chạy cùng một khối lượng công việc như cơ sở vật chất làm mát bằng không khí trong khi sử dụng ít năng lượng hơn khoảng 30%. NVIDIA ước tính trung tâm dữ liệu làm mát bằng chất lỏng có thể đạt 1.15 PUE, thấp hơn nhiều so với 1.6 của làm mát bằng không khí.

Các trung tâm dữ liệu liquid-cooled cũng có thể chứa gấp đôi lượng máy chủ trong cùng một không gian. Đó là bởi vì các GPU A100 này chỉ sử dụng một slot PCIe còn các GPU air-cooled A100 thì phải mất đến hai.


Tiết kiệm năng lượng, mật độ nhờ làm mát bằng chất lỏng.

Ít nhất một chục nhà sản xuất hệ thống có kế hoạch kết hợp các GPU này vào sản phẩm của họ vào cuối năm nay. Họ bao gồm ASUS, ASRock Rack, Foxconn Industrial Internet, GIGABYTE, H3C, Inspur, Inventec, Nettrix, QCT, Supermicro, Wiwynn và xFusion.

Xu hướng toàn cầu

Các quy định thiết lập những tiêu chuẩn tiết kiệm năng lượng đang chờ xử lý ở châu Á, châu Âu và châu Mỹ. Điều đó cũng thúc đẩy các ngân hàng và các nhà vận hành trung tâm dữ liệu lớn khác để đánh giá khả năng làm mát bằng chất lỏng.

Và công nghệ này không giới hạn ở trung tâm dữ liệu. Ô tô và các hệ thống khác cần nó để làm mát các hệ thống hiệu suất cao tích hợp trong các không gian hạn chế.

Con đường đến sự bền vững

Smith cho biết: “Đây là bước khởi đầu của một hành trình”.

Thật vậy, chúng tôi có kế hoạch theo sát card A100 PCIe với một phiên bản vào năm sau, sử dụng GPU H100 Tensor Core dựa trên kiến ​​trúc NVIDIA Hopper. Chúng tôi có kế hoạch hỗ trợ làm mát bằng chất lỏng trong các GPU data center hiệu suất cao và nền tảng NVIDIA HGX của mình trong tương lai gần.

Để có thể ứng dụng nhanh chóng, các GPU làm mát bằng chất lỏng phải cung cấp hiệu suất tương tự nhưng sử dụng ít năng lượng hơn. Trong tương lai, chúng tôi hy vọng những card này sẽ cung cấp tùy chọn để đạt được hiệu suất cao hơn cho cùng một mức năng lượng, điều mà người dùng luôn mong muốn.

Smith cho biết: “Việc chỉ đo lường công suất là không liên quan, hiệu suất mà bạn nhận được đối với tác động carbon mà bạn có là điều mà chúng tôi cần hướng tới”.

Theo NVIDIA

____
Bài viết liên quan

Góp ý / Liên hệ tác giả