Một góc nhìn về khả năng tăng tốc của GPU so với CPU – Một ngày của nhà Khoa học Dữ liệu AI

Khi một người phát triển phần mềm truyền thống chuyển hướng sang phát triển các phần mềm AI, lúc đầu họ không quan tâm nhiều việc sử dụng CPU hay GPU với hệ thống train cho máy. Có thể khối lượng dữ liệu chưa nhiều chưa cần đến tăng tốc hoặc cho rằng máy chủ CPU đã là đủ hoặc chưa muốn thay đổi các thư viện cũ.

Việc này đã ảnh hưởng đến sự thành công của dự án AI hay bi quan hơn dự án AI sẽ thành món đồ chơi nhất thời. Nó cũng làm tốn rất nhiều sức lực của các nhà khoa học dữ liệu.

Chúng ta hãy nhìn một hình ảnh mô tả một ngày làm việc của nhà khoa học dữ liệu khi sử dụng CPU và GPU để cân nhắc thay đổi hướng sử dụng nền tảng và các model xây dựng AI:

Hình 1- Một ngày trong đời sống của nhà khoa học dữ liệu AI.

Trong hình ảnh đó mô hình chạy trên GPU giảm khâu data preparation, tăng quá trình train, tiết kiệm thời gian công sức cho các nhà khoa học dữ liệu. Đặc biệt, Machine Learning/ Deep Learning trên GPU luôn đạt tốc độ nhanh chóng và chính xác hơn hàng chục đến hàng trăm lần CPU.

Các mô hình AI chạy trên GPU gần như chiếm lĩnh trên thị trường. Các công nghệ GPU và công nghệ xung quanh GPU như NVIDIA Tesla, NVLINK, NVSWITCH… nhằm tăng tốc AI đã phát triển mạnh mẽ. NVIDIA DGX là dòng sản phẩm tích hợp phần cứng và các phần mềm phát triển AI dẫn đầu về hướng AI sử dụng GPU.

Theo như hình ảnh trên, chúng ta nên lựa chon GPU để dự án AI thành công thay vì CPU.

Liên hệ tác giả