Giới thiệu GPU NVIDIA A40: GPU mạnh mẽ nhất cho Desktop, Data Center và Cloud

GPU NVIDIA A40 là một bước đột phá về hiệu suất và khả năng kết hợp multi-workload trong trung tâm dữ liệu, kết hợp năng lực đồ họa mạnh mẽ nhất với khả năng tăng tốc xử lý cho AI để đáp ứng các yêu cầu về thiết kế, sáng tạo và nghiên cứu khoa học ngày nay. Nó cũng thúc đẩy sự ra đời thế hệ tiếp theo của các máy trạm ảo (virtual workstation) và các workload dựa trên máy chủ. NVIDIA A40 mang đến các tính năng hiện đại cho ray-traced rendering, mô phỏng, sản phẩm ảo và vô vàng các ứng dụng khác.

Thông số cơ bản: 48GB GDDR6, 696 GB/s, PCIe 4.0, 3x DisplayPort, 1×8-pin 300W

Hiệu năng

Kiến trúc NVIDIA Ampere

NVIDIA A40 là GPU cho máy trạm mạnh mẽ nhất cung cấp tính năng ray tracing thời gian thực hiệu năng cao, tăng tốc AI và kết xuất đồ họa chuyên nghiệp.

Nhân CUDA

Các lõi CUDA của kiến trúc NVIDIA Ampere mang lại FP32 gấp 2 lần so với thế hệ trước, cung cấp các cải tiến hiệu suất đáng kể cho quy trình đồ họa, chẳng hạn như phát triển mô hình 3D và tính toán cho các khối lượng công việc như mô phỏng cho CAE.

RT Core thế hệ 2

Với thông lượng lên đến gấp 2 lần so với thế hệ trước và khả năng chạy đồng thời theo dõi tia với khả năng tạo bóng hoặc làm mờ, RT Cores thế hệ thứ hai cung cấp tốc độ lớn cho khối lượng công việc như kết xuất ảnh thực nội dung phim, đánh giá thiết kế kiến ​​trúc và tạo mẫu ảo của kiểu dáng sản phẩm. Công nghệ này cũng tăng tốc độ hiển thị hiện tượng nhòe chuyển động theo tia để có kết quả nhanh hơn với độ chính xác hình ảnh cao hơn.

Tensor Core thế hệ 3

A40 bao gồm các lõi Tensor nâng cao giúp tăng tốc nhiều loại dữ liệu hơn và bao gồm tính năng Fine-Grained Structured Sparsity mới mang đến thông lượng gấp 2 lần cho ma trận tensor so với thế hệ trước. Hỗ trợ phần cứng cho sự thưa thớt về cấu trúc giúp tăng gấp đôi thông lượng cho hội nghị. Tensor Cores cũng mang AI vào đồ họa với các khả năng như DLSS , AI khử nhiễu và chỉnh sửa nâng cao cho các ứng dụng được chọn.

PCIE Thế hệ 4

PCI Express Gen 4 tăng gấp đôi băng thông của PCIe Gen 3, cải thiện tốc độ truyền dữ liệu từ bộ nhớ CPU cho các tác vụ đòi hỏi nhiều dữ liệu như AI, khoa học dữ liệu và thiết kế 3D. Hiệu suất PCIe nhanh hơn cũng tăng tốc độ truyền truy cập bộ nhớ trực tiếp GPU (DMA), cung cấp khả năng giao tiếp I / O nhanh hơn đối với dữ liệu video giữa GPU và GPUDirect ® cho các thiết bị hỗ trợ Video, mang đến giải pháp mạnh mẽ cho truyền hình trực tiếp. A40 tương thích ngược với PCI Express Gen 3 để triển khai linh hoạt.

Bộ nhớ GDDR6 48GB tốc độ cao

Được xây dựng với bộ nhớ GDDR6 48GB mang lại thông lượng lớn hơn 15% cho khối lượng công việc cần ray-tracing, rendering và AI so với thế hệ trước. Bộ nhớ GDDR6 này siêu nhanh, có thể mở rộng lên đến 96GB với NVLink, mang đến cho các nhà khoa học dữ liệu, kỹ sư và các chuyên gia sáng tạo bộ nhớ lớn cần thiết để làm việc với các bộ dữ liệu và khối lượng công việc lớn như khoa học dữ liệu và mô phỏng.

Error Correcting Code (ECC) trên bộ nhớ đồ họa

Đáp ứng các yêu cầu nghiêm ngặt về tính toàn vẹn dữ liệu cho các ứng dụng quan trọng cho các máy trạm…

NVLink thế hệ 3

Kết nối hai GPU A40 với nhau để mở rộng từ 48GB bộ nhớ GPU lên 96GB. Băng thông kết nối giữa GPU với GPU tăng lên cung cấp một bộ nhớ có thể mở rộng để tăng tốc đồ họa và tính toán khối lượng công việc cũng như giải quyết các tập dữ liệu lớn hơn. Đầu nối NVLink mới, nhỏ gọn hơn cho phép thực hiện chức năng trong nhiều loại máy chủ hơn.

Sẵn sàng cho ảo hóa mật độ cao

Những cải tiến thế hệ tiếp theo với phần mềm GPU ảo NVIDIA (vGPU) cho phép tạo ra các phiên bản máy trạm ảo lớn hơn, mạnh mẽ hơn cho người dùng từ xa, cho phép thiết kế từ xa cao cấp, AI và khối lượng công việc tính toán

Hiệu quả và bảo mật cao cho trung tâm dữ liệu

Với thiết kế hai khe cắm, tiết kiệm điện năng, NVIDIA A40 tiết kiệm điện năng gấp 2 lần so với thế hệ trước và tương thích với nhiều loại máy chủ từ các nhà cung cấp trên toàn thế giới. NVIDIA A40 cũng bao gồm chip CEC 1712 cho phép khởi động an toàn và được đo lường với phần cứng gốc đáng tin cậy, đảm bảo rằng phần sụn không bị giả mạo hoặc bị hỏng.

Hỗ trợ về phần mềm

Phần mềm NVIDIA Virtual GPU

Hỗ trợ phần mềm NVIDIA Virtual GPU (vGPU) cho phép máy trạm cá nhân được tái định vị thành nhiều phiên bản máy trạm ảo hiệu suất cao cho phép người dùng từ xa chia sẻ tài nguyên để thúc đẩy thiết kế cao cấp, AI và tính toán khối lượng công việc.

NVIDIA® Quadro Experience

Quadro Experience cung cấp một bộ công cụ năng suất cho máy trạm để bàn của bạn, bao gồm ghi 4K, cảnh báo tự động về các bản cập nhật trình điều khiển Quadro mới nhất và truy cập các tính năng chơi game.

Phần mềm được tối ưu hóa cho AI

Các khuôn khổ học tập sâu như Caffe2, MXNet, CNTK, TensorFlow và các khuôn khổ khác mang lại thời gian đào tạo nhanh hơn đáng kể và hiệu suất đào tạo đa nút cao hơn. Các thư viện tăng tốc GPU như cuDNN, cuBLAS và TensorRT mang lại hiệu suất cao hơn cho cả ứng dụng suy luận học sâu và Máy tính hiệu suất cao (HPC).

Nền tảng NVIDIA® CUDA® Parallel Computing

Thực thi nguyên bản các ngôn ngữ lập trình tiêu chuẩn như C / C ++ và Fortran và các API như OpenCL, OpenACC và Direct Compute để tăng tốc các kỹ thuật như “ray-tracing”, xử lý video và hình ảnh cũng như tính toán động lực học.

NVIDIA® GPUDirect dành cho video

GPUDirect cho tốc độ Video giao tiếp giữa GPU và các thiết bị I / O video bằng cách tránh các bản sao bộ nhớ hệ thống không cần thiết và chi phí CPU cao.

NVIDIA Enterprise-Management Tools

Tối đa hóa thời gian hoạt động của hệ thống, quản lý liền mạch các triển khai trên quy mô rộng và điều khiển từ xa các cài đặt đồ họa và hiển thị để có các hoạt động hiệu quả.

Thông số kỹ thuật

Architecture Ampere
Foundry Samsung
Process Size 8nm
Transistors 28.3 billion
Die Size 628.4 mm2
CUDA Parallel Processing Cores 10,752
NVIDIA Tensor Cores (3rd Gen) 336
NVIDIA RT Cores (2nd Gen) 84
GPU Memory 48 GB GDDR6 with ECC
Memory Interface 384-bit
Memory Bandwidth 696 GB/s
NVLink 2-way low profile (2-slot)
NVLink Interconnect NVIDIA NVLink 112.5 GB/s (bidirectional)
PCIe Gen4 16 GB/s
Max Power Consumption 300W
Graphics Bus PCI Express 4.0 x16
Display Connectors DP 1.4 (3)
Form Factor 4.4” H x 10.5” L Dual Slot
Product Weight 987g
Thermal Solution Passive
vGPU Software Support NVIDIA GRID®, NVIDIA Quadro® Virtual Data Center Workstation, NVIDIA Virtual Compute Server*
vGPU Profiles Supported 1 GB, 2 GB, 3 GB, 4 GB, 6 GB, 8 GB, 12 GB, 16
GB, 24 GB, 48 GB
NVIDIA® 3D Vision® and 3D Vision Pro Support via 3 pin mini DIN
Frame lock Compatible (with Quadro Sync II)
Power Connector 1x 8-pin CPU
NVENC | NVDEC 1x ENC | 2x DEC (includes AV1 decode)
NEBS Ready Level 3
Secure and Measured Boot with HW Root of
Trust
CEC 1712

→ Xem thêm: Các sản phẩm GPU NVIDIA

Liên hệ tác giả