NVIDIA GTC Fall 2022 - Tóm tắt bài phát biểu chính - Blog

Dưới đây là phần tóm tắt cho bài phát biểu quan trọng của NVIDIA GTC Fall 2022, một sự kiện chuyên sâu về AI và công nghệ GPU do NVIDIA tổ chức, diễn ra trực tuyến từ ngày 19 – 22 tháng 9 năm 2022.

Bài viết được ghi lại theo trình tự trực tiếp từ sự kiện.

NVIDIA GTC Fall 2022 Keynote

Trong bản tóm tắt này, chúng ta kỳ vọng sẽ được nghe về các GPU mới và các ứng dụng mới của RTX, AI và Omniverse. Có thể có thông tin về chip mới và các dịch vụ đám mây.

NVIDIA RTX 4000 Ada Lovelace

NVIDIA Ada Lovelace là nền tảng RTX thế hệ thứ 3. GPU mới được xây dựng trên TSMC 4N 76B và 18000 nhân CUDA, nhiều hơn 70% so với thế hệ RTX 3000.

NVIDIA Ada Lovelace Slide 1

Các shader (trình tạo bóng) mới có năng lực lên đến 90 TFLOPS. Một bộ xử lý streaming mới có Shader Execution Reodering (SER) mà NVIDIA ví như bộ thực thi out-of-order cho CPU.

Các lõi RT thế hệ thứ 3 mới nhanh hơn với 200 RT TFLOPS. Ngoài ra còn có các lõi tensor thế hệ thứ 4 với năng lực lên đến 1400 Tensor TFLOPS và bộ tăng tốc luồng quang học để giúp khung hình mượt mà.

NVIDIA cũng có một số phát minh để giúp tính năng Ray Tracing trở nên phổ biến hơn.

Những đổi mới ở NVIDIA Ada Lovelace RTX

Với DLSS 3, bạn có thể làm được nhiều việc hơn mà không cần sử dụng GPU rendering chính hoặc thậm chí cả CPU pipelines.

Một thứ mà NVIDIA đang thúc đẩy gần đây là Omniverse. Nó đã tìm ra một cách thông minh để đưa mọi người đến với nền tảng này. Nó có RTX Remix cho phép bạn tải game, sao chụp lại game bằng USD (Universal Scene Description), sau đó trong Omniverse, bộ công cụ RTX Remix có thể chỉnh sửa các texture và giúp người sửa đổi tạo vật liệu thông qua AI.

NVIDIA RTX Remix

Tiếp theo, người ta có thể xuất ra bản mod và chơi nó. Điều này thực sự khôn khéo vì nó là một gateway để thu hút các nhà phát triển và nghệ sĩ trên Omniverse.

Ảnh chụp màn hình NVIDIA RTX Remix

Dưới đây là các khu vực hiệu suất mà NVIDIA mong đợi sẽ đạt được và mức tiêu thụ điện năng.

Hiệu suất và sức mạnh NVIDIA Ada Lovelace

Bây giờ đã đến lúc dành cho GPU.

Jensen với NVIDIA GeForce RTX 4090 trong tay

Đây là GeForce RTX 4090:

Tổng quan về NVIDIA RTX 4090

Có vẻ như không có thêm bộ nhớ ở thế hệ này.

Đây là GeForce RTX 4080:

Tổng quan về NVIDIA GeForce RTX 4080

Vì NVIDIA đang bắt đầu làm mới với các phiên bản cao cấp hơn, đây là sơ bộ GeForce RTX mới:

NVIDIA GeForce RTX Q4 2022

Sau thông báo này, NVIDIA đã trình bày nhiều hơn về Omniverse. Đó là một chủ đề lớn cho công ty trong thời gian sắp tới.

NVIDIA Omniverse

NVIDIA Omniverse là nền tảng của công ty dành cho thế giới kỹ thuật số mà công ty hy vọng sẽ mở rộng mọi thứ từ các “digital twins” (phiên bản số hóa), đến gaming, mô phỏng và hơn thế nữa.

NVIDIA GTC Fall 2022 Keynote – Omniverse

Trong suốt bài keynote, họ đã công bố các tính năng mới cho nền tảng này, bao gồm hỗ trợ cho GPU Ada Lovelace.

NVIDIA GTC 2022 Fall Keynote – Các cập nhật mới của Omniverse

Cuối cùng, Omniverse cần một thành phần đám mây để cộng tác.

NVIDIA GTC 2022 Fall Keynote – Omniverse Cloud Computer

Và chúng ở đây.

NVIDIA GTC 2022 Fall Keynote – Omniverse Cloud

Đây là công bố đầu tiên trong số nhiều thông tin về cloud mà NVIDIA sẽ đưa ra hôm nay và trong tương lai gần.

Cập nhật mới NVIDIA Drive với Thor

Trước đây, NVIDIA đã lên lịch ra mắt cho nền tảng Atlan vào năm 2024. Nhưng bây giờ không còn thấy nữa và được thay thế bằng Thor, với hiệu suất gấp đôi Atlan trong cùng mốc thời gian.

NVIDIA GTC Fall 2022 Keynote – Thor thay thế Atlan

Điều này sẽ mang GPU thế hệ tiếp theo, cùng với các lõi được tăng cường sức mạnh Grace Neoverse V2 mới, tiến lên nền tảng robot thế hệ tiếp theo, trước đây là Orin, là nền tảng hiện nay.

NVIDIA GTC Fall 2022 Keynote – NVIDIA Drive Thor

Một phần ý tưởng ở đây là nền tảng mới có thể được sử dụng để cung cấp sức mạnh cho lĩnh vực thông tin giải trí cũng như các tính năng hỗ trợ lái xe. Nó cũng có khả năng xử lý multi-domain để nó có thể chạy chẳng hạn như Linux, QNX và Android, cùng một lúc.

Ngày nay, có rất nhiều máy tính khác nhau trên ô tô.

NVIDIA GTC Fall 2022 Keynote – Các máy tính khác nhau ngày nay trên ô tô

Trong tương lai, NVIDIA cho rằng Thor có thể thay thế phần lớn, nếu không muốn nói là tất cả. Điều đó có nghĩa là tiêu thụ điện năng thấp hơn và yêu cầu về trọng lượng / kích thước đối với máy tính cũng như hệ thống dây điện cũng thấp hơn.

NVIDIA GTC Fall 2022 Keynote – Thor thay thế nhiều máy tính

NVIDIA nói rằng NVLink C2C giúp kết nối nhiều chip Thor cho các ứng dụng cần nhiều sức mạnh xử lý hơn.

NVIDIA cho biết NVIDIA Drive Orin thế hệ hiện tại của họ đã có hơn 40 chiến thắng về thiết kế cho đến thời điểm này.

NVIDIA GTC Fall 2022 Keynote – NVIDIA Drive Orin

Orin đang ở trong Máy chủ Metropolis Edge AI Orin.

NVIDIA GTC 2022 Fall Keynote – Metropolis Edge AI Server

Nó cũng là trung tâm của NVIDIA IGX Orin. Đây là nền tảng mATX kết hợp hai cổng ConnectX-7 (400Gbps) và sẽ được sử dụng trong một số ứng dụng mới, bao gồm cả y tế.

NVIDIA GTC Fall 2022 Keynote – NVIDIA IGX Orin

IGX Orin này có lẽ là nền tảng thú vị nhất tại GTC 2022, bên cạnh dòng RTX 4000.

Mô phỏng NVIDIA Isaac cho robot cũng có sẵn dưới dạng dịch vụ đám mây.

Hệ thống điện toán tăng tốc của NVIDIA trong Datacenter Stack

Đây là slide thiết lập cho phần tiếp theo.

NVIDIA GTC Fall 2022 Keynote – NVIDIA Scaling

NVIDIA RAPIDS có thể được sử dụng trên Windows WSL. Nó cũng hỗ trợ máy chủ Arm. Công ty cho biết RAPIDS cũng sẽ đến với Apache Spark.

Máy chủ suy luận NVIDIA Triton đang được mở rộng với 50 tính năng mới. Nó bao gồm suy luận mô hình ngôn ngữ lớn.

NVIDIA GTC Fall 2022 Keynote – Triton

NVIDIA đưa ra các phần mềm và các công ty sử dụng phần mềm của NVIDIA. Chúng ta sẽ bỏ qua các phân đoạn này.

Một trong những thông báo lớn hơn được gắn với các mô hình ngôn ngữ lớn khi chúng phát triển về mức độ phức tạp và quy mô.

NVIDIA GTC Fall 2022 Keynote – Các mô hình ngôn ngữ lớn đang phát triển

NVIDIA sẽ cung cấp một dịch vụ có thể sử dụng các mô hình ngôn ngữ lớn và tùy chỉnh chúng với số lượng ít nhất là 500 cặp đầu vào.

NVIDIA GTC Fall 2022 Keynote – Tùy chỉnh các mô hình ngôn ngữ lớn

Sau đó, nó sẽ cung cấp đầu ra dưới dạng dịch vụ API. Lợi thế cho một công ty là họ có thể đào tạo các mô hình mà không cần có các cụm GPU lớn. Đối với NVIDIA, đây có thể là một ngành kinh doanh có tỷ suất lợi nhuận cực cao vì khách hàng dựa vào nó để lưu trữ các mô hình AI ở trung tâm của các chức năng kinh doanh.

NVIDIA GTC 2022 Fall Keynote – NeMo LLM Service

NVIDIA sẽ có một phiên bản khác cho y tế và những thứ như khám phá thuốc. Đó sẽ là BioNeMo. Cả hai dịch vụ NeMo sẽ được chạy thử trên NVIDIA SuperPod vào tháng 10 năm 2022. NVIDIA cho biết H100 nhanh hơn ~ 5 lần so với A100 đối với các mô hình ngôn ngữ lớn do các transformer engine.

NVIDIA H100 trong Bản cập nhật production

Về NVIDIA H100, nó đang được sản xuất. Nó sẽ được bán ra vào tháng 10 thông qua các phiên bản PCIe.

NVIDIA GTC Fall 2022 Keynote – NVIDIA H100 đang được sản xuất

Các nền tảng dựa trên HGX với mô-đun SXM sẽ nằm trong Q1, do đó sẽ bao gồm các máy như DGX H100.

NVIDIA H100 tại văn phòng NVIDIA tháng 4 năm 2022

Tiếp theo với NVIDIA Grace.

Chi tiết về NVIDIA Grace

NVIDIA cho biết Grace Hopper sắp ra mắt của họ sẽ lý tưởng cho các hệ thống đề xuất có nhu cầu về bộ nhớ có tốc độ nhanh, hơn là về dung lượng.

NVIDIA GTC 2022 Fall Keynote – Grace Hopper

Đây là chip Grace Hopper mới với các lõi Arm Neoverse V2:

NVIDIA GTC 2022 Fall Keynote – Grace Hopper với các đột phá

Nhiều thông số kỹ thuật chúng tôi đã có. NVIDIA thông báo rằng các hệ thống với Grace Hopper sẽ có sẵn trong nửa đầu năm 2023. Chúng tôi coi điều đó có nghĩa là vào quý 2 năm 2023.

NVIDIA GTC 2022 – Grace Hopper systems vào 1H 2023

Rất thú vị với Grace và Grace Hopper.

GPU NVIDIA L40 cho Omniverse

Đối với Omniverse, có một GPU L40 mới với 48GB bộ nhớ.

NVIDIA GTC Fall 2022 Keynote – GPU NVIDIA L40

Đây là card PCIe mà NVIDIA cho biết đang được sản xuất chính thức. Chúng tôi đã từng hỏi NVIDIA về điều này vài tuần trước, và cuối cùng họ cũng thừa nhận rằng đó sẽ là dòng GPU mới sẽ ra mắt.

Lời cuối cùng

NVIDIA RTX 4000 series và L40 dựa trên Ada Lovelace là những cải tiến lớn so với các thế hệ trước. Ngoài ra, Orin IGX cũng rất thú vị. Có lẽ tác động lớn hơn là NVIDIA đang tập trung vào việc cung cấp các dịch vụ đám mây. Cuối cùng, NVIDIA sẽ sử dụng các dịch vụ đám mây như NeMo và Omniverse để tạo ra sự kết dính lớn vào hệ sinh thái NVIDIA và cả các cơ hội có tỷ suất lợi nhuận cao hơn. Cuối cùng, NVIDIA sẽ xem xét lợi nhuận khổng lồ mà các nhà cung cấp dịch vụ đám mây và nhà cung cấp phần mềm có được và nhận ra rằng họ có thể kiếm tiền tốt hơn từ nhiều hàm xử lý (function) được tăng tốc bởi GPU bằng cách chỉ cần “host” các function đó. Đó là những gì chúng ta đang bắt đầu thấy ngày hôm nay.

Xem toàn bộ video bài phát biểu:

Nguồn STH

Nhất Tiến Chung (NTC) hiện là nhà cung cấp các giải pháp hạ tầng CNTT, Điện toán Hiệu năng cao (HPC) cho AI với kinh nghiệm kinh doanh phần cứng từ năm 2005. Chúng tôi là đối tác NPN cấp Elite (2022) chính thức của NVIDIA cho các hệ thống DGX (DGX A100, DGX Station A100) và hệ thống cụm siêu máy tính DGX SuperPOD với sức mạnh lưu trữ song song của DDN và kết nối mạng tốc độ cao từ hãng Mellanox (thuộc NVIDIA).

____
Bài viết liên quan