GauGAN là gì? Cách AI biến Lời nói và Hình ảnh của bạn thành nghệ thuật tuyệt đẹp

GauGAN, một bản demo AI để tạo hình ảnh chân thực, cho phép bất kỳ ai cũng có thể tạo ra những cảnh quan tuyệt đẹp bằng cách sử dụng mạng sáng tạo đối nghịch (Generative Adversarial Networks). Được đặt theo tên của họa sĩ thuộc Trường phái hậu ấn tượng Paul Gauguin, nó đã được tạo ra bởi NVIDIA Research và có thể được trải nghiệm miễn phí thông qua NVIDIA AI Demos.

Cách để sáng tạo với GauGAN

Phiên bản mới nhất của bản demo, GauGAN2, biến bất kỳ sự kết hợp nào giữa lời nói và hình vẽ thành một hình ảnh sống động như thật. Người dùng có thể chỉ cần nhập một cụm từ như “hồ trước núi” và nhấn nút để tạo cảnh trong thời gian thực. Bằng cách điều chỉnh văn bản thành “hồ trước núi tuyết” hoặc “rừng trước núi”, mô hình AI sẽ ngay lập tức sửa đổi hình ảnh.

Các nghệ sĩ thích tự vẽ cảnh có thể sử dụng cọ vẽ thông minh của bản demo để sửa đổi những cảnh được gợi ý bằng văn bản này hoặc bắt đầu lại từ đầu, vẽ trên tảng đá, cây cối hoặc những đám mây mịn. Nhấp vào bộ lọc (hoặc tải lên hình ảnh tùy chỉnh) cho phép người dùng thử nghiệm với các ánh sáng khác nhau hoặc áp dụng một phong cách hội họa cụ thể cho các tác phẩm của họ.

Giải pháp hạ tầng Deep Learning, Trí tuệ Nhân tạo - AI

AI Đằng sau Demo GauGAN2

Trái tim của GauGAN2 là mạng sáng tạo đối nghịch (Generative Adversarial Networks) hay GANs – một loại mô hình học sâu bao gồm một cặp mạng nơ-ron: một generator và một discriminator. Generator tạo các hình ảnh tổng hợp. Discriminator được đào tạo trên hàng triệu hình ảnh phong cảnh thực, cung cấp cho mạng generator phản hồi từng điểm ảnh trong cách khiến cho hình ảnh tổng hợp chân thực hơn.

Theo thời gian, mô hình GAN học cách tạo ra những mô hình bắt chước thế giới thực một cách thuyết phục, với những ngọn núi được phản chiếu trong hồ do AI tạo ra và cây cối rụng hết lá khi một cảnh được sửa đổi bằng từ “mùa đông”.

Khi người dùng vẽ những nét vẽ tự do của riêng họ hoặc sửa đổi cảnh có sẵn trong demo GauGAN2, họ đang làm việc với segmentation maps – các bản phác họa cấp độ cao ghi lại vị trí của các đối tượng trong một cảnh. Các khu vực riêng lẻ được gắn nhãn với các đặc điểm như cát, sông, cỏ hoặc hoa, cung cấp cho mô hình AI hướng dẫn cách điền vào cảnh.

GauGAN đã cực kỳ phổ biến kể từ khi ra mắt tại NVIDIA GTC vào năm 2019 – nó được sử dụng bởi các giáo viên mỹ thuật trong các trường học, các bảo tàng như một triển lãm nghệ thuật tương tác bởi hàng triệu người trực tuyến.

Các giám đốc nghệ thuật và nghệ sĩ ý tưởng từ các hãng phim và công ty trò chơi điện tử hàng đầu là một trong những chuyên gia sáng tạo quan tâm đến GauGAN như một công cụ để tạo ra các ý tưởng nguyên mẫu cho công việc của họ. Vì vậy, NVIDIA Studio, một nền tảng hỗ trợ các nhà sáng tạo, đã ra mắt một ứng dụng dành cho máy tính để bàn: NVIDIA Canvas.

NVIDIA Canvas mang công nghệ đằng sau GauGAN đến các chuyên gia ở một định dạng tương thích với các công cụ hiện có như Adobe Photoshop và cho phép các nghệ sĩ sử dụng các GPU NVIDIA RTX để có trải nghiệm tương tác, linh hoạt hơn.

Để tìm hiểu thêm về AI đằng sau GauGAN, đăng ký miễn phí cho NVIDIA GTC và theo dõi phiên “Diễn đạt trí tưởng tượng của bạn với GauGAN2”, Thứ Năm, ngày 24 tháng 3, lúc 10 giờ sáng theo giờ Thái Bình Dương.

NVIDIA GTC trực tuyến từ ngày 21 đến 24 tháng 3. Để nghe thông tin mới nhất về nghiên cứu AI, hãy theo dõi bài phát biểu quan trọng của Giám đốc điều hành NVIDIA Jensen Huang vào ngày 22 tháng 3 lúc 8 giờ sáng theo giờ Thái Bình Dương.

Theo NVIDIA

____
Bài viết liên quan

Góp ý / Liên hệ tác giả