Trí tuệ nhân tạo, machine learning, deep learning ngày nay không “ma thuật” như chúng ta nghĩ

Các công nghệ “AI” ngày nay không còn gì đó ma thuật như cách chúng ta cảm nhận cách đây vài năm. Các thuật toán có thể hiểu được video clip, hình ảnh, lời nói và văn bản, dịch giữa các ngôn ngữ với độ chính xác kỳ lạ, lái xe, chơi trò chơi video, tìm ra bệnh ung thư và thậm chí là “người” giỏi nhất trong các trò chơi chiến lược phức tạp. Các mốc mới đột phá được vượt qua gần như hàng ngày. Các chương trình khoa học máy tính bị ngập lụt với các sinh viên mong muốn trở thành chuyên gia AI và các công ty không thể thuê đủ người lập trình AI. Có vẻ như thời đại của trí tuệ nhân tạo đã thực sự đến. Trên thực tế, thuật toán AI ngày nay không gì khác ngoài thuật toán học máy truyền thống. Ngay cả những hệ thống mạnh mẽ nhất cũng mang tính “nghệ sỹ” hơn là khoa học, chúng đòi hỏi một lượng lớn dữ liệu được sắp xếp cẩn thận mà từ đó có thể thừa hưởng những đánh giá (bias) có ý nghĩa, phần lớn không thể khái quát hóa ngoài phạm vi chúng đã được đào tạo, là những chiếc “hộp đen” (black box) mà ngay cả người tạo ra nó cũng không hiểu hết.

Trong một nửa thập kỷ kể từ khi sự trổi dậy của học tập sâu thâm nhập vào nhận thức của công chúng với những kỳ công đột phá, nó dường như đã làm mờ đi tất cả những nỗ lực quan trọng trước đó, AI đã đến để giữ lấy chiến công như trong thần thoại. Các viện nghiên cứu tổ chức các hội nghị “hệ thống thông minh”, tài liệu quảng cáo tiếp thị giới thiệu giải pháp AI cho mọi vấn đề, giới truyền thông không ngừng công bố các bước phát triển mới về tính ưu việt của AI, bên cạnh đó là những lo lắng chung về cuộc cách mạng AI. Không có tuần nào trôi qua mà không có một tài liệu học thuật hoặc bài viết nghiên cứu nào ghi lại bước đột phá trong thuật toán hay ứng dụng trong AI. Các công ty lớn thực hiện chiến lược thay thế dần cơ sở hạ tầng cho các thuật toán hiện tại của họ bằng các hệ thống học tập sâu mới.

Dường như tương lai là đây!

Mạnh mẽ và hiệu năng cao như các hệ thống học tập sâu hiện nay, chúng vẫn chỉ làm nhiệm vụ trích xuất các mẫu hình. Một hệ thống hình ảnh máy tính có thể lấy một tập các ảnh về mèo và “học” cách để nhận ra con mèo. “Học tập chuyển giao” có thể được sử dụng để dạy cho nó để nhận ra chó với một tập hình ảnh nhỏ hơn cho việc rèn luyện. Tuy nhiên, thuật toán bên dưới không hề nhận thức gì về những gì nó đang nhìn thấy, nó chỉ đơn thuần làm công việc phân rã hình ảnh thành các màu sắc, mẫu hình và khuôn dạng riêng biệt và liên kết các dấu hiệu trực quan cụ thể với nhãn dạng text. Nó không thể khái quát hóa từ những gì nó thấy để tự động mở rộng vốn từ vựng của mình sang động vật có vú mới hoặc hiểu khái niệm “lông thú” hoặc “bàn chân” ngay cả khi nó kết hợp một hình dạng bề mặt cụ thể và bốn hình dạng phân bố hình chữ nhật với hình ảnh đã thấy.

Việc thiếu khả năng nhận thức là lý do mà thuật toán AI dễ bị đánh lừa. Thực hiện vài thay đổi một cách tinh ý cho hình ảnh là bạn có thể dễ dàng tạo hình ảnh của một chú chó xuất hiện dưới dạng hình ảnh của xe buýt hoặc một biển báo Stop được trả về dưới dạng tạp âm. Đó là lý do các thuật toán dễ bị xáo trộn bởi dữ liệu đầu vào bị bóp méo bởi các nhận định sai, mù quáng “học hỏi” tất cả các nhận định và sai lầm của con người mà chúng ta chuyển sang AI để vượt lên chính chúng ta. Dù vậy, dưới hình thức AI chúng ta có thể ghi chép và khắc phục các nhận định sai nếu chúng ta đủ sáng tạo để nhìn thấy chúng.

Vấn đề lớn hơn là việc tạo ra các mô hình học tập sâu ngày nay mang tính nghệ sỹ hơn rất nhiều so với khoa học. Trái ngược với nhận thức phổ biến, việc xây dựng mạng nơron không đơn giản như việc nhấp vào nút “Xây dựng mô hình” và chỉ hệ thống đến một tập hình ảnh được dán nhãn chú thích. Có vô số quyết định được thực hiện và các thông số cần được điều chỉnh. Từ cách dữ liệu đầu vào được chuẩn bị, cân đối và sắp xếp, đến việc xây dựng mô hình và các thành phần dựa trên việc điều chỉnh mô hình đó, xây dựng mô hình học tập sâu hiện đại là sự lai tạo giữa thí nghiệm cường độ cao và kinh nghiệm tốt và hướng các tiến trình tới các điểm khởi đầu .

Vấn đề trở nên tồi tệ hơn khi các bộ công cụ và thuật toán nền tảng đang đi quá nhanh đến mức tuy nó mang lại kết quả rất tốt trong tháng này nhưng có thể hoàn toàn thất bại vào tháng kế tiếp với bản phát hành mới. Các phương pháp và thuật toán được đề xuất thay đổi với tốc độ chóng mặt. Hãy tập trung một nhóm gồm mười chuyên gia dày dặn và bạn có thể nhận được mười cách tiếp cận cực kỳ khác nhau! Ngay cả khi tìm kiếm các quan điểm về AI các nhà lãnh đạo có thể nhận được những lời khuyên khó hiểu và mâu thuẫn nhau khi các chuyên gia đụng độ với các phương pháp tốt nhất của riêng họ. Trong khi đó, các vườn ươm AI tung ra các tài liệu dựa vào cách tiếp cận mà các công ty sở hữu nó đã công khai ngưng hỗ trợ và bắt đầu loại bỏ khỏi các software framework của họ.

Tóm lại, lĩnh vực này đang tiến rất nhanh đến mức ngay cả những công ty tiên phong cũng không thể theo kịp. Trạng thái non trẻ và tập trung nghiên cứu là chính của AI đồng nghĩa với lĩnh vực này vẫn còn đang được “phát minh” ngay cả khi nó đang được đưa vào phục vụ thương mại.

Các thuật toán AI đang bắt đầu đưa ra những quyết định mang tính sống còn cho chúng ta ngay cả khi người tạo nó cũng không thể giải thích hết vì sao chúng đưa ra các quyết định đó, hoặc thậm chí không chắc là sai chỗ nào.

Sự phổ biến của AI đã làm cho việc tạo mô hình trở nên dễ dàng, nhưng vẫn còn rất khó để tạo ra các mô hình tốt.

Việc xây dựng một mô hình học tập sâu cơ bản trên một nền tảng như TensorFlow khá đơn giản. Thư việc code mẫu và các hướng dẫn phong phú giúp cho một lập trình viên có kỹ năng vừa đủ có thể xây dựng một mô hình cơ bản một cách nhanh chóng. Vấn đề là vẫn còn một khoảng cách xa, tính theo cấp số nhân, giữa mô hình “hello world” cơ bản này và độ chính xác cần thiết của một hệ thống dành cho môi trường production. Ở cấp độ cao nhất, kỹ năng ít quan trọng bằng kinh nghiệm trong việc quyết định chọn những thành phần (component) và thông số nào phù hợp cho tập dữ liệu nào và vấn đề cần ứng dụng.

Các công ty điện toán đám mây đang giải quyết vấn đề này bằng cách cung cấp thư viện các mô hình có sẵn có thể được sử dụng ngay lập tức, cung cấp độ chính xác tốt nhất và thường xuyên được cập nhật. Cho phép khả năng tùy biến các mô hình này, các công cụ như AutoML hỗ trợ tốt cho việc học tập chuyển giao (transfer learning) để cho phép người dùng phi kỹ thuật nhanh chóng xây dựng mô hình cho từng khách hàng cụ thể mà không cần phải hiểu bất kỳ nguyên tắc deep learning bên dưới nào. Đối với những khách hàng có đội ngũ deep learning của riêng họ, các thư viện của các mô hình và thành phần dựng sẵn có thể được sử dụng theo dạnh plug-n-play để xây dựng các hệ thống dựng sẵn tốt nhất.

Tổng kết lại, lui lại một bước ra khỏi sự hô hào và cường điệu hóa, xây dựng một pipeline cho lĩnh vực deep learning hiện đại cũng không khác biệt nhiều so với việc xây dựng hệ thống machine learning truyền thống. Làm sạch dữ liệu, chuẩn bị và sắp xếp mẫu (sample), lựa chọn thuật toán và điều chỉnh tham số là tất cả các “công thức nấu nướng” của machine learning, điều đã có từ rất lâu trước cuộc cách mạng về deep learning. Các phương pháp học tập sâu có khả năng đạt được độ chính xác cao hơn nhiều so với các phương pháp tiếp cận trước đây, nhưng cuối cùng chúng chỉ đơn thuần là các hệ thống khai thác mẫu. Chúng xác định và mã hóa các mẫu cơ bản, thay vì khái quát hóa từ các yếu tố đầu vào của chúng, thành một mô hình trừu tượng của thế giới xung quanh.

Cho đến thời điểm hiện tại, các hệ thống deep learning ngày nay ít “AI” hơn so với các cỗ máy trích xuất mẫu hình. Cũng như bất kỳ hệ thống machine learning nào, chúng có thể xác định các mẫu hình bên trong dữ liệu đào tạo và vận dụng các mẫu hình đó cho các dữ liệu trong tương lai. Chúng không thể lý giải về dữ liệu đầu vào hoặc khái quát hóa để trừu tượng hóa ở mức cao hơn, mà ở đó cho phép chúng hiểu rõ hơn về dữ liệu. Tóm lại, trong khi chúng có thể thực hiện những kết quả ấn tượng, hệ thống deep learning vẫn còn rất hạn chế, sự “mong manh dễ vỡ” có thể bộc lộ ra theo những cách rất bất ngờ.

Xét cho cùng, “AI” của cuộc cách mạng deep learning ngày nay vẫn chỉ là machine learning của hàng thập kỷ trước, chứ không phải sự “ảo diệu” nào hơn.

Lược dịch từ Forbes

Liên hệ tác giả