Quản lý các nhu cầu lưu trữ cho AI của bạn

AI đã trở thành một yếu tố tạo ra lợi thế cạnh tranh đáng kể và một cách để công phá thị trường. Một cuộc khảo sát gần đây của Accenture tiết lộ rằng các công ty đạt được thành tựu từ AI – những công ty nâng cao sự trưởng thành của AI đủ để đạt được sự tăng trưởng vượt trội và chuyển đổi mô hình kinh doanh – phân bổ gần 30% tổng doanh thu của họ cho AI và trở nên vượt trội hơn trong các lĩnh vực bao gồm trải nghiệm và độ trung thành của khách hàng.

Đối với các công ty trong tất cả các ngành, các cơ hội mà AI mang lại có tác động mạnh mẽ theo những cách thiết thực nhất: Hỗ trợ mạnh mẽ các hoạt động của con người trong y học để cung cấp khả năng phát hiện dễ dàng hơn và mang lại kết quả tốt hơn; giảm thiểu rủi ro tài chính bằng cách phát hiện gian lận và các mối đe dọa bảo mật; cải thiện kiểm soát chất lượng công nghiệp với tự động hóa; và đổi mới mọi thứ từ xe cộ đến hệ thống cung cấp thực phẩm, đó chỉ là một vài cách mà AI đang biến đổi thế giới của chúng ta. Cho dù bạn là giám đốc điều hành cấp C hay một nhà khoa học dữ liệu, AI được thừa nhận là nhân tố thay đổi cuộc chơi kinh doanh thực sự.

Được thúc đẩy bởi khả năng truy cập nhiều hơn và tính sẵn có của dữ liệu, kết hợp với hệ thống xử lý hiệu suất cao, tăng cường với các GPU mạnh mẽ, AI đã trở thành một vấn đề ưu tiên của các tổ chức – và ngành công nghệ chủ đạo. Trên thực tế, một cuộc thăm dò ý kiến ​​của Harris cho thấy 55% các công ty báo cáo đang tăng tốc chiến lược AI của họ nhờ tác động của COVID và 67% mong đợi sẽ đẩy nhanh chiến lược AI của họ trong tương lai.

Khuyến mãi máy chủ Dell PowerEdge

Nhưng chỉ vì việc áp dụng AI ngày càng tăng không có nghĩa là không có những thách thức của nó. Nhiều sáng kiến ​​AI của các tổ chức thất bại, không chỉ do thiếu kế hoạch phù hợp mà còn do hạ tầng CNTT không đủ để vượt ra ngoài công đoạn PoC theo cách có hiệu quả về chi phí và khả năng mở rộng. Theo một ước tính, khoảng 80% các dự án AI không bao giờ đi vào giai đoạn sản xuất (production). Tại sao như vậy?

Lưu trữ dữ liệu: Thu hẹp khoảng cách giữa Khoa học dữ liệu và Giải pháp kinh doanh

Khoảng cách giữa giải pháp khoa học dữ liệu và giải pháp kinh doanh là do thiếu cơ sở hạ tầng CNTT được tích hợp và tối ưu hóa. Nó cần được xây dựng chính xác ngay từ đầu và cũng giữ dữ liệu tại chỗ khi từ PoC chuyển sang sản xuất, cho phép cả việc quản lý chất lượng dữ liệu và mở rộng sang các dịch vụ đám mây khác nhau để nâng cao năng suất khoa học dữ liệu.

Đặc biệt, những thách thức với việc lưu trữ và quản lý dữ liệu đòi hỏi phải lập kế hoạch cho việc tăng trưởng dữ liệu để bạn có thể trích xuất giá trị của dữ liệu khi bạn tiến lên, đặc biệt là khi bạn bắt đầu các trường hợp ứng dụng nâng cao hơn như Học sâu và Mạng thần kinh, đòi hỏi nhiều xử lý hơn, cũng như sức mạnh, hiệu suất và quy mô lưu trữ.

Các yêu cầu đối với AI tạo ra nhu cầu về sức mạnh và thông lượng xử lý cao hơn, và Học máy sẽ làm gia tăng các nhu cầu này. Khi hạ tầng của bạn không cho phép bạn mở rộng quy mô xử lý và lưu trữ một cách độc lập, các vấn đề sẽ bắt đầu lộ diện.

  • Thời gian đưa ra thị trường (time-to-market) bị ảnh hưởng đáng kể khi dữ liệu được lưu trữ trên các hệ thống nhỏ, khó mở rộng quy mô. Với không gian hạn chế, bạn phải di chuyển dữ liệu như một phần của quá trình chuẩn hóa và các hệ thống nhỏ hơn yêu cầu dữ liệu được tách và xóa, điều này ảnh hưởng đến độ chính xác của mô hình. Một giải pháp lưu trữ có thể mở rộng quy mô và loại bỏ nhu cầu giới hạn tập dữ liệu sẽ cho phép bạn phát triển các mô hình tốt hơn.
  • Sự tắc nghẽn cổ chai được tạo ra bởi tải xử lý sử dụng nhiều dữ liệu khi bộ lưu trữ không thể mở rộng, điều này làm hạn chế hiệu suất và có thể dẫn đến việc các GPU đắt tiền không hoạt động. Điều này dẫn đến việc các hệ thống lưu trữ khác nhau bị căng thẳng bởi việc sao chép và di chuyển dữ liệu, và do đó, không thể cung cấp hiệu suất cần thiết cho GPU và các công nghệ điện toán nâng cao. Việc nhập dữ liệu bị tắc nghẽn do giới hạn lưu trữ tạo ra sự cản trở sự đổi mới và độ chính xác của mô hình, đồng thời, ảnh hưởng đến năng suất của đội ngũ khoa học dữ liệu.
  • Cần có sự linh hoạt để tận dụng khả năng hỗ trợ nhiều giao thức (bao gồm NFS, SMB, HTTP, FTP, HDFS và S3) cho nhiều trường hợp ứng dụng để đảm bảo rằng bạn có thể đáp ứng nhu cầu của các hệ thống khác nhau, không chỉ GPU cho toàn bộ tải xử lý và không chỉ một loại môi trường học máy AI duy nhất.

Bộ nhớ Dell PowerScale – Tiếp sức cho hành trình AI của bạn

Với khả năng vượt trội về độ trễ thấp, thông lượng cao và quy mô I/O song song lớn, Dell PowerScale là sự bổ sung khả năng lưu trữ lý tưởng cho máy tính được tăng tốc qua GPU cho các tải xử lý AI. PowerScale cho phép bạn rút ngắn hiệu quả thời gian cần thiết để đào tạo và thử nghiệm các mô hình phân tích cho các tập dữ liệu nhiều petabyte. Và, như một lợi ích bổ sung, bộ nhớ PowerScale All-Flash loại bỏ nút thắt cổ chai I/O với băng thông lớn hơn gấp 18 lần và có thể được thêm vào một cụm Isilon hiện có để tăng tốc và mở khóa giá trị của một lượng lớn dữ liệu phi cấu trúc – chìa khóa để phát triển chính xác các mô hình và sáng kiến ​​AI thành công.

Sức mạnh, tính linh hoạt, khả năng mở rộng và các tính năng cấp doanh nghiệp là tiêu chuẩn trên nền tảng PowerScale giúp bạn đáp ứng những thách thức của AI:

  • Tăng tốc đổi mới với hiệu suất nhanh hơn đến 2.7 lần để đẩy nhanh chu kỳ đào tạo mô hình.
  • Loại bỏ tắc nghẽn I/O của AI với các tính năng cấp doanh nghiệp, hiệu suất cao, xử lý song song, với khả năng mở rộng giúp đào tạo và xác nhận các mô hình AI nhanh hơn, độ chính xác của mô hình cũng cao hơn, cải thiện năng suất khoa học dữ liệu và tối đa hóa ROI cho các khoản đầu tư máy tính.
  • Tăng độ chính xác của mô hình với bộ dữ liệu có độ phân giải cao hơn, sâu hơn với dung lượng lưu trữ hiệu quả lên đến 119 PBs trong một cụm duy nhất.
  • Tận dụng lợi thế của việc triển khai linh hoạt và khả năng phục hồi không gian mạng với các gói cho phép bạn bắt đầu xử lý và lưu trữ ở quy mô nhỏ và độc lập để triển khai quy mô lớn với các tùy chọn bảo mật và bảo vệ dữ liệu mạnh mẽ.
  • Cải thiện năng suất khoa học dữ liệu với phân tích tại chỗ linh hoạt và các giải pháp được xác thực trước để triển khai nhanh hơn, ít rủi ro hơn.
  • Các thiết kế đã được xác thực cho AI được xây dựng dựa trên các công nghệ lõi tốt nhất, bao gồm Tăng tốc bằng GPU NVIDIA và các kiến ​​trúc tham chiếu với Hệ thống NVIDIA DGX .

Dell cung cấp các giải pháp AI end-to-end, cho dù ở dạng POC hay toàn diện, với nền tảng PowerScale cung cấp các mảnh ghép kiến ​​trúc IT. Và gắn kết tất cả lại với nhau là hệ điều hành PowerScale OneFS, cho phép tất cả các node hoạt động liền mạch trong cùng một cụm được hỗ trợ OneFS với các tính năng cấp doanh nghiệp về quản lý hiệu suất, quản lý dữ liệu, bảo mật và bảo vệ dữ liệu – tất cả đều có thể được cung cấp tại biên, ở vùng lõi và cả trên đám mây.


Tài trợ bởi  Dell Technologies  ADG Distribution  
____
Bài viết liên quan

Vanito Hoang

Góp ý / Liên hệ tác giả

Nhất Tiến Chung sẵn sàng chạy BOM, báo giá, tư vấn tận nơi mọi giải pháp của các hãng và theo yêu cầu riêng đến với Quý doanh nghiệp. Vui lòng liên hệ:

Trung tâm Giải pháp NTC
Hotline: 1900 558879 #2
Email: presales@nhattienchung.vn