NAS vs. Object Storage: Giải pháp nào tốt nhất cho việc lưu trữ dữ liệu phi cấu trúc?

Việc sử dụng thiết bị NAS hay hệ thống lưu trữ đối tượng (S3 Storage) cho các dữ liệu phi cấu trúc đều có những ưu nhược điểm riêng. Hãy cùng tìm hiểu những yếu tố cần xem xét liên quan đến khả năng mở rộng, vấn đề hiệu suất và loại tải xử lý cần triển khai tác động đến quyết định chọn loại lưu trữ nào.

Dữ liệu phi cấu trúc là một trong những loại dữ liệu phát triển nhanh nhất hiện nay. Với việc các công ty đang tạo ra và cố gắng lưu trữ số lượng dữ liệu ngày càng tăng qua từng năm. Điều này đương nhiên sẽ dẫn đến câu hỏi: Đâu là cách lưu trữ tốt nhất cho dữ liệu phi cấu trúc?

Dữ liệu phi cấu trúc là loại thông tin không tuân theo bất kỳ định dạng nào như cơ sở dữ liệu (database) truyền thống. Văn bản dưới dạng email và tài liệu, cùng với đa phương tiện – chẳng hạn như file ảnh, video và âm thanh – là những ví dụ phổ biến về dữ liệu phi cấu trúc. Khi tìm kiếm cách tốt nhất để lưu trữ dữ liệu phi cấu trúc, lưu trữ đối tượng và NAS là hai lựa chọn chính.

Giải pháp ảo hóa hạ tầng lưu trữ

So sánh NAS và Object Storage

NAS đã tồn tại trong nhiều thập kỷ qua và đặt một hệ thống phân cấp các directory và folder giữa người dùng và file của họ. Cách tiếp cận này cho phép các tổ chức phân loại gọn gàng các tệp riêng lẻ để sử dụng sau này.

Ở mặt khác, lưu trữ đối tượng không áp đặt một mô hình hệ thống file lên dữ liệu. Thay vào đó, các hệ thống đối tượng sử dụng các bảng siêu dữ liệu (metadata) tồn tại tách biệt với các thành phần dữ liệu cơ sở. Bảng siêu dữ liệu lưu trữ các thuộc tính mô tả dữ liệu cơ sở, chẳng hạn như tên file, ngày tạo, ID người dùng và vị trí mà từ đó dữ liệu có thể được truy xuất.

Có cả các ưu và nhược điểm đối với cả hai cách tiếp cận, đặc biệt là trong ngữ cảnh của lưu trữ dữ liệu phi cấu trúc. Và, trong cuộc tranh luận giữa lưu trữ đối tượng và NAS, loại lưu trữ phù hợp với tổ chức của bạn cũng phụ thuộc vào loại tải xử lý được hỗ trợ.

Ưu và nhược điểm

Ưu điểm chính của việc sử dụng NAS để lưu trữ dữ liệu phi cấu trúc là nó được tổ chức, ít nhất là trong chừng mực bạn tạo một cấu trúc thư mục phù hợp và thân thiện với người dùng. NAS cũng phổ biến với nhiều dịch vụ hỗ trợ lưu trữ NFS hoặc SMB. Ngoài ra, nó tương đối nhanh và cung cấp hỗ trợ cho các ứng dụng mà dữ liệu thay đổi nhanh chóng.

Mặt khác, khả năng mở rộng không phải là một điểm mạnh của NAS. Điều này đang thay đổi với sự ra đời của các dịch vụ có khả năng mở rộng hơn, nhưng NAS vẫn chưa gần với tiềm năng khả năng mở rộng vốn có trong các hệ thống lưu trữ đối tượng.


Bảng so sánh Object, File và Block storage

Trên thực tế, khả năng mở rộng là lợi ích lớn nhất của hệ thống lưu trữ đối tượng. Tăng dung lượng là một bài tập đơn giản và nó khá vô hình khi bạn vượt qua việc thêm phần cứng. Lý do: Nhiều hệ thống lưu trữ đối tượng mở rộng quy mô theo chiều ngang (scale out) hơn là chiều dọc (scale up). Tất cả những gì bạn phải làm là thêm một node khác và sau đó yêu cầu công cụ quản lý của bạn thêm node mới vào cụm. Một số điều kỳ diệu sẽ xảy ra đằng sau hậu trường, và cụm của bạn sẽ có thêm nhiều dung lượng lưu trữ hơn.

Hiệu suất là thách thức với các kho dữ liệu đối tượng truyền thống. Tuy nhiên, điều này cũng đang thay đổi với các sản phẩm lưu trữ đối tượng mới hơn. Một nhược điểm khác của lưu trữ đối tượng là cả siêu dữ liệu và dữ liệu đối tượng cơ sở đều phải được cập nhật. Vì vậy, nếu bạn có dữ liệu thay đổi nhanh, quá trình này có thể mất nhiều thời gian hơn so với NAS. Hơn nữa, mặc dù có các gateway và giao thức truy cập cơ bản được tiêu chuẩn hóa, chẳng hạn như Amazon S3, các tiêu chuẩn lưu trữ đối tượng không nhất quán như người anh em dựa trên file của chúng.

Tính năng của NAS và hệ thống lưu trữ đối tượng

Mặc dù lưu trữ file và đối tượng là các cách tiếp cận khác nhau đáng kể ở cấp độ logic, các hệ thống con lưu trữ thực tế có thể chia sẻ một bộ lớn các tính năng và chức năng. Người dùng doanh nghiệp có thể xem xét một loạt các tính năng của NAS hoặc đối tượng, chẳng hạn như:

  • Data tiering and placement. Hệ thống lưu trữ đối tượng và NAS có thể sử dụng chính sách gán tag cho file và metadata của đối tượng để tổ chức dữ liệu thành các Tier – đặt dữ liệu quan trọng hơn hoặc được truy cập thường xuyên hơn vào bộ lưu trữ nhanh hơn, đồng thời chuyển dữ liệu ít quan trọng hơn xuống các ổ đĩa rẻ hơn.
  • Global namespace. Việc tạo một “namespace” sẽ trừu tượng hóa việc lưu trữ từ ứng dụng tương ứng, cho phép ứng dụng tìm và truy cập dữ liệu ở bất cứ nơi nào nó được lưu trữ – trên bất kỳ hệ thống lưu trữ đối tượng hoặc NAS phù hợp nào – như một phương tiện chính để có khả năng mở rộng lưu trữ một cách liền mạch.
  • Hiệu suất và đặc tính multi-tenant. Hệ thống lưu trữ phải có khả năng xử lý những người dùng hoặc ứng dụng đồng thời mà không tạo ra độ trễ có thể gây ra sự chậm trễ hoặc lỗi của ứng dụng. Điều này đòi hỏi sức mạnh xử lý nội bộ – thường là khả năng truy cập ổ đĩa song song – và băng thông mạng phù hợp.
  • Bảo vệ dữ liệu. Xem xét các tính năng phục hồi dữ liệu của NAS hoặc thiết bị lưu trữ đối tượng, chẳng hạn như RAID, cách tiếp cận lưu trữ theo replication hay distributed/cluster. Việc bảo vệ dữ liệu loại bỏ bất kỳ điểm lỗi nào – dẫn đến mất dữ liệu – và có thể là một phần quan trọng trong việc tuân thủ và đảm bảo liên tục của doanh nghiệp.
  • Truy cập linh hoạt. Hệ thống lưu trữ đối tượng và NAS có thể cung cấp nhiều cách khác nhau để truy cập dữ liệu, chẳng hạn như API theo giao thức REST ​​hay SOAP, cũng như các giao thức lưu trữ phù hợp, bao gồm CIFS và NFS cho lưu trữ file, Luster hoặc PanFS cho lưu trữ đối tượng và thậm chí cả Hệ thống file phân tán Hadoop nếu hệ thống lưu trữ hỗ trợ phân tích dữ liệu lớn.
  • Các tùy chọn quản lý. Quản lý hệ thống lưu trữ đối tượng và NAS có thể bao gồm nhiều tính năng, bao gồm khả năng tự cấu hình, tự động phục hồi và tự động cân bằng lại – Nghĩa là, định vị lại file để mở rộng khả năng truy cập đĩa.
  • Cloud interface. Một số hệ thống lưu trữ file và đối tượng có thể cung cấp lớp giao tiếp với các nền tảng cloud, có thể hỗ trợ đám mây riêng hoặc tương tác với các dịch vụ lưu trữ đám mây công cộng để xây dựng hạ tầng lưu trữ liên thông cục bộ/đám mây liền mạch.

Các tình huống ứng dụng NAS và đối tượng trong doanh nghiệp

NAS và lưu trữ đối tượng có cùng mục đích cơ bản: lưu trữ dữ liệu cho người dùng và ứng dụng doanh nghiệp. Nhưng điểm mạnh và điểm yếu của cả hai công nghệ khiến chúng phù hợp với những mục đích sử dụng khác nhau.

NAS cung cấp một cách tiếp cận truyền thống hơn để lưu trữ dữ liệu và lý tưởng với nhiều tác vụ, bất cứ nơi nào dữ liệu file phải được lưu trữ hoặc truy cập, chẳng hạn như:

  • media streaming hoặc truy xuất bất kỳ dạng phương tiện nào – chẳng hạn như hình ảnh, video, âm thanh và văn bản – được biểu diễn dưới dạng file chứ không phải đối tượng phi cấu trúc;
  • lưu trữ các file dữ liệu thô cho việc phân tích;
  • lưu trữ các bản backup hoặc sử dụng NAS làm mục tiêu sao chép file;
  • chạy một loạt các ứng dụng kinh doanh mã nguồn mở, chẳng hạn như SugarCRM, Vtiger CRM, OrangeHRM, Synology Office, Mattermost (chat) hoặc thậm chí nhiều loại máy chủ email, máy chủ web và hệ thống quản lý nội dung như WordPress – hầu như bất kỳ ứng dụng kinh doanh nào không cần đến lưu trữ dựa trên SAN;
  • lưu trữ, truy cập và chạy các máy ảo;
  • sử dụng NAS để cung cấp lưu trữ file trong đám mây riêng, thường thông qua giao diện người dùng dựa trên trình duyệt của nhà sản xuất NAS; và
  • sử dụng lưu trữ NAS cho các tác vụ test và development, chẳng hạn như các ứng dụng dựa trên web hoặc dựa trên máy chủ.

Lưu trữ đối tượng cũng lưu trữ dữ liệu. Nhưng tính chất phẳng (không phân cấp), không có cấu trúc, dựa trên siêu dữ liệu của các đối tượng làm cho việc lưu trữ đối tượng trở nên hấp dẫn đối với các ứng dụng lưu trữ khác nhau trong doanh nghiệp, bao gồm:

  • media streaming hoặc truy xuất bất kỳ dạng phương tiện nào – chẳng hạn như hình ảnh, video, âm thanh và văn bản – được biểu thị dưới dạng một đối tượng phi cấu trúc chứ không phải là một tệp truyền thống;
  • lưu trữ dữ liệu để phân tích trong đó các đối tượng có thể là cơ sở dữ liệu cực lớn, vì lưu trữ đối tượng thường là nền tảng của các phương tiện lưu trữ quy mô lớn và có khả năng mở rộng cao như data warehouse hoặc thậm chí là các triển khai data lake; và
  • lưu trữ các bản backup, vì lưu trữ đối tượng thường được sao chép hoặc phân phối, làm cho lưu trữ đối tượng có khả năng phục hồi cao cho các tác vụ – chẳng hạn như DR, sao lưu và lưu trữ dài hạn – chỉ yêu cầu mức truy cập không thường xuyên.

NAS và lưu trữ đối tượng trên đám mây

Khi ngày càng nhiều người dùng và ứng dụng sử dụng đám mây công cộng, các nhà cung cấp đang cung cấp một loạt các dịch vụ lưu trữ được thiết kế để mô phỏng tài nguyên lưu trữ file và đối tượng – cũng như lưu trữ block và đặc thù ứng dụng – có thể cung cấp khả năng truy cập toàn cầu, độ bền và khả năng phục hồi cao.

  • NAS. Các dịch vụ lưu trữ dựa trên file bao gồm:
    • Amazon EFS
    • Azure Files
    • Google Filestore
  • Object. Các dịch vụ lưu trữ dựa trên đối tượng bao gồm:
    • Amazon S3
    • Azure Blob
    • Google Cloud Storage

Các tổ chức mới bắt đầu làm việc với các dịch vụ đám mây công cộng, phát triển hạ tầng hybrid cloud hoặc đòi hỏi các yêu cầu lưu trữ cục bộ liên tục có thể cân nhắc lựa chọn hệ thống lưu trữ tương thích với các đám mây công cộng.

Chìa khóa để tương thích phần cứng/đám mây thường nằm ở nền tảng hệ điều hành của hệ thống lưu trữ. Ví dụ: Cohesity SmartFiles hỗ trợ các dịch vụ khác nhau của Amazon, bao gồm S3, GovCloud, Snowball, EFS, FSx cho Windows File Server và Amazon FSx cho NetApp ONTAP. Một ví dụ khác, các nền tảng NetApp như NetApp ONTAP 9 hỗ trợ Google Cloud Storage.

Các nền tảng lưu trữ đối tượng và NAS phổ biến

Có nhiều sản phẩm hệ thống lưu trữ đối tượng và NAS khác nhau. Các nền tảng NAS bao gồm:

  • Arcserve OneXafe
  • Buurst SoftNAS
  • Ciphertex CX
  • Cloudian HyperFile NAS
  • CTERA Edge X Series
  • DataDirect Networks (DDN) EXAScaler
  • Dell EMC PowerScale
  • Hitachi NAS (HNAS) Platform
  • HP StorageWorks 4400 Scalable NAS
  • HP StorageWorks X9000
  • HPE 3PAR StoreServ
  • HPE StoreEasy 1000 Storage
  • IBM Scale Out Network Attached Storage (SONAS)
  • IBM System Storage N Series
  • iXsystems TrueNAS
  • LaCie NAS
  • NetApp V-Series
  • NetApp FAS
  • Netgear ReadyNAS
  • Oracle Pillar Axiom 600
  • Oracle Sun Storage 7000 Unified Storage System
  • Oracle ZFS Storage Appliance
  • OVHcloud NAS-HA
  • Panasas ActiveStor
  • QCT QuantaVault
  • QNAP NAS
  • Quantum ATFS
  • SnapServer NAS
  • Synology DiskStation Manager (DSM)
  • Western Digital Ultrastar SATA Series

Các dịch vụ nền tảng lưu trữ đối tượng có:

  • Cloudian HyperStore
  • DataCore Swarm
  • Dell EMC ECS
  • FalconStor StorSafe
  • Huawei OceanStor family
  • Hitachi Content Platform (HCP)
  • Inspur AS13000G5 series
  • NetApp StorageGRID
  • Pure Storage FlashBlade
  • Scality Ring

Hệ thống lưu trữ phải được lựa chọn cẩn thận, dựa trên các yêu cầu về các yếu tố như dung lượng lưu trữ, form factor (tower hoặc rack), hiệu suất mạng và I/O, tính năng phục hồi và khả năng mở rộng.

Điểm mấu chốt để lưu trữ dữ liệu phi cấu trúc

Vậy thì, cách tiếp cận nào xuất hiện hàng đầu khi nói đến NAS so với lưu trữ đối tượng? Nói chung, nếu bạn có các ứng dụng chỉ bao gồm các dữ liệu thay đổi lien tục và việc truy cập được sắp xếp hợp lý, NAS có lẽ là lựa chọn tốt nhất của bạn. Nếu bạn có tải xử lý mà thiên về lưu trữ dài hạn (archive) và bạn không cần mức độ tích hợp application-native mức cao, lưu trữ đối tượng là hướng nên chọn.

Quy mô cũng đóng một phần trong quyết định lưu trữ đối tượng so với NAS của bạn. Các hệ thống NAS rất khác nhau về mức độ mở rộng của chúng, vì vậy, có thể ở một thời điểm nào đó, bạn có thể phát triển vượt quá giới hạn của sản phẩm NAS mà bạn chọn. Điều đó đôi khi rất quan trọng.

____
Bài viết liên quan

Góp ý / Liên hệ tác giả