Network volume

Giới thiệu tổng quan

Network Volume là một loại lưu trữ dùng chung (shared storage) trong AI Platform, cho phép người dùng lưu trữ dữ liệu như model, dataset, và kết quả huấn luyện, đồng thời truy cập từ nhiều service khác nhau như Notebook, Model Registry và Inference.

Lợi ích chính

Chia sẻ dữ liệu giữa các service dễ dàng
Dữ liệu bền vững, không bị mất khi notebook tắt
Giảm thời gian truyền dữ liệu giữa các bước trong pipeline AI

Cách hoạt động

Network Volume được gắn (mount) vào các môi trường compute như Notebook, Inference container.
Dữ liệu trong Network Volume có thể được đồng bộ từ nguồn bên ngoài (ví dụ S3).
Khi sử dụng trong Notebook, dữ liệu sẽ được sync từ Network Volume → block storage của Notebook khi bắt đầu, và sync ngược lại khi tắt notebook (đảm bảo dữ liệu luôn được cập nhật).
Với Inference, Network Volume sẽ được mount trực tiếp vào pod khi model được triển khai.

Hướng dẫn sử dụng Network volume

Bước 1: Khởi tạo Network Volume

Truy cập vào tab Network Volume trong AI Platform theo đường dẫn: https://aiplatform.console.vngcloud.vn/volume
Click Create Network Volume.
Nhập thông tin:
- Tên Volume: nhập tên hợp lệ theo quy tắc sau: Chỉ cho phép các chữ cái (a-z, A-Z, 0-9, '_', '-', '.'). Dữ liệu đầu vào phải nằm trong khoảng từ 1 đến 50 ký tự. Ví dụ ai-storage
- Kích thước (GB): sẽ được tự động điều chỉnh dựa trên việc sử dụng của bạn
- Region: Ví dụ HCM
Click Tạo Volume

Sau khi tạo xong, volume sẽ sẵn sàng để gắn vào Notebook hoặc dùng cho Model Registry / Inference.

Bước 2: Sync dữ liệu từ S3 vào Network Volume

Dữ liệu có thể được đồng bộ từ S3 vào Network Volume theo hai phương thức: tự động (auto-sync) hoặc thủ công (manual sync).

2.1 Manual Sync Dữ liệu khi Notebook vẫn đang chạy

Nếu bạn không muốn tắt notebook nhưng vẫn muốn cập nhật dữ liệu thủ công, có thể sử dụng các API sync nội bộ từ terminal của notebook:

#kéo dữ liệu từ S3 về Notebook
curl -X POST localhot:8080/pull

#đẩy data từ Notebook lên S3 (ghi đè dữ liệu cũ)
curl -X POST localhot:8080/finalize

Lưu ý: Cần thực hiện lệnh này từ bên trong notebook, nơi đang mount Network Volume.

2.2 Sử dụng S3 Key với công cụ CLI

Mỗi Network Volume tương ứng với một S3 bucket nội bộ. Có thể sử dụng s3 key của network volume để sử dụng với các công cụ command line 3rd party softwares | VNG Cloud docs. Bạn có thể sử dụng các công cụ dòng lệnh (CLI) như s3cmd để thao tác trực tiếp với dữ liệu trong volume. Ở tài liệu này sẽ hướng dẫn trên s3cmd.

Chuẩn bị:

Cài đặt s3cmd trên máy
Tạo file cấu hình s3cnf như sau:

[default]
access_key = <access_key>
secret_key = <secret_key>
host_base = <hostname>
bucket_location = HCM03
list_md5 = False
host_bucket = %(bucket)s.<hostname>

Bạn có thể lấy các thông tin <access_key>, <secret_key>, <hostname> từ trang chi tiết của Network Volume trong AI Platform.

Sử dụng s3cmd với file s3cnf đã tạo có thể sử dung các action put, ls ... với bucket

Bước 3: Mount Network Volume vào Notebook

Gắn một Network Volume vào phiên bản notebook này. Điều này cho phép notebook của bạn truy cập dữ liệu và lưu trữ kết quả trong Network Volume.

Khi khởi tạo Notebook:

Chọn phần Data Mount
Chỉ định:
- Network volume: ai-storage
  - Chọn Network Volume trong danh sách đã tạo của bạn.
  - Bạn có thể nhấp vào "Manage your volumes" để quản lý các Network Volume hiện có của mình.
- Mount folder name (Folder Sync):
  - Tạo thư mục đích trong notebook để đồng bộ dữ liệu từ Network Volume. Ví dụ: /workspace/notebook-data
  - Lưu ý: Chỉ cho phép các ký tự chữ cái (a-z, A-Z, 0-9, '_', '-', '+', '.'). Độ dài nhập liệu phải nhỏ hơn 256 ký tự.
- Block storage size:
  - Nhập dung lượng dung lượng lưu trữ tạm (ephemeral block storage) để chứa OS và bản sao dữ liệu từ network volume.
  - Chọn kích thước đủ lớn so với dữ liệu cần dùng từ 20 đến 1000. (nếu chọn size blockstorage bé hơn hoặc bằng size network volume hiện tại thì quá trình tạo notebook sẽ bị lỗi (bạn có thể xoá và tạo lại notebook khác)

Khi start notebook:
- Dữ liệu từ Network Volume sẽ tự động copy vào thư mục mount trên Notebook
Khi stop notebook:
- Dữ liệu thay đổi sẽ được sync ngược lại vào Network Volume

Bước 4: Dùng Network Volume trong Inference

A. Import vào Model Registry

Tạo Model Registry mới
Chọn:
- Loại lưu trữ (Model source): Network Volume
- Model repository: Đường dẫn tới file model (VD: /models/llama3/)
- Network volume: Chỉ định Network Volume chứa model AI để hệ thống có thể truy cập khi chạy inference. Lưu ý model phải được lưu đúng với đường dẫn nhập tại Model repository ai-storage

Sau khi import, model sẽ sẵn sàng để deploy.

B. Khởi tạo Inference với Network Volume

Khi tạo Endpoint:

Chọn Model Registry đã import ở bước trước
AI Platform sẽ tự động:
- Mount network volume vào Pod
- Deploy model lưu trữ tại đường dẫn để phục vụ inference

Quá trình này giúp giảm thời gian khởi tạo vì không cần upload lại model mỗi lần. Nếu model repository nhập không chính xác, quá trình deploy inference sẽ xảy ra lỗi.

PreviousQuản Lý Notebook Instance NextInference

Last updated 3 months ago