Import Model Registry sử dụng Triton
Chuẩn bị Model
Vì AI Platform chỉ truy cập các mô hình từ Network Volume, bạn cần tạo một Network Volume trước. Sau đó, sao chép mô hình từ hệ thống tệp cục bộ hoặc bộ lưu trữ đám mây (như AWS S3, Azure Blob hoặc Google Cloud Storage - GCS) vào Network Volume đó.
Đảm bảo Model tương thích với Triton Format bao gồm:
ONNX (
.onnx
)TensorFlow (dạng SavedModel hoặc tệp
.pb
)PyTorch TorchScript (
.pt
)TensorRT (
.engine
)OpenVINO (
.xml
và.bin
)Ensemble Model (kết hợp nhiều mô hình lại với nhau) Tham khảo.
Bước 1: Truy cập Model Registry
Đăng nhập với VNG Cloud account của bạn và truy cập tới Model Registry Dashboard.
Tìm và nhấn vào nút "Import a model registry" (Nhập một model registry).
Bước 2: Truy cập Model Registry
Region & Model registry name: Chọn region và tên cụ thể cho model của bạn.
Container: Chọn option Pre-built container để sử dụng các framework được hỗ trợ.
Framework: Chọn framework để triển khai model và version phù hợp. Trong hướng dẫn này, ta chọn Triton 24.12.
Model Source: Chọn Network Volume chứa mô hình Triton của bạn. Với Triton, bạn cần đảm bảo model repository có format sau:
Model Repository: Chọn Network Volume chứa model Triton của bạn, bạn cần chuẩn bị model repository có cấu trúc như sau:
network-volume +-- model_repository | +-- resnet | +-- config.pbtxt +-- 1 | +-- model.onnx
Hãy kiểm tra Triton documentation for compatibility guidelines để đảm bảo model của bạn tương thích và thực hiện các điều chỉnh cấu hình cần thiết nếu có.
Nhấn nút "Import" để hoàn thành quá trình.
Last updated