AI Infrastructure
AI Infrastructure trong AI Stack là layer cung cấp tài nguyên phần cứng, phần mềm và hệ thống để vận hành, huấn luyện và triển khai các mô hình AI. Nhiệm vụ chính của layer này là cung cấp compute (CPU/GPU), volume, network, security và orchestration cho toàn bộ AI workload.
Các thành phần chính của AI Infrastructure bao gồm:
Orchestration cho toàn bộ AI workload (training, inference, pipeline, autoscaling)
Vector database dùng cho semantic search, RAG, lưu trữ embedding, metadata AI,..
Lưu trữ dữ liệu huấn luyện, model repository,...
NVIDIA GPU
High Performance Compute
Network
Hạ tầng GPU cho AI Training/Inference:HGX H100, L40s, A40,...
Nền tảng tính toán mạnh với Intel Gen4 và AMD Genoa
Hạ tầng kết nối hiệu năng cao: InfiniBand, 100G / 50G Ethernet
Last updated