In einem Kubernetes-Cluster Xinference installieren.#
Basierend auf der nativen Helm-Methode#
Xinference bietet eine auf nativen Helm basierende Installationsmethode in Kubernetes-Clustern.
Vorbereitungsbedingungen#
Ein verfügbarer Kubernetes-Cluster.
Aktivieren Sie GPU-Unterstützung in Kubernetes, siehe hier.
Helm korrekt installieren.
Konkrete Schritte#
Füge das Xinference Helm-Repository hinzu
helm repo add xinference https://xorbitsai.github.io/xinference-helm-charts
Aktualisiere das Repositorium-Index und durchsuche die installierbaren Versionen.
helm repo update xinference helm search repo xinference/xinference --devel --versions
Installation
helm install xinference xinference/xinference -n xinference --version <helm_charts_version>
Benutzerdefinierte Installation#
Die oben genannte Installationsmethode installiert eine Art Standalone-Xinference, das heißt, es gibt nur einen Knoten, während alle anderen Startparameter auf den Standardwerten belassen werden.
Im Folgenden werden einige gängige benutzerdefinierte Installationskonfigurationen gezeigt.
Ich muss das Modell von
ModelScopeherunterladen.helm install xinference xinference/xinference -n xinference --version <helm_charts_version> --set config.model_src="modelscope"
Ich möchte das CPU-Image von Xinference (oder ein Image einer anderen Version) verwenden.
helm install xinference xinference/xinference -n xinference --version <helm_charts_version> --set config.xinference_image="<xinference_docker_image>"
Ich muss 4 Xinference-Worker-Knoten starten, wobei jeder Worker 4 GPUs verwaltet.
helm install xinference xinference/xinference -n xinference --version <helm_charts_version> --set config.worker_num=4 --set config.gpu_per_worker="4"
Die obige Installationsmethode basiert auf der Helm-Option --set. Für komplexere benutzerdefinierte Installationsszenarien, wie z. B. die gemeinsame Nutzung von Speicher durch mehrere Worker, wird dringend empfohlen, Ihre eigene values.yaml-Datei zu verwenden und die Installation über die Helm-Option -f durchzuführen.
The default values.yaml file is located here.
Some examples can be found here.
Basierend auf der Drittanbieter-Methode KubeBlocks#
Du kannst Xinference auch über den Drittanbieter KubeBlocks in einem K8s-Cluster installieren. Diese Methode wird nicht offiziell von Xinference gewartet, daher kann die Aktualität und Verfügbarkeit nicht strikt garantiert werden. Siehe Dokumentation .