Neuordnung#

Lernen Sie, wie Sie das Re-Ranking-Modell in Xinference verwenden.

Introduktion#

Gegeben eine Abfrage und eine Reihe von Dokumenten, sortiert Rerank die Dokumente basierend auf ihrer semantischen Relevanz zur Abfrage neu, von der relevantesten zur am wenigsten relevanten. In Xinference kann ein Rerank-Modell über den Rerank-Endpunkt aufgerufen werden, um eine Reihe von Dokumenten zu sortieren.

Schnellstart#

Wir können den Rerank-API über cURL, OpenAI Client oder Xinference ausprobieren:

curl -X 'POST' \
  'http://<XINFERENCE_HOST>:<XINFERENCE_PORT>/v1/rerank' \
  -H 'accept: application/json' \
  -H 'Content-Type: application/json' \
  -d '{
    "model": "<MODEL_UID>",
    "query": "A man is eating pasta.",
    "documents": [
        "A man is eating food.",
        "A man is eating a piece of bread.",
        "The girl is carrying a baby.",
        "A man is riding a horse.",
        "A woman is playing violin."
    ]
  }'