Beispiel: PDF-Chatbot 📚#
Beschreibung:
Dieses Beispiel zeigt, wie man mit lokalen LLM- und Embedding-Modellen einen PDF-Chatbot erstellt.
Betroffene Technologien:
@ Xinference als Hosting-Dienst für LLM-Modelle
@ LlamaIndex wird zur Orchestrierung der gesamten RAG-Pipeline verwendet.
@ Streamlit wird für die interaktive Benutzeroberfläche verwendet.
Detaillierte Erläuterung der Demonstrationsfunktion:
Ein Dockerfile wurde erstellt, wodurch der Bereitstellungsprozess mit Docker vereinfacht und eine einfache Reproduzierbarkeit sichergestellt wird.
Verwenden Sie Xinference, um das LLM- und das Embedding-Modell zu starten und legen Sie zwei Ports offen, um darauf zuzugreifen.
Implementieren Sie nahtloses Datei-Upload und interaktive Kommunikation mit der Chat-Engine mit Streamlit.
Die Dokumenten-Embedding-Geschwindigkeit ist 5-mal schneller als die OpenAI-API.
Nutzung der Leistungsfähigkeit von GGML, um Modelle auf der GPU auszuführen, um Beschleunigung zu gewährleisten und Wartezeiten auf Ergebnisse zu verkürzen.
- Quellcode