Dokumenten-Retriever
Der Dokumenten-Retriever verbindet KI-Modelle mit Ihren ausgewählten Dokumenten und URLs und ermöglicht so genaue, aktuelle und relevante KI-Antworten für Ihren spezifischen Anwendungsfall.

Komponentenbeschreibung
So funktioniert die Dokumenten-Retriever-Komponente
Das größte Problem großer Sprachmodelle ist ihre Tendenz, vage, veraltete oder schlichtweg falsche Informationen zu liefern. Um sicherzustellen, dass die Antworten immer aktuell und für Ihren Anwendungsfall relevant sind, müssen generative Modelle auf die richtigen Wissensquellen zugreifen.
Dieser Ansatz, genannt Retrieval-Augmented Generation (RAG), versorgt generative Modelle mit Ihren eigenen Wissensquellen. Die Retriever-Komponenten, einschließlich des Dokumenten-Retrievers, ermöglichen Ihnen die Nutzung dieser Methode.
Was ist die Dokumenten-Retriever-Komponente?
Diese Komponente ermöglicht es dem Chatbot, Wissen aus Ihren eigenen Quellen abzurufen und so sicherzustellen, dass die Informationen relevant, zuverlässig und aktuell sind. Diese Informationen stammen direkt aus den von Ihnen in den Dokumenten und Zeitplänen festgelegten Quellen. Die Rolle dieser Komponente ist es, den Abruf zu steuern.

Eingabeanfrage
Legt die Anfrage fest, mit der relevante Informationen gesucht werden. Sie kann entweder von einer Komponente verknüpft oder manuell eingegeben werden. In den meisten Fällen ist Ihre Eingabeanfrage der Chat Input.
Dokumentenanzahl
Mit dieser Einstellung wird begrenzt, wie viele Dokumente der Flow abrufen soll, damit die Ergebnisse relevant bleiben und nicht zu lange für die Generierung benötigen.
Dokumentenkategorien
Mit dieser optionalen Einstellung können Sie den Abruf auf eine der Kategorien beschränken, die Sie im Dokumenten-Bereich unter Wissensquellen angelegt haben.
Zeitpläne
So können Sie den Abruf auf einen der Zeitpläne beschränken, die Sie im Zeitpläne-Bereich der Wissensquellen festgelegt haben.
Schwellenwert
Die Quellen in Ihrer Wissensdatenbank passen unterschiedlich gut zur Anfrage. Die KI bewertet diese nach Relevanz von 0 bis 1. Mit dieser Einstellung steuern Sie, wie gut die Ausgabe mit der Anfrage übereinstimmen muss.
Der genaue Schwellenwert hängt von Ihrem Anwendungsfall ab, aber in der Regel werden 0,7–0,8 für besonders relevante Antworten aus einer angemessenen Anzahl an Quellen empfohlen.
Stellen Sie sich vor, Sie setzen den Schwellenwert auf 0,6 und haben folgende Artikel:
- Artikel A: 0,8
- Artikel B: 0,65
- Artikel C: 0,5
- Artikel D: 0,9
Nur die Artikel mit einem Relevanzwert über 0,6 kommen in die Ausgabe, also nur A, B und D.
- Ein hoher Schwellenwert wie 0,9 liefert sehr relevante Ergebnisse, die der Anfrage genau entsprechen, könnte jedoch zu wenige Dokumente finden und manche relevante übersehen.
- Ein niedriger Schwellenwert, zum Beispiel unter 0,5, liefert Informationen aus mehr Dokumenten, birgt aber das Risiko, irrelevante Informationen zurückzugeben.
So verbinden Sie die Dokumenten-Retriever-Komponente mit Ihrem Flow
Die Komponente verfügt nur über einen Eingabe- und einen Ausgabe-Handle:
- Eingabeanfrage: Die Anfrage kann jede beliebige Textausgabe sein. Typische Anwendungsfälle sind die Verbindung eines menschlichen Chat Inputs oder eines Generators.
- Ausgabe: Die Ausgabe jeder Retriever-Komponente ist immer ein Dokument.
Die Dokumenten-Ausgabe enthält strukturierte Daten, die sich nicht für die finale Chat-Ausgabe eignen. Alle Komponenten, die Dokumente als Input akzeptieren, wandeln diese in ein benutzerfreundliches Format um. Dies sind entweder Widget-Komponenten oder der Document to Text Transformer.
Warum den Dokumenten-Retriever nutzen?
- KI-Modelle fundieren: Erhöhen Sie die faktische Genauigkeit und Relevanz von KI-Ausgaben, indem Sie reale, kontextuale Informationen aus Ihrer Wissensbasis bereitstellen.
- Kontextuelle Anreicherung: Versorgen Sie LLMs oder Chatbots mit unterstützenden Dokumenten oder Referenzmaterial für fundiertere Antworten.
- Flexible Filterung: Die Suche kann nach Kategorie, Zeitplan, URL, Dokumentenstruktur oder Metadaten feinjustiert werden, sodass nur die relevantesten Informationen angezeigt werden.
- Individuelle Ausgabe: Wählen Sie, wie viel Inhalt abgerufen, wie er aufgeteilt und welche Metadaten einbezogen werden sollen – ideal zur Anpassung für nachgelagerte KI-Prozesse oder UI-Anforderungen.
- Agenten-Integration: Mit Tool-Beschreibungen und Benennungen kann die Komponente als Tool in agentenbasierten Architekturen referenziert werden.
Beispielanwendungsfälle
- Retrieval-Augmented Generation (RAG): Stellen Sie LLMs unterstützende Dokumente bereit, um genaue, wissensgestützte Antworten zu generieren.
- Chatbots und virtuelle Assistenten: Zeigen Sie schnell FAQs oder Richtliniendokumente als Antwort auf Mitarbeiter- oder Kundenfragen an.
- Datenanreicherung: Ziehen Sie Produkt-, Autoren- oder andere Metadaten für weitere KI-gestützte Analysen oder Workflow-Automatisierung heran.
Beispiel
Probieren wir es jetzt aus! Bevor wir den Flow erstellen, müssen wir sicherstellen, dass wir relevante Dokumente oder Zeitpläne angelegt haben. Ist keine passende Quelle vorhanden, entschuldigt sich der Chatbot und kann keine Antwort geben.
Schritte:
- Beginnen Sie mit dem Chat Input.
- Fügen Sie den Dokumenten-Retriever hinzu und verbinden Sie den Chat Input als Eingabeanfrage.
- Die Ausgabe ist ein Dokument, das umgewandelt werden muss; in diesem Beispiel nutzen wir den Document to Text.
- Verbinden Sie anschließend einen KI-Generator.
- Sie können loslegen.

Jetzt kann unser Flow anhand einer menschlichen Anfrage unsere Quellen durchsuchen, die strukturierten Daten in lesbaren Text umwandeln und an die KI weitergeben, um eine benutzerfreundliche Antwort zu generieren.
Unsere Wissensquellen enthalten einen Zeitplan, der die Preise-Seite von FlowHunt für aktuelle Informationen durchsucht. Fragen wir den Bot danach:

Beispiele für Flow-Vorlagen mit der Dokumenten-Retriever-Komponente
Um Ihnen den schnellen Einstieg zu erleichtern, haben wir mehrere Beispiel-Flow-Vorlagen vorbereitet, die zeigen, wie die Dokumenten-Retriever-Komponente effektiv genutzt wird. Diese Vorlagen präsentieren verschiedene Anwendungsfälle und Best Practices und erleichtern Ihnen das Verständnis und die Implementierung der Komponente in Ihren eigenen Projekten.
Häufig gestellte Fragen
- Was ist die Dokumenten-Retriever-Komponente?
Diese Komponente ermöglicht es dem Flow, Wissen aus Ihren eigenen Quellen wie Dokumenten und URLs abzurufen. So wird sichergestellt, dass die zurückgegebenen Informationen relevant, zuverlässig und aktuell sind.
- Warum kann ich einen Dokumenten-Retriever nicht mit dem Chat Output verbinden?
Retriever-Komponenten erzeugen strukturierte Daten, die nicht für die Ausgabe geeignet sind. Sie müssen zuerst in Text- oder visuelles Format umgewandelt werden, bevor sie an die Chat Output-Komponente gesendet werden.
- Woher bezieht der Knowledge Retriever seine Informationen?
Die Komponente sucht nach der nächsten Übereinstimmung der Anfrage innerhalb der Informationen von benutzerdefinierten URLs, Dokumenten und Zeitplänen.
- Wie viele Dokumente gibt sie zurück?
Sie können eine Begrenzung für die Anzahl der zurückgegebenen Ergebnisse festlegen, sodass nur die relevantesten Inhalte in Ihren Flow aufgenommen werden.
- Kann ich filtern, welche Dokumente durchsucht werden?
Ja, Sie können nach Dokumentenkategorien, Zeitplänen oder URLs filtern und die Suche so auf bestimmte Segmente Ihrer Wissensdatenbank fokussieren.
- Kann ich sowohl den Dokumenten-Retriever als auch GoogleSearch verbinden? Und falls ja, welche Komponente wird priorisiert?
Sie können beide gleichzeitig verwenden. Jeder Retriever führt zu einer eigenen Ausgabe, wobei die Priorisierung durch die Reihenfolge der Ausgaben im Canvas festgelegt wird. Die erste Ausgabe von oben wird priorisiert.
Testen Sie FlowHunts Dokumenten-Retriever
Entwickeln Sie intelligentere KI-Lösungen, indem Sie Ihre Wissensquellen verbinden und sicherstellen, dass Ihr Chatbot immer relevante, aktuelle Antworten liefert.