Dokumenten-Retriever

Der Dokumenten-Retriever verbindet KI-Modelle mit Ihren ausgewählten Dokumenten und URLs und ermöglicht so genaue, aktuelle und relevante KI-Antworten für Ihren spezifischen Anwendungsfall.

Dokumenten-Retriever

Komponentenbeschreibung

So funktioniert die Dokumenten-Retriever-Komponente

The most significant setback of large language models is their tendency to present vague, outdated, or downright false information. To ensure the answers are always up to date and relevant to your use case, generative models need to be pointed to the right knowledge sources.

This approach, called the Retrieval-Augmented Generation (RAG), supplies generative models with your own knowledge sources. The retriever components, including the Document Retriever, allow you to use this method.

What is the Document Retriever component?

This component allows the chatbot to retrieve knowledge from your own sources, ensuring that the information is relevant, reliable, and up-to-date. This information comes directly from the sources you specified in the Documents and Schedules. The role of this component is to control the retrieval.

Flowhunt's Knowledge Retriever

Input Query

Specifies the query that’s used to look up relevant information. It can either be linked from a component or inputted manually. In most cases, your input query will be the Chat Input.

Document Count

This setting limits the amount of documents the flow should retrieve from, making sure the results remain relevant and don’t take too long to generate.

Document categories

This optional setting lets you limit the retrieval to one of the categories you’ve created in the Documents screen of Knowledge Sources.

Schedules

Lets you limit the retrieval to one of the Schedules you’ve specified in the Schedules screen of Knowledge Sources.

Threshold

The sources in your knowledge database will match the query to varying degrees. AI will rank these by relevance from 0 to 1. This setting lets you control how well the output must match the query.

The exact threshold depends on your use case, but generally, 0.7-0.8 is recommended for highly relevant answers from a reasonable amount of sources.

Imagine you set the threshold to 0.6 and have the following articles:

  • Article A: 0.8
  • Article B: 0.65
  • Article C: 0.5
  • Article D: 0.9

Only the articles with a relevance score of over 0.6 will make it into the output, that is, only A, B, and D.

  • A high threshold, such as 0.9, will return very relevant results that closely match the query, but it might struggle to find enough documents and miss some relevant ones.
  • A low threshold, for example, one below 0.5, will provide information from more documents, but it runs the risk of returning irrelevant information.

How to connect the Document Retriever component to your flow

The component contains just one input and one output handle:

  • Input Query: The query can be any text output. Common use cases would be connecting human Chat Input or a Generator.
  • Output: The output of any retriever-type component is always a Document.

The Document output contains structured data unsuitable for the final chat output. All components that take Documents as their input transform them into a user-friendly format. These are either Widget components or the Document to Text transformer.

Why Use the Document Retriever?

  • Grounding AI Models: Enhance the factual accuracy and relevance of AI outputs by providing real, contextual information from your organization’s knowledge base.
  • Contextual Augmentation: Supply LLMs or chatbots with supporting documents or reference material for more informed responses.
  • Flexible Filtering: Search can be fine-tuned by category, schedule, URL, document structure, or metadata, ensuring you surface only the most relevant information.
  • Custom Output: Choose how much content to retrieve, how to split it, and which metadata to include, making it easy to adapt for downstream AI processes or UI needs.
  • Agent Integration: With tool descriptions and naming, the component can be referenced as a tool in agent-based architectures.

Example Use Cases

  • Retrieval-Augmented Generation (RAG): Provide LLMs with supporting documents to generate accurate, knowledge-backed responses.
  • Chatbots and Virtual Assistants: Quickly surface FAQs or policy documents in response to employee/customer questions.
  • Data Enrichment: Pull in product, author, or other metadata for further AI-driven analysis or workflow automation.

Example

Let’s Try it Now! Before building the flow, we must ensure we have created relevant Documents or Schedules. If no good source is present, the chatbot will either apologize for being unable to answer.

Steps:

  1. Start with Chat Input.
  2. Add the Document Retriever and connect Chat Input as the Input Query.
  3. The output is a Document that needs to be transformed; for this example, we will use the Document to Text.
  4. Next, connect an AI Generator.
  5. You’re ready to chat.
Example of how to use Document Retriever in Flowhunt

Now our Flow can search our sources based on a human query, transform the structured data into readable text, and pass it to AI to generate a user-friendly answer.

Our Knowledge Sources contain a Schedule set to crawl FlowHunt’s pricing page for up-to-date information. Let’s ask the bot about it:

Flowhunt bot's answer about URLsLab's pricing

Beispiele für Flow-Vorlagen mit der Dokumenten-Retriever-Komponente

Um Ihnen den schnellen Einstieg zu erleichtern, haben wir mehrere Beispiel-Flow-Vorlagen vorbereitet, die zeigen, wie die Dokumenten-Retriever-Komponente effektiv genutzt wird. Diese Vorlagen präsentieren verschiedene Anwendungsfälle und Best Practices und erleichtern Ihnen das Verständnis und die Implementierung der Komponente in Ihren eigenen Projekten.

Absatzgenerator für verwandte Artikel
Absatzgenerator für verwandte Artikel

Absatzgenerator für verwandte Artikel

Erzeugt automatisch einen kurzen, ansprechenden Absatz für Ihre Website, der Links zu den relevantesten verwandten Artikeln enthält. Dieser KI-gestützte Workflo...

4 Min. Lesezeit
ChatGPT-Wissensdatenbank-Assistent
ChatGPT-Wissensdatenbank-Assistent

ChatGPT-Wissensdatenbank-Assistent

KI-Chatbot-Assistent auf Basis von OpenAI GPT-4o, der automatisch interne Firmendokumente durchsucht und nutzt, um Benutzerfragen zu beantworten. Liefert kontex...

3 Min. Lesezeit
HUGO Markdown-Datei-Übersetzer
HUGO Markdown-Datei-Übersetzer

HUGO Markdown-Datei-Übersetzer

Dieser Workflow optimiert die Übersetzung von HUGO-Markdown-Dateien in Zielsprache, wobei die Dateistruktur und das Format erhalten bleiben. Durch den Einsatz v...

3 Min. Lesezeit
KI-Chatbot mit FreshChat- & Wissensdatenbank-Support
KI-Chatbot mit FreshChat- & Wissensdatenbank-Support

KI-Chatbot mit FreshChat- & Wissensdatenbank-Support

Setzen Sie einen intelligenten KI-Chatbot ein, der sich nahtlos mit FreshChat integriert. Der Chatbot beantwortet Benutzeranfragen mithilfe Ihrer internen Wisse...

3 Min. Lesezeit
KI-Chatbot mit LiveChat.com-Integration
KI-Chatbot mit LiveChat.com-Integration

KI-Chatbot mit LiveChat.com-Integration

Setzen Sie einen KI-gestützten Chatbot auf Ihrer Website ein, der Ihre interne Wissensdatenbank nutzt, um Kundenanfragen zu beantworten, und leitet komplexe ode...

3 Min. Lesezeit
KI-Chatbot mit Slack-Human-Eskalation
KI-Chatbot mit Slack-Human-Eskalation

KI-Chatbot mit Slack-Human-Eskalation

Stellen Sie einen intelligenten Kundensupport-Chatbot für LiveAgent bereit, der automatisch Besucherfragen beantwortet, Wissensdatenbankdokumente abruft und bei...

4 Min. Lesezeit
KI-Chatbot mit Tawk-Übergabe an menschliche Agenten
KI-Chatbot mit Tawk-Übergabe an menschliche Agenten

KI-Chatbot mit Tawk-Übergabe an menschliche Agenten

Ein KI-gestützter Live-Chat-Support-Chatbot, der Kundenfragen über eine interne Wissensdatenbank beantwortet und komplexe Anfragen intelligent für nahtlosen Kun...

3 Min. Lesezeit
KI-E-Mail-Assistent für Gmail
KI-E-Mail-Assistent für Gmail

KI-E-Mail-Assistent für Gmail

Automatisieren Sie das Management Ihres Gmail-Posteingangs mit einem KI-Agenten, der eingehende E-Mails liest, Ihre Wissensdatenbank nutzt, um professionelle An...

3 Min. Lesezeit
KI-gestützte Outlook-E-Mail-Antwortautomatisierung
KI-gestützte Outlook-E-Mail-Antwortautomatisierung

KI-gestützte Outlook-E-Mail-Antwortautomatisierung

Automatisieren Sie professionelle E-Mail-Antworten in Outlook mit einem KI-Agenten, der auf unternehmensinternen Wissensquellen basiert. Eingehende E-Mails werd...

3 Min. Lesezeit
KI-HubSpot-Lead-Generierung Chatbot
KI-HubSpot-Lead-Generierung Chatbot

KI-HubSpot-Lead-Generierung Chatbot

Dieser KI-gestützte Workflow automatisiert die Lead-Qualifizierung und das Kontaktmanagement in HubSpot. Der Chatbot sammelt Nutzerinformationen, recherchiert F...

3 Min. Lesezeit
KI-Kundenservice-Chatbot
KI-Kundenservice-Chatbot

KI-Kundenservice-Chatbot

Ein KI-gestützter Kundenservice-Chatbot, der Ihre internen Wissensquellen nutzt, um sofortige, genaue und hilfreiche Antworten auf Kundenanfragen zu liefern. Er...

3 Min. Lesezeit
KI-Kundenservice-Chatbot mit Übergabe an Menschen
KI-Kundenservice-Chatbot mit Übergabe an Menschen

KI-Kundenservice-Chatbot mit Übergabe an Menschen

Ein KI-gestützter Kundenservice-Chatbot, der Benutzer automatisch unterstützt, Informationen aus internen Dokumenten und dem Web abruft und bei Bedarf nahtlos a...

3 Min. Lesezeit
KI-Kundensupport-Agent mit LiveAgent-API-Integration
KI-Kundensupport-Agent mit LiveAgent-API-Integration

KI-Kundensupport-Agent mit LiveAgent-API-Integration

Dieser KI-gestützte Workflow automatisiert den Kundensupport, indem er Benutzeranfragen mit Wissensquellen des Unternehmens, externen APIs (wie LiveAgent) und e...

4 Min. Lesezeit
KI-Lead-Generierungs-Chatbot mit E-Mail-Benachrichtigung
KI-Lead-Generierungs-Chatbot mit E-Mail-Benachrichtigung

KI-Lead-Generierungs-Chatbot mit E-Mail-Benachrichtigung

Dieser KI-gestützte Lead-Generierungs-Chatbot bietet personalisierten Kundensupport basierend auf Ihrer internen Wissensdatenbank, identifiziert potenzielle Lea...

3 Min. Lesezeit
KI-Support-Chatbot mit LiveAgent-Integration
KI-Support-Chatbot mit LiveAgent-Integration

KI-Support-Chatbot mit LiveAgent-Integration

Automatisieren Sie Ihren Kundensupport mit einem KI-Chatbot, der Fragen basierend auf Ihrer internen Wissensdatenbank beantwortet und Nutzer bei Bedarf nahtlos ...

4 Min. Lesezeit
LiveAgent KI-Chatbot-Support
LiveAgent KI-Chatbot-Support

LiveAgent KI-Chatbot-Support

Automatisieren Sie den Kundensupport in LiveAgent mit einem KI-Chatbot, der Fragen mithilfe Ihrer internen Wissensdatenbank beantwortet, relevante Dokumente abr...

4 Min. Lesezeit
Semantische Wissensdatenbank-Suche
Semantische Wissensdatenbank-Suche

Semantische Wissensdatenbank-Suche

Durch semantische Suche mit KI können Sie ganz einfach Informationen aus privaten Wissensdatenbank-Dokumenten suchen und abrufen. Der Ablauf erweitert Benutzera...

3 Min. Lesezeit
SEO-Content-Gap-Analyzer
SEO-Content-Gap-Analyzer

SEO-Content-Gap-Analyzer

Dieser KI-gestützte Workflow analysiert die Inhaltsstruktur Ihrer Webseite, vergleicht sie mit den bestplatzierten Wettbewerberseiten und liefert maßgeschneider...

4 Min. Lesezeit
Shopify KI-Kundensupport-Agent
Shopify KI-Kundensupport-Agent

Shopify KI-Kundensupport-Agent

Ein Workflow für einen KI-gestützten Kundendienst-Agenten, der Anfragen zu Shopify-Produkten beantworten, den Bestellstatus abrufen und Informationen aus intern...

4 Min. Lesezeit
Smartsupp KI-Chatbot mit Übergabe an menschliche Agenten
Smartsupp KI-Chatbot mit Übergabe an menschliche Agenten

Smartsupp KI-Chatbot mit Übergabe an menschliche Agenten

Dieser Workflow erstellt einen KI-gestützten Chatbot, der in Smartsupp integriert ist und eine interne Wissensdatenbank nutzt, um Kundenanfragen im Support zu b...

3 Min. Lesezeit
Technische Dokumentation in SEO-Artikel umwandeln
Technische Dokumentation in SEO-Artikel umwandeln

Technische Dokumentation in SEO-Artikel umwandeln

Verwandeln Sie technische Dokumentation von einer URL in einen überzeugenden, SEO-optimierten Artikel für Ihre Website. Dieser Flow analysiert die bestplatziert...

4 Min. Lesezeit
Website- & Video-Fazitgenerator
Website- & Video-Fazitgenerator

Website- & Video-Fazitgenerator

Erstellen Sie mithilfe von KI prägnante Fazits aus Websites, hochgeladenen Dokumenten oder YouTube-Videos. Perfekt, um schnell die wichtigsten Erkenntnisse zusa...

3 Min. Lesezeit

Häufig gestellte Fragen

Was ist die Dokumenten-Retriever-Komponente?

Diese Komponente ermöglicht es dem Flow, Wissen aus Ihren eigenen Quellen wie Dokumenten und URLs abzurufen. So wird sichergestellt, dass die zurückgegebenen Informationen relevant, zuverlässig und aktuell sind.

Warum kann ich einen Dokumenten-Retriever nicht mit dem Chat Output verbinden?

Retriever-Komponenten erzeugen strukturierte Daten, die nicht für die Ausgabe geeignet sind. Sie müssen zuerst in Text- oder visuelles Format umgewandelt werden, bevor sie an die Chat Output-Komponente gesendet werden.

Woher bezieht der Knowledge Retriever seine Informationen?

Die Komponente sucht nach der nächsten Übereinstimmung der Anfrage innerhalb der Informationen von benutzerdefinierten URLs, Dokumenten und Zeitplänen.

Wie viele Dokumente gibt sie zurück?

Sie können eine Begrenzung für die Anzahl der zurückgegebenen Ergebnisse festlegen, sodass nur die relevantesten Inhalte in Ihren Flow aufgenommen werden.

Kann ich filtern, welche Dokumente durchsucht werden?

Ja, Sie können nach Dokumentenkategorien, Zeitplänen oder URLs filtern und die Suche so auf bestimmte Segmente Ihrer Wissensdatenbank fokussieren.

Kann ich sowohl den Dokumenten-Retriever als auch GoogleSearch verbinden? Und falls ja, welche Komponente wird priorisiert?

Sie können beide gleichzeitig verwenden. Jeder Retriever führt zu einer eigenen Ausgabe, wobei die Priorisierung durch die Reihenfolge der Ausgaben im Canvas festgelegt wird. Die erste Ausgabe von oben wird priorisiert.

Testen Sie FlowHunts Dokumenten-Retriever

Entwickeln Sie intelligentere KI-Lösungen, indem Sie Ihre Wissensquellen verbinden und sicherstellen, dass Ihr Chatbot immer relevante, aktuelle Antworten liefert.

Mehr erfahren

GoogleSearch-Komponente
GoogleSearch-Komponente

GoogleSearch-Komponente

Die GoogleSearch-Komponente von FlowHunt verbessert die Genauigkeit von Chatbots durch Retrieval-Augmented Generation (RAG) und ermöglicht den Zugriff auf aktue...

4 Min. Lesezeit
AI Components +4
Wissensquellen
Wissensquellen

Wissensquellen

Wissensquellen machen es kinderleicht, die KI nach Ihren Bedürfnissen zu trainieren. Entdecken Sie alle Möglichkeiten, Wissen mit FlowHunt zu verknüpfen. Verbin...

3 Min. Lesezeit
AI Knowledge Management +3
Fragebeantwortung
Fragebeantwortung

Fragebeantwortung

Fragebeantwortung mit Retrieval-Augmented Generation (RAG) kombiniert Informationsabruf und natürliche Sprachgenerierung, um große Sprachmodelle (LLMs) zu verbe...

5 Min. Lesezeit
AI Question Answering +4