Récupérateur de Documents

Le Récupérateur de Documents relie les modèles d’IA à vos documents et URL choisis, permettant des réponses IA précises, à jour et pertinentes pour votre cas d’usage spécifique.

Récupérateur de Documents

Description du composant

Comment fonctionne le composant Récupérateur de Documents

The most significant setback of large language models is their tendency to present vague, outdated, or downright false information. To ensure the answers are always up to date and relevant to your use case, generative models need to be pointed to the right knowledge sources.

This approach, called the Retrieval-Augmented Generation (RAG), supplies generative models with your own knowledge sources. The retriever components, including the Document Retriever, allow you to use this method.

What is the Document Retriever component?

This component allows the chatbot to retrieve knowledge from your own sources, ensuring that the information is relevant, reliable, and up-to-date. This information comes directly from the sources you specified in the Documents and Schedules. The role of this component is to control the retrieval.

Flowhunt's Knowledge Retriever

Input Query

Specifies the query that’s used to look up relevant information. It can either be linked from a component or inputted manually. In most cases, your input query will be the Chat Input.

Document Count

This setting limits the amount of documents the flow should retrieve from, making sure the results remain relevant and don’t take too long to generate.

Document categories

This optional setting lets you limit the retrieval to one of the categories you’ve created in the Documents screen of Knowledge Sources.

Schedules

Lets you limit the retrieval to one of the Schedules you’ve specified in the Schedules screen of Knowledge Sources.

Threshold

The sources in your knowledge database will match the query to varying degrees. AI will rank these by relevance from 0 to 1. This setting lets you control how well the output must match the query.

The exact threshold depends on your use case, but generally, 0.7-0.8 is recommended for highly relevant answers from a reasonable amount of sources.

Imagine you set the threshold to 0.6 and have the following articles:

  • Article A: 0.8
  • Article B: 0.65
  • Article C: 0.5
  • Article D: 0.9

Only the articles with a relevance score of over 0.6 will make it into the output, that is, only A, B, and D.

  • A high threshold, such as 0.9, will return very relevant results that closely match the query, but it might struggle to find enough documents and miss some relevant ones.
  • A low threshold, for example, one below 0.5, will provide information from more documents, but it runs the risk of returning irrelevant information.

How to connect the Document Retriever component to your flow

The component contains just one input and one output handle:

  • Input Query: The query can be any text output. Common use cases would be connecting human Chat Input or a Generator.
  • Output: The output of any retriever-type component is always a Document.

The Document output contains structured data unsuitable for the final chat output. All components that take Documents as their input transform them into a user-friendly format. These are either Widget components or the Document to Text transformer.

Why Use the Document Retriever?

  • Grounding AI Models: Enhance the factual accuracy and relevance of AI outputs by providing real, contextual information from your organization’s knowledge base.
  • Contextual Augmentation: Supply LLMs or chatbots with supporting documents or reference material for more informed responses.
  • Flexible Filtering: Search can be fine-tuned by category, schedule, URL, document structure, or metadata, ensuring you surface only the most relevant information.
  • Custom Output: Choose how much content to retrieve, how to split it, and which metadata to include, making it easy to adapt for downstream AI processes or UI needs.
  • Agent Integration: With tool descriptions and naming, the component can be referenced as a tool in agent-based architectures.

Example Use Cases

  • Retrieval-Augmented Generation (RAG): Provide LLMs with supporting documents to generate accurate, knowledge-backed responses.
  • Chatbots and Virtual Assistants: Quickly surface FAQs or policy documents in response to employee/customer questions.
  • Data Enrichment: Pull in product, author, or other metadata for further AI-driven analysis or workflow automation.

Example

Let’s Try it Now! Before building the flow, we must ensure we have created relevant Documents or Schedules. If no good source is present, the chatbot will either apologize for being unable to answer.

Steps:

  1. Start with Chat Input.
  2. Add the Document Retriever and connect Chat Input as the Input Query.
  3. The output is a Document that needs to be transformed; for this example, we will use the Document to Text.
  4. Next, connect an AI Generator.
  5. You’re ready to chat.
Example of how to use Document Retriever in Flowhunt

Now our Flow can search our sources based on a human query, transform the structured data into readable text, and pass it to AI to generate a user-friendly answer.

Our Knowledge Sources contain a Schedule set to crawl FlowHunt’s pricing page for up-to-date information. Let’s ask the bot about it:

Flowhunt bot's answer about URLsLab's pricing

Exemples de modèles de flux utilisant le composant Récupérateur de Documents

Pour vous aider à démarrer rapidement, nous avons préparé plusieurs exemples de modèles de flux qui démontrent comment utiliser efficacement le composant Récupérateur de Documents. Ces modèles présentent différents cas d'utilisation et meilleures pratiques, facilitant votre compréhension et l'implémentation du composant dans vos propres projets.

Agent d’Assistance Client Shopify IA
Agent d’Assistance Client Shopify IA

Agent d’Assistance Client Shopify IA

Un workflow pour un agent de service client alimenté par l’IA, capable de répondre aux questions sur les produits Shopify, de récupérer le statut des commandes ...

4 min de lecture
Agent de support client IA avec intégration API LiveAgent
Agent de support client IA avec intégration API LiveAgent

Agent de support client IA avec intégration API LiveAgent

Ce workflow alimenté par l’IA automatise le support client en connectant les demandes des utilisateurs aux sources de connaissances de l'entreprise, à des API e...

6 min de lecture
Analyseur d'écart de contenu SEO
Analyseur d'écart de contenu SEO

Analyseur d'écart de contenu SEO

Ce flux de travail alimenté par l'IA analyse la structure de contenu de votre page web, la compare avec les pages concurrentes les mieux classées et fournit des...

5 min de lecture
Assistant de base de connaissances ChatGPT
Assistant de base de connaissances ChatGPT

Assistant de base de connaissances ChatGPT

Assistant chatbot IA propulsé par OpenAI GPT-4o qui recherche automatiquement et exploite les documents internes de l'entreprise pour répondre aux questions des...

4 min de lecture
Assistant Email IA pour Gmail
Assistant Email IA pour Gmail

Assistant Email IA pour Gmail

Automatisez la gestion de la boîte de réception Gmail avec un agent IA qui lit les emails entrants, exploite votre base de connaissances pour rédiger des répons...

4 min de lecture
Automatisation des réponses email Outlook alimentée par l’IA
Automatisation des réponses email Outlook alimentée par l’IA

Automatisation des réponses email Outlook alimentée par l’IA

Automatisez les réponses professionnelles aux emails dans Outlook grâce à un agent IA exploitant les sources de connaissances organisationnelles. Les emails ent...

4 min de lecture
Chatbot de génération de leads HubSpot avec IA
Chatbot de génération de leads HubSpot avec IA

Chatbot de génération de leads HubSpot avec IA

Ce workflow alimenté par l'IA automatise la qualification des leads et la gestion des contacts dans HubSpot. Le chatbot collecte les informations des utilisateu...

4 min de lecture
Chatbot de génération de leads IA avec notification par e-mail
Chatbot de génération de leads IA avec notification par e-mail

Chatbot de génération de leads IA avec notification par e-mail

Ce chatbot de génération de leads alimenté par l’IA offre un support client personnalisé en s’appuyant sur votre base de connaissances interne, identifie les pr...

4 min de lecture
Chatbot de service client IA
Chatbot de service client IA

Chatbot de service client IA

Un chatbot de service client alimenté par l'IA qui utilise vos sources de connaissances internes pour fournir des réponses instantanées, précises et utiles aux ...

4 min de lecture
Chatbot de service client IA avec transfert à un humain
Chatbot de service client IA avec transfert à un humain

Chatbot de service client IA avec transfert à un humain

Un chatbot de service client alimenté par l'IA qui assiste automatiquement les utilisateurs, récupère des informations depuis des documents internes et le web, ...

4 min de lecture
Chatbot de support IA avec intégration LiveAgent
Chatbot de support IA avec intégration LiveAgent

Chatbot de support IA avec intégration LiveAgent

Automatisez votre support client avec un chatbot IA qui répond aux questions en utilisant votre base de connaissances interne et connecte sans effort les utilis...

5 min de lecture
Chatbot IA avec Escalade Humaine via Slack
Chatbot IA avec Escalade Humaine via Slack

Chatbot IA avec Escalade Humaine via Slack

Déployez un chatbot de support client intelligent pour LiveAgent qui répond automatiquement aux questions des visiteurs, récupère des documents de la base de co...

5 min de lecture
Chatbot IA avec FreshChat et Base de Connaissances
Chatbot IA avec FreshChat et Base de Connaissances

Chatbot IA avec FreshChat et Base de Connaissances

Déployez un chatbot IA intelligent qui s’intègre parfaitement à FreshChat. Le chatbot répond aux questions des utilisateurs en utilisant votre base de connaissa...

4 min de lecture
Chatbot IA avec intégration LiveChat.com
Chatbot IA avec intégration LiveChat.com

Chatbot IA avec intégration LiveChat.com

Déployez un chatbot alimenté par l'IA sur votre site web qui exploite votre base de connaissances interne pour répondre aux questions des clients, et transfère ...

4 min de lecture
Chatbot IA avec transfert humain Tawk
Chatbot IA avec transfert humain Tawk

Chatbot IA avec transfert humain Tawk

Un chatbot de support en direct alimenté par l'IA qui répond aux questions des clients à l'aide d'une base de connaissances interne et transfère intelligemment ...

4 min de lecture
Chatbot IA Smartsupp avec transfert vers un humain
Chatbot IA Smartsupp avec transfert vers un humain

Chatbot IA Smartsupp avec transfert vers un humain

Ce workflow crée un chatbot alimenté par l'IA intégré à Smartsupp, exploitant une base de connaissances interne pour répondre aux demandes du support client. Si...

4 min de lecture
Convertir la documentation technique en article SEO
Convertir la documentation technique en article SEO

Convertir la documentation technique en article SEO

Transformez la documentation technique d'une URL en un article captivant et optimisé SEO pour votre site web. Ce flux analyse le contenu des concurrents les mie...

5 min de lecture
Générateur de conclusions pour sites web et vidéos
Générateur de conclusions pour sites web et vidéos

Générateur de conclusions pour sites web et vidéos

Générez des conclusions concises à partir de sites web, documents téléchargés ou vidéos YouTube grâce à l’IA. Parfait pour résumer rapidement les points clés et...

4 min de lecture
Générateur de paragraphe d’articles connexes
Générateur de paragraphe d’articles connexes

Générateur de paragraphe d’articles connexes

Génère automatiquement un court paragraphe attrayant pour votre site web, incluant des liens vers les articles connexes les plus pertinents. Ce flux de travail ...

5 min de lecture
Recherche sémantique dans la base de connaissances
Recherche sémantique dans la base de connaissances

Recherche sémantique dans la base de connaissances

Recherchez et récupérez facilement des informations dans des documents de base de connaissances privés grâce à la recherche sémantique alimentée par l'IA. Le fl...

3 min de lecture
Support Chatbot IA pour LiveAgent
Support Chatbot IA pour LiveAgent

Support Chatbot IA pour LiveAgent

Automatisez le support client dans LiveAgent avec un chatbot IA qui répond aux questions en utilisant votre base de connaissances interne, récupère les document...

5 min de lecture
Traducteur de fichiers Markdown HUGO
Traducteur de fichiers Markdown HUGO

Traducteur de fichiers Markdown HUGO

Ce workflow rationalise la traduction des fichiers markdown HUGO dans les langues cibles tout en préservant la structure du fichier et sa mise en forme. Grâce à...

4 min de lecture

Questions fréquemment posées

Qu’est-ce que le composant Récupérateur de Documents ?

Ce composant permet au Flow de récupérer des connaissances à partir de vos propres sources, telles que des documents et des URL, garantissant que l’information retournée soit pertinente, fiable et à jour.

Pourquoi ne puis-je pas connecter un Récupérateur de Documents à la Sortie de Chat ?

Les composants de récupération créent des données structurées qui ne conviennent pas à une sortie directe. Elles doivent d’abord être transformées en texte ou en format visuel avant d’être envoyées au composant de sortie de chat.

D’où le Récupérateur de Connaissances tire-t-il ses informations ?

Le composant recherche la correspondance la plus proche à la requête parmi les informations issues des URL, documents et plannings spécifiés par l’utilisateur.

Combien de documents retourne-t-il ?

Vous pouvez définir une limite pour le nombre de résultats retournés, assurant ainsi que seul le contenu le plus pertinent soit inclus dans votre flow.

Puis-je filtrer les documents recherchés ?

Oui, vous pouvez filtrer par catégories de documents, plannings ou URL, afin de concentrer la recherche sur des segments spécifiques de votre base de connaissances.

Puis-je connecter à la fois le Récupérateur de Documents et GoogleSearch ? Si oui, lequel est prioritaire ?

Vous pouvez utiliser les deux simultanément. Chaque récupérateur mène à sa propre sortie, la priorité étant définie par l’ordre des sorties sur le canevas. La première sortie en haut est prioritaire.

Essayez le Récupérateur de Documents de FlowHunt

Créez des solutions IA plus intelligentes en connectant vos sources de connaissances et en garantissant que votre chatbot délivre toujours des réponses pertinentes et à jour.

En savoir plus

Composant GoogleSearch
Composant GoogleSearch

Composant GoogleSearch

Le composant GoogleSearch de FlowHunt améliore la précision des chatbots grâce au Retrieval-Augmented Generation (RAG) pour accéder à des connaissances à jour d...

4 min de lecture
AI Components +4
Sources de connaissances
Sources de connaissances

Sources de connaissances

Les sources de connaissances facilitent l’enseignement de l’IA selon vos besoins. Découvrez toutes les façons de relier le savoir avec FlowHunt. Connectez facil...

3 min de lecture
AI Knowledge Management +3
Questions-Réponses
Questions-Réponses

Questions-Réponses

Les questions-réponses avec la génération augmentée par récupération (RAG) combinent la recherche d'informations et la génération de langage naturel pour amélio...

7 min de lecture
AI Question Answering +4