Récupérateur de Documents

Le Récupérateur de Documents relie les modèles d’IA à vos documents et URL choisis, permettant des réponses IA précises, à jour et pertinentes pour votre cas d’usage spécifique.

Récupérateur de Documents

Description du composant

Comment fonctionne le composant Récupérateur de Documents

Le principal inconvénient des grands modèles de langage est leur tendance à présenter des informations vagues, obsolètes ou carrément fausses. Pour garantir que les réponses soient toujours à jour et adaptées à votre cas d’usage, les modèles génératifs doivent être reliés aux bonnes sources de connaissances.

Cette approche, appelée Génération Augmentée par Récupération (RAG), fournit aux modèles génératifs vos propres sources de connaissances. Les composants récupérateurs, dont le Récupérateur de Documents, vous permettent d’utiliser cette méthode.

Qu’est-ce que le composant Récupérateur de Documents ?

Ce composant permet au chatbot de récupérer des connaissances à partir de vos propres sources, garantissant que l’information soit pertinente, fiable et à jour. Cette information provient directement des sources que vous avez spécifiées dans les Documents et Plannings. Le rôle de ce composant est de contrôler la récupération.

Flowhunt's Knowledge Retriever

Requête d’entrée

Spécifie la requête utilisée pour rechercher l’information pertinente. Elle peut être liée depuis un composant ou saisie manuellement. Dans la plupart des cas, votre requête d’entrée sera l’Entrée de Chat.

Nombre de documents

Ce paramètre limite la quantité de documents à récupérer dans le flux, afin de garantir que les résultats restent pertinents et rapides à générer.

Catégories de documents

Ce paramètre optionnel vous permet de limiter la récupération à l’une des catégories que vous avez créées dans l’écran Documents des Sources de Connaissance.

Plannings

Permet de limiter la récupération à l’un des plannings que vous avez spécifiés dans l’écran Plannings des Sources de Connaissance.

Seuil

Les sources de votre base de connaissances correspondent à la requête à des degrés divers. L’IA les classe par pertinence de 0 à 1. Ce paramètre vous permet de contrôler à quel point la sortie doit correspondre à la requête.

Le seuil exact dépend de votre cas d’usage, mais généralement, 0,7 à 0,8 est recommandé pour obtenir des réponses très pertinentes à partir d’un nombre raisonnable de sources.

Imaginez que vous fixiez le seuil à 0,6 et que vous ayez les articles suivants :

  • Article A : 0,8
  • Article B : 0,65
  • Article C : 0,5
  • Article D : 0,9

Seuls les articles ayant un score de pertinence supérieur à 0,6 seront inclus dans la sortie, c’est-à-dire uniquement A, B et D.

  • Un seuil élevé, tel que 0,9, retournera des résultats très pertinents qui correspondent étroitement à la requête, mais il pourrait avoir du mal à trouver suffisamment de documents et en manquer certains pertinents.
  • Un seuil bas, par exemple en dessous de 0,5, fournira des informations provenant de plus de documents, mais risque de retourner des informations non pertinentes.

Comment connecter le composant Récupérateur de Documents à votre flow

Le composant contient une seule poignée d’entrée et une de sortie :

  • Requête d’entrée : La requête peut être toute sortie textuelle. Les cas d’usage courants sont la connexion à l’Entrée de Chat humaine ou à un Générateur.
  • Sortie : La sortie de tout composant de type récupérateur est toujours un Document.

La sortie Document contient des données structurées inadaptées à la sortie finale du chat. Tous les composants qui prennent des Documents en entrée les transforment dans un format convivial. Il s’agit soit de composants Widget, soit du transformateur Document vers Texte.

Pourquoi utiliser le Récupérateur de Documents ?

  • Ancrer les modèles IA : Améliorez la précision factuelle et la pertinence des sorties IA en fournissant de l’information contextuelle et réelle provenant de la base de connaissances de votre organisation.
  • Augmentation contextuelle : Fournissez aux LLM ou chatbots des documents de référence ou du matériel d’appui pour des réponses plus informées.
  • Filtrage flexible : La recherche peut être affinée par catégorie, planning, URL, structure du document ou métadonnées, vous assurant de faire remonter uniquement les informations les plus pertinentes.
  • Sortie sur mesure : Choisissez la quantité de contenu à récupérer, comment le découper, et quelles métadonnées inclure, facilitant ainsi l’adaptation aux processus IA ou aux besoins d’interface.
  • Intégration agent : Avec la description et le nom des outils, le composant peut être référencé comme un outil dans des architectures à agents.

Exemples d’utilisation

  • Génération Augmentée par Récupération (RAG) : Fournissez aux LLM des documents de support pour générer des réponses précises et étayées par la connaissance.
  • Chatbots et assistants virtuels : Faites rapidement remonter des FAQ ou des documents de politique en réponse aux questions des employés ou clients.
  • Enrichissement des données : Récupérez des métadonnées produit, auteur ou autres pour une analyse IA approfondie ou l’automatisation des workflows.

Exemple

Essayons maintenant ! Avant de construire le flow, nous devons nous assurer d’avoir créé des Documents ou Plannings pertinents. S’il n’existe pas de bonne source, le chatbot s’excusera de ne pas pouvoir répondre.

Étapes :

  1. Commencez par l’Entrée de Chat.
  2. Ajoutez le Récupérateur de Documents et connectez l’Entrée de Chat comme Requête d’entrée.
  3. La sortie est un Document qui doit être transformé ; pour cet exemple, nous utiliserons le transformateur Document vers Texte.
  4. Ensuite, connectez un Générateur IA.
  5. Vous êtes prêt à discuter.
Example of how to use Document Retriever in Flowhunt

Notre flow peut désormais rechercher nos sources à partir d’une requête humaine, transformer les données structurées en texte lisible, puis les transmettre à l’IA pour générer une réponse conviviale.

Nos Sources de Connaissance contiennent un planning configuré pour explorer la page de tarification de FlowHunt afin d’obtenir des informations à jour. Demandons au bot d’en parler :

Flowhunt bot's answer about URLsLab's pricing

Exemples de modèles de flux utilisant le composant Récupérateur de Documents

Pour vous aider à démarrer rapidement, nous avons préparé plusieurs exemples de modèles de flux qui démontrent comment utiliser efficacement le composant Récupérateur de Documents. Ces modèles présentent différents cas d'utilisation et meilleures pratiques, facilitant votre compréhension et l'implémentation du composant dans vos propres projets.

Questions fréquemment posées

Qu’est-ce que le composant Récupérateur de Documents ?

Ce composant permet au Flow de récupérer des connaissances à partir de vos propres sources, telles que des documents et des URL, garantissant que l’information retournée soit pertinente, fiable et à jour.

Pourquoi ne puis-je pas connecter un Récupérateur de Documents à la Sortie de Chat ?

Les composants de récupération créent des données structurées qui ne conviennent pas à une sortie directe. Elles doivent d’abord être transformées en texte ou en format visuel avant d’être envoyées au composant de sortie de chat.

D’où le Récupérateur de Connaissances tire-t-il ses informations ?

Le composant recherche la correspondance la plus proche à la requête parmi les informations issues des URL, documents et plannings spécifiés par l’utilisateur.

Combien de documents retourne-t-il ?

Vous pouvez définir une limite pour le nombre de résultats retournés, assurant ainsi que seul le contenu le plus pertinent soit inclus dans votre flow.

Puis-je filtrer les documents recherchés ?

Oui, vous pouvez filtrer par catégories de documents, plannings ou URL, afin de concentrer la recherche sur des segments spécifiques de votre base de connaissances.

Puis-je connecter à la fois le Récupérateur de Documents et GoogleSearch ? Si oui, lequel est prioritaire ?

Vous pouvez utiliser les deux simultanément. Chaque récupérateur mène à sa propre sortie, la priorité étant définie par l’ordre des sorties sur le canevas. La première sortie en haut est prioritaire.

Essayez le Récupérateur de Documents de FlowHunt

Créez des solutions IA plus intelligentes en connectant vos sources de connaissances et en garantissant que votre chatbot délivre toujours des réponses pertinentes et à jour.

En savoir plus