Réduisez les hallucinations de l’IA en ajoutant des bases de connaissances personnalisées
Découvrez comment la fonctionnalité Schedule de FlowHunt permet à votre chatbot d’accéder à des informations à jour, réduit les hallucinations de l’IA et améliore la précision des réponses grâce à l’indexation automatisée de votre domaine.

Indexation
Présentation de la fonctionnalité Schedule de FlowHunt
Dans l’article d’aujourd’hui, nous allons explorer la fonctionnalité des plannings dans FlowHunt et comment elle peut être utilisée pour indexer efficacement votre domaine. En configurant des plannings, vous vous assurez que votre chatbot dispose des informations les plus à jour, réduisant ainsi le risque d’hallucinations de l’IA et améliorant la précision des réponses.
FlowHunt
13 août 2024
Importance de l’indexation de domaine pour les chatbots
Pour qu’un chatbot fournisse des réponses précises et pertinentes, il doit avoir accès à un contenu bien indexé. En crawlant régulièrement votre domaine, vos URLs ou vos sitemaps, le chatbot peut maintenir une compréhension complète du contenu, ce qui conduit à des réponses plus précises.
Réduire les hallucinations des LLM avec des données précises
Les hallucinations de l’IA surviennent lorsqu’un modèle génère des informations qui ne sont pas basées sur les données fournies. Cela peut être atténué en s’assurant que le chatbot a accès aux informations les plus exactes et récentes de votre domaine grâce à une indexation régulière.
Comprendre l’indexation de site web
Qu’est-ce que la fonctionnalité Schedule ?
La fonctionnalité Schedule dans FlowHunt vous permet d’automatiser le processus de crawling de votre domaine, de vos URLs spécifiques ou même de vos sitemaps. Cela garantit que votre chatbot reste informé des dernières mises à jour de votre site.
Types de contenus que vous pouvez indexer (domaines, URLs, sitemaps)
FlowHunt offre une grande flexibilité sur ce que vous pouvez crawler—qu’il s’agisse d’un domaine entier, d’URLs spécifiques ou de sitemaps structurés. Cette fonctionnalité est particulièrement utile pour les sites web qui mettent fréquemment à jour leur contenu, tels que les blogs ou les sites e-commerce.
Paramétrage des fréquences de crawl : quotidien, hebdomadaire, mensuel, annuel
Vous pouvez définir la fréquence de vos crawls pour qu’elle corresponde au rythme de mise à jour de votre site web. Par exemple, si vous publiez du nouveau contenu chaque jour, définir la fréquence de crawl sur quotidien garantit que votre chatbot reste à jour avec les dernières informations.
Avantages de l’utilisation des plannings pour l’indexation de domaine
Garantir l’exactitude et la pertinence du contenu
Des crawls programmés régulièrement garantissent que toutes les informations indexées par le chatbot sont à jour, ce qui conduit à des réponses plus précises. C’est essentiel pour fournir aux utilisateurs des informations fiables et actuelles.
Améliorer les réponses du chatbot avec des données actualisées
Avec un accès au contenu le plus récent, votre chatbot peut générer des réponses à la fois pertinentes et précises. Cette capacité est particulièrement précieuse pour les sites proposant des comparaisons de produits, des avis détaillés ou disposant de FAQ étendues.
Minimiser le risque d’hallucinations dans les réponses de l’IA
En indexant constamment votre domaine, vous minimisez le risque d’hallucinations de l’IA, où le chatbot pourrait générer des réponses basées sur des données obsolètes ou non pertinentes. Cela conduit à une expérience utilisateur plus fiable et digne de confiance.
Cas d’usage pratiques de l’indexation de domaine
Curateurs de sites web
Les curateurs de sites web peuvent grandement bénéficier de la fonctionnalité des plannings en s’assurant que tout le contenu du site est indexé et facilement accessible par le chatbot. Cela fait du chatbot un outil puissant pour naviguer et fournir des informations sur le site.
Comparaisons de produits pour les e-shops
Les plateformes e-commerce peuvent utiliser cette fonctionnalité pour permettre au chatbot d’effectuer des comparaisons de produits précises. En ayant accès à tous les détails pertinents des produits, le chatbot peut accompagner les clients dans leur processus de décision de manière plus efficace.
Curation générale de site web et récupération d’informations
Au-delà du e-commerce, tout site nécessitant une récupération d’informations détaillée —comme les plateformes éducatives, les prestataires de services ou les bibliothèques de contenus—peut tirer parti de cette fonctionnalité. Le chatbot peut servir de guide complet, dirigeant les utilisateurs vers les informations spécifiques dont ils ont besoin.
Guide étape par étape pour créer un chatbot avec la fonctionnalité Schedule
Accéder à l’onglet Schedules
Pour commencer à utiliser la fonctionnalité des plannings, rendez-vous dans l’onglet Schedules de FlowHunt. C’est ici que vous configurerez votre planning de crawl pour indexer votre domaine ou un contenu spécifique de votre site.

Créer un nouveau planning
Cliquez sur Créer un nouveau planning pour débuter le processus. Ici, vous serez invité à sélectionner le domaine, les URLs ou le sitemap que vous souhaitez indexer.

Sélectionner les domaines, URLs ou sitemaps à crawler
Pour de meilleurs résultats, si votre site possède un sitemap structuré, utilisez-le pour le crawl. Les sitemaps fournissent une liste complète des URLs de votre site, facilitant l’indexation de tout le contenu pertinent par le chatbot.
Choisir la fréquence de crawl
Ensuite, choisissez à quelle fréquence le domaine ou le sitemap doit être crawlé. Pour les sites fréquemment mis à jour, un crawl quotidien peut être nécessaire. Pour d’autres, un crawl hebdomadaire ou mensuel peut suffire.
Créer un Flow dans FlowHunt
Accéder à l’onglet “Mes Flows”
Après avoir configuré votre planning, rendez-vous dans l’onglet Mes Flows. C’est ici que vous créerez un nouveau flow qui utilisera le contenu indexé.
Créer et nommer votre Flow
Commencez par donner à votre flow un nom descriptif qui reflète l’objectif de votre projet. Cela vous permettra de l’identifier plus facilement par la suite.
Comprendre le canevas du Flow
Le canevas du flow est votre espace de travail dans FlowHunt. Il a été conçu pour être intuitif, vous permettant de faire glisser et déposer les composants, de les connecter, et de créer une séquence logique qui guide l’agent IA de l’entrée à la sortie.
Composants essentiels d’un Flow
Composant d’entrée : capturer les requêtes utilisateur
Le composant d’entrée est l’endroit où la requête de l’utilisateur sera saisie. C’est le point de départ de votre flow, capturant la question ou le sujet que l’utilisateur souhaite explorer.
Composant de sortie : délivrer les réponses de l’IA
Le composant de sortie est l’endroit où la réponse de l’agent IA sera délivrée. C’est le produit final de votre flow, contenant les informations extraites et traitées par l’outil.

Ajouter l’expansion de requête pour de meilleurs résultats de recherche
Pour améliorer la compréhension des requêtes utilisateur par le LLM (Large Language Model), ajoutez un composant d’expansion de requête. Ce composant reformule les requêtes d’entrée en plusieurs alternatives, améliorant ainsi les capacités de recherche sémantique de votre chatbot.

Améliorer les réponses de l’IA avec des composants additionnels
Intégration de l’historique de conversation
L’ajout de l’intégration de l’historique de conversation permet au chatbot de se souvenir des interactions passées, ce qui lui permet d’adapter ses réponses en fonction des requêtes précédentes de l’utilisateur. Cela conduit à une expérience plus personnalisée.
Intégration des LLM : choisir GPT-3.5 Turbo pour un bon rapport qualité/prix
Pour le composant d’expansion de requête, vous pouvez intégrer un LLM tel que GPT-3.5 Turbo. Bien que ce modèle ne soit pas le plus rapide ni le plus puissant, il est économique et suffisant pour traiter les requêtes sans générer de nouveau contenu.
Utiliser les extracteurs de documents pour accéder au contenu indexé
Le composant extracteur de documents est essentiel pour accéder aux informations de vos pages crawlées. Puisque vous utilisez des plannings pour indexer votre domaine, ce composant sera la principale source de données pour les réponses du chatbot.
Configuration du composant extracteur de documents
Connecter l’extracteur de documents à l’expansion de requête
Reliez le composant extracteur de documents au composant d’expansion de requête. Cette connexion permet au chatbot d’extraire des informations pertinentes de votre contenu indexé selon la requête élargie.

Lier le planning à l’extracteur de documents
Ajoutez ensuite votre planning à l’extracteur de documents. Cela garantit que le chatbot puise ses informations dans le crawl le plus récent de votre domaine ou sitemap.
Ajuster les paramètres pour une sortie optimale
Vous pouvez ajuster les paramètres dans le composant extracteur de documents pour affiner la sortie. Cela peut impliquer de régler la quantité d’informations récupérées ou les parties du contenu à privilégier dans la réponse.
Création de prompts et génération de contenu dans votre Flow
Ajouter l’outil de prompt à votre Flow
Une fois vos données prêtes, il est temps de générer des réponses textuelles. Ajoutez l’outil de prompt à votre flow, en le connectant à l’extracteur de documents en tant que contexte et au composant d’entrée en tant qu’entrée.
Utiliser l’extracteur de documents comme contexte
L’extracteur de documents sert de contexte pour l’outil de prompt, fournissant les informations de fond nécessaires que le chatbot utilisera pour générer ses réponses.

Affiner les prompts pour obtenir les réponses souhaitées
Vous pouvez personnaliser le prompt pour orienter plus efficacement les réponses du chatbot. Cela peut consister à spécifier le ton, le style ou les informations particulières que le chatbot doit inclure dans ses réponses.
Notre prompt :
vous êtes un curateur de site web qui ne répond que sur la base du contenu reçu de l’extracteur de documents. et si vous ne connaissez pas la réponse, informez l’utilisateur.
Votre tâche est de répondre aux requêtes clients dans INPUT en tenant compte de la conversation précédente dans CHAT HISTORY.
Si CONTEXT est fourni, utilisez-le pour générer la réponse.
— CONTEXT START
{context}
— CONTEXT END— CHAT HISTORY START
{chat_history}
— CHAT HISTORY END— INPUT START
{input}
— INPUT ENDRépondez dans la langue : {lang}
Formatez la réponse en markdown.
RÉPONSE :
Finalisation de votre Flow
Connecter le composant générateur à un LLM
Enfin, connectez le composant générateur à un LLM puissant. Cela permettra au chatbot de produire la sortie finale qui sera délivrée à l’utilisateur.
Configurer la sortie pour les interactions utilisateurs
Assurez-vous que la sortie est configurée pour répondre aux objectifs de votre chatbot, qu’il s’agisse de fournir des liens, de générer du contenu ou d’offrir des conseils selon la requête de l’utilisateur.

Améliorer l’expérience utilisateur avec du contenu lié
Puisque votre chatbot utilise des informations indexées et crawlées, vous pouvez améliorer l’expérience utilisateur en fournissant des liens vers le contenu pertinent. Ajoutez un widget de documents à votre flow et reliez-le à l’extracteur de documents, donnant ainsi aux utilisateurs un accès direct aux pages dont ils ont besoin.

Conclusion
Récapitulatif des points clés
Dans ce guide, nous avons vu comment utiliser la fonctionnalité Schedule de FlowHunt pour indexer votre domaine et améliorer la précision de votre chatbot. En crawlant régulièrement votre site, vous vous assurez que le chatbot dispose des informations les plus récentes, limitant ainsi les hallucinations de l’IA.
Dernières réflexions sur la réduction des hallucinations des LLM
Réduire les hallucinations de l’IA est essentiel pour maintenir la confiance des utilisateurs et garantir que votre chatbot délivre des informations de qualité et précises. En exploitant la fonctionnalité Schedule de FlowHunt, vous pouvez maintenir la base de connaissances de votre chatbot à jour et ainsi fournir des réponses fiables aux questions de vos utilisateurs.
Voici une capture d’écran du Flow finalisé :

Questions fréquemment posées
- Qu’est-ce que la fonctionnalité Schedule dans FlowHunt ?
La fonctionnalité Schedule vous permet d’automatiser le crawling de votre domaine, de vos URLs ou de vos sitemaps, garantissant que votre chatbot dispose des informations les plus à jour.
- Comment l’indexation de domaine réduit-elle les hallucinations de l’IA ?
En mettant régulièrement à jour la base de connaissances du chatbot avec des informations précises et actuelles, l’indexation du domaine réduit la probabilité que l’IA génère des réponses inexactes ou non pertinentes.
- Puis-je utiliser FlowHunt pour des comparaisons de produits E-Shop ?
Oui, FlowHunt est idéal pour les plateformes e-commerce. En indexant les détails des produits, le chatbot peut fournir des comparaisons détaillées et aider les utilisateurs à prendre des décisions d’achat éclairées.
- À quelle fréquence dois-je définir ma fréquence de crawl ?
La fréquence de crawl doit correspondre à la fréquence de mise à jour de votre site web. Pour les sites fréquemment mis à jour, des crawls quotidiens ou hebdomadaires sont recommandés, tandis que les sites moins fréquemment mis à jour peuvent n’avoir besoin que de crawls mensuels ou annuels.
- Quelles sont les meilleures pratiques pour la création de prompts dans FlowHunt ?
Lors de la création de prompts, il est important de fournir des instructions claires et spécifiques pour guider les réponses du chatbot. Expérimentez différents paramètres pour trouver le prompt qui convient le mieux à vos besoins.
Arshia est ingénieure en workflows d'IA chez FlowHunt. Avec une formation en informatique et une passion pour l’IA, elle se spécialise dans la création de workflows efficaces intégrant des outils d'IA aux tâches quotidiennes, afin d’accroître la productivité et la créativité.

Réduisez les hallucinations de l’IA avec FlowHunt
Découvrez comment la fonctionnalité Schedule de FlowHunt maintient votre chatbot à jour et minimise les hallucinations de l’IA. Commencez dès aujourd’hui à créer des solutions d’IA plus fiables.