Description du flux
Objectif et avantages
Aperçu du flux de recherche sémantique
Ce flux, intitulé « Recherche sémantique », permet aux utilisateurs de rechercher des informations au sein de leur base de connaissances privée en s’appuyant sur des modèles de langage avancés et des techniques de recherche sémantique. Il est conçu pour explorer tous les domaines programmés, documents et sections Q&R, automatisant la récupération des informations les plus pertinentes en réponse aux requêtes des utilisateurs.
Interaction utilisateur et message d’accueil
Lorsqu’un utilisateur ouvre l’interface de chat, le flux déclenche un message d’accueil :
- Widget de message affiche :
👋 Bienvenue dans l’outil de recherche de la base de connaissances privée !
Je suis là pour vous aider à explorer les documents de votre base de connaissances privée 📚. J’examinerai tous les domaines programmés, documents privés et sections Q&R pour trouver l’information dont vous avez besoin.
Saisissez simplement votre requête et commençons à chercher les réponses ! ✨🔍
Ce message convivial oriente l’utilisateur et l’invite à saisir sa requête de recherche.
Traitement et expansion de la requête
Saisie de l’utilisateur :
L’utilisateur soumet une requête via le champ de saisie du chat.
Expansion de la requête :
- La requête est envoyée à un composant Expansion de la requête.
- Alimenté par un modèle de langage OpenAI (spécifiquement,
gpt-4o-mini
), ce composant génère jusqu’à trois reformulations ou requêtes sémantiquement proches. - L’objectif est d’augmenter les chances de retrouver tous les documents pertinents, même si la formulation initiale de la requête est ambiguë ou limitée.
Composant | Rôle |
---|
Saisie de chat | Collecte la question de recherche de l’utilisateur |
OpenAI LLM (gpt-4o-mini) | Génère des formulations alternatives de la requête |
Expansion de la requête | Produit jusqu’à 3 variantes de requête pour la recherche |
Recherche de documents
- Les requêtes élargies sont transmises à un Document Retriever.
- Ce composant recherche dans la base de connaissances privée de l’utilisateur, y compris les domaines programmés, documents et sections Q&R.
- Il extrait jusqu’à 10 des documents les plus pertinents, en se concentrant sur le contenu des en-têtes
<H1>
pour maximiser la pertinence contextuelle.
Présentation des résultats
- Les documents récupérés sont transmis à un Widget de document, qui les formatte et les présente de manière adaptée au chat.
- Les résultats finaux compilés sont affichés à l’utilisateur dans l’interface de chat.
Étape | Composant | Type de sortie |
---|
Récupérer les documents | Document Retriever | Documents bruts |
Formater les résultats | Widget de document | Message |
Afficher à l’utilisateur | Sortie de chat | Message de chat |
Schéma du flux
flowchart LR
A[Chat Opened] --> B[Welcome Message]
B --> C[User Query Input]
C --> D[Query Expansion\n(OpenAI LLM)]
D --> E[Document Retriever]
E --> F[Document Widget]
F --> G[Chat Output]
Avantages et cas d’utilisation
- Automatisation : Le flux automatise la recherche sémantique, économisant des efforts manuels et garantissant une expérience conviviale et guidée à chaque utilisateur.
- Scalabilité : En élargissant les requêtes et en recherchant dans toutes les sources pertinentes, le flux offre une couverture robuste, adaptée aux bases de connaissances volumineuses ou complexes.
- Précision : Exploiter des LLM pour la reformulation réduit le risque de manquer des informations en raison de la formulation de la requête.
- Expérience utilisateur : Un retour immédiat et des instructions claires rendent l’outil accessible, même aux publics non techniques.
Cas d’utilisation typiques :
- Gestion interne des connaissances pour les équipes de support
- Portails de recherche FAQ et documents à l’échelle de l’entreprise
- Assistants automatisés pour des ensembles de données privés ou propriétaires
En associant recherche sémantique et expansion de requête via LLM, ce flux garantit un accès efficace à la connaissance pertinente, favorisant la productivité et la découverte d’informations.