Récupérateur de fichiers

Transformez les fichiers téléchargés en documents accessibles dans votre flux, avec des options d’OCR et de stratégies de traitement de documents.

Récupérateur de fichiers

Description du composant

Comment fonctionne le composant Récupérateur de fichiers

Composant Récupérateur de fichiers

Le Récupérateur de fichiers est un composant de flux conçu pour extraire et convertir le contenu des fichiers en documents structurés, les rendant accessibles pour un traitement ultérieur dans vos flux de travail IA. Ce composant est particulièrement utile lorsque vous devez intégrer des connaissances provenant de fichiers ou de documents téléchargés par les utilisateurs dans votre pipeline IA, comme pour l’analyse de documents, la synthèse ou l’augmentation de génération par récupération.

Ce que fait le composant

Au cœur de son fonctionnement, le Récupérateur de fichiers prend une ou plusieurs pièces jointes et les traite pour en extraire le contenu textuel, transformant ainsi ces fichiers en documents pouvant être utilisés plus loin dans votre flux de travail. Il offre des options avancées telles que la Reconnaissance Optique de Caractères (OCR) pour les documents basés sur des images, des stratégies d’extraction personnalisables et un contrôle des jetons de sortie.

Entrées clés

Nom de l’entréeDescriptionTypePar défaut / OptionsAvancé
FichiersFichiers à convertir en documents.FlowSessionAttachmentResponse— (L’utilisateur télécharge ou fournit des fichiers)Non
Appliquer l’OCRAppliquer l’OCR pour extraire le texte des documents basés sur des images. Utile pour les PDF scannés, images.BooléenfalseOui
Jetons maximumNombre maximum de jetons dans le texte de sortie. Contrôle la taille/longueur du texte extrait.Entier3000Oui
StratégieStratégie de transformation des documents :
- Concaténer les documents, remplir depuis le premier jusqu’à la limite de jetons
- Inclure une taille égale de chaque document
Chaîne (Menu déroulant)Inclure une taille égale de chaque documentOui
Nom de l’outilNom optionnel pour référencer cet outil dans des flux de travail pilotés par agent.ChaîneOui
Description de l’outilDescription optionnelle pour aider les agents à comprendre comment utiliser cet outil.Chaîne (Multiligne)Oui
VerbeuxAfficher une sortie détaillée (pour le débogage ou les journaux détaillés).BooléenfalseOui

Sorties

Le composant fournit plusieurs sorties pour répondre à différents besoins en aval :

Nom de la sortieTypeDescription
DocumentsMessageDocuments traités sous forme d’objets message, prêts à être utilisés dans le flux.
Documents brutsDocumentLes documents extraits bruts, vous donnant un accès direct au contenu.
OutilOutilLes documents mis à disposition comme outil pour les flux pilotés par agent.

Pourquoi utiliser le Récupérateur de fichiers ?

  • Intégration transparente des connaissances issues de fichiers : Intégrez facilement le contenu de fichiers téléchargés (PDF, images, texte, etc.) dans vos flux de travail IA.
  • Prise en charge de l’OCR : Extrait automatiquement le texte des images ou des documents scannés, élargissant la gamme des types de fichiers exploitables.
  • Stratégies d’extraction flexibles : Choisissez entre concaténer les documents ou répartir équitablement le contenu, avec des limites de jetons pour s’adapter aux contraintes des modèles en aval.
  • Prêt pour les agents : Les champs optionnels pour le nom et la description de l’outil facilitent la référence dans les processus pilotés par agent.
  • Personnalisable et transparent : Des options avancées pour une sortie verbeuse et le contrôle des jetons aident au débogage et à l’optimisation des performances du flux de travail.

Cas d’utilisation typiques

  • Ingestion de connaissances : Transformer des documents fournis par les utilisateurs en données structurées pour les modèles IA.
  • Analyse de documents : Préparer les documents pour des tâches de synthèse, de recherche ou de questions-réponses.
  • Outils pour agents : Permettre aux agents IA d’accéder aux documents comme outils, avec des descriptions et des références claires.

Ce composant offre une base robuste et flexible pour intégrer du contenu de fichiers externes dans vos processus pilotés par l’IA, renforçant ainsi l’intelligence et l’adaptabilité de vos flux de travail.

Exemples de modèles de flux utilisant le composant Récupérateur de fichiers

Pour vous aider à démarrer rapidement, nous avons préparé plusieurs exemples de modèles de flux qui démontrent comment utiliser efficacement le composant Récupérateur de fichiers. Ces modèles présentent différents cas d'utilisation et meilleures pratiques, facilitant votre compréhension et l'implémentation du composant dans vos propres projets.

Questions fréquemment posées

Que fait le composant Récupérateur de fichiers ?

Il vous permet de télécharger des fichiers et les convertit automatiquement en documents, qui peuvent ensuite être utilisés dans votre flux de travail pour un traitement ultérieur ou comme sources de connaissances.

Le Récupérateur de fichiers peut-il traiter des documents basés sur des images ?

Oui, il prend en charge l'OCR (Reconnaissance Optique de Caractères), permettant l'extraction de texte à partir d'images contenues dans les documents.

Comment le composant gère-t-il plusieurs fichiers ou de grands documents ?

Vous pouvez configurer des stratégies d'extraction de documents, comme la combinaison de contenus ou la répartition équitable du texte, et définir des limites grâce aux options de jetons maximum.

Quels types de sorties sont disponibles à partir de ce composant ?

Il peut générer des documents traités dans des formats adaptés à la messagerie, à l'utilisation brute ou comme outils pour les agents de votre flux.

Une expertise technique est-elle nécessaire pour utiliser le Récupérateur de fichiers ?

Non, le composant est conçu pour être convivial, avec des options configurables pour les besoins de base comme avancés.

Essayez le Récupérateur de fichiers FlowHunt

Extrayez et traitez facilement les fichiers sous forme de documents dans vos flux de travail IA. Découvrez dès aujourd'hui la flexibilité du composant Récupérateur de fichiers.

En savoir plus