Recuperador de Archivos
Convierte archivos subidos en documentos accesibles dentro de tu flujo, con opciones para OCR y estrategias de procesamiento de documentos.

Descripción del componente
Cómo funciona el componente Recuperador de Archivos
Componente Recuperador de Archivos
El Recuperador de Archivos es un componente de flujo diseñado para extraer y convertir el contenido de archivos en documentos estructurados, haciéndolos accesibles para procesamiento posterior en tus flujos de trabajo de IA. Este componente es especialmente útil cuando necesitas integrar conocimientos a partir de archivos o documentos subidos por usuarios como parte de tu pipeline de IA, como para análisis de documentos, resumen o tareas de generación aumentada por recuperación.
Qué hace el componente
En esencia, el Recuperador de Archivos toma uno o más archivos adjuntos y los procesa para extraer su contenido textual, transformándolos en documentos que pueden usarse en etapas posteriores de tu flujo de trabajo. Ofrece opciones avanzadas como Reconocimiento Óptico de Caracteres (OCR) para documentos basados en imágenes, estrategias de extracción personalizables y control de tokens de salida.
Entradas clave
Nombre de entrada | Descripción | Tipo | Predeterminado / Opciones | Avanzado |
---|---|---|---|---|
Archivos | Archivos a convertir en documentos. | FlowSessionAttachmentResponse | — (El usuario sube o proporciona archivos) | No |
Aplicar OCR | Aplica OCR para extraer texto de documentos basados en imágenes. Útil para PDFs escaneados, imágenes. | Boolean | false | Sí |
Máx. tokens | Número máximo de tokens en el texto de salida. Controla el tamaño/longitud del texto extraído. | Integer | 3000 | Sí |
Estrategia | Estrategia para transformar documentos: - Concatenar documentos, llenar desde el primero hasta el límite de tokens - Incluir tamaño igual de cada documento | String (Desplegable) | Incluir tamaño igual de cada documento | Sí |
Nombre de herramienta | Nombre opcional para referirse a esta herramienta en flujos basados en agentes. | String | — | Sí |
Descripción de herramienta | Descripción opcional para ayudar a los agentes a entender cómo usar esta herramienta. | String (Multilínea) | — | Sí |
Verbose | Si se muestra salida detallada (para depuración o logs detallados). | Boolean | false | Sí |
Salidas
El componente proporciona múltiples salidas para adaptarse a diferentes necesidades posteriores:
Nombre de salida | Tipo | Descripción |
---|---|---|
Documentos | Mensaje | Documentos procesados como objetos de mensaje, listos para el flujo de trabajo. |
Documentos sin procesar | Documento | Los documentos extraídos en bruto, dándote acceso directo al contenido. |
Herramienta | Herramienta | Los documentos disponibles como herramienta para flujos basados en agentes. |
¿Por qué usar el Recuperador de Archivos?
- Integración fluida de conocimiento basado en archivos: Incorpora fácilmente contenido de archivos subidos (PDF, imágenes, texto, etc.) en tus flujos de trabajo de IA.
- Soporte para OCR: Extrae automáticamente texto de imágenes o documentos escaneados, ampliando la gama de tipos de archivo utilizables.
- Estrategias de extracción flexibles: Elige entre concatenar documentos o distribuir el contenido de forma equitativa, con límites de tokens para ajustarse a restricciones de modelos posteriores.
- Listo para agentes: Los campos opcionales de nombre y descripción de herramienta facilitan su referencia en procesos dirigidos por agentes.
- Personalizable y transparente: Opciones avanzadas para salida detallada y control de tokens ayudan en la depuración y optimización del rendimiento del flujo.
Casos de uso típicos
- Ingesta de conocimiento: Transformar documentos proporcionados por usuarios en datos estructurados para modelos de IA.
- Análisis documental: Preparar documentos para tareas de resumen, búsqueda o respuesta a preguntas.
- Herramientas para agentes: Permitir que agentes de IA accedan a documentos como herramientas con descripciones y referencias claras.
Este componente proporciona una base sólida y flexible para incorporar contenido externo de archivos en tus procesos impulsados por IA, mejorando la inteligencia y adaptabilidad de tus flujos de trabajo.
Ejemplos de plantillas de flujo utilizando el componente Recuperador de Archivos
Para ayudarle a comenzar rápidamente, hemos preparado varios ejemplos de plantillas de flujo que demuestran cómo utilizar el componente Recuperador de Archivos de manera efectiva. Estas plantillas muestran diferentes casos de uso y mejores prácticas, facilitando la comprensión e implementación del componente en sus propios proyectos.
Preguntas frecuentes
- ¿Qué hace el componente Recuperador de Archivos?
Te permite subir archivos y los convierte automáticamente en documentos, que luego pueden utilizarse en tu flujo de trabajo para procesamiento posterior o como fuentes de conocimiento.
- ¿Puede el Recuperador de Archivos procesar documentos basados en imágenes?
Sí, admite OCR (Reconocimiento Óptico de Caracteres), lo que permite extraer texto de imágenes dentro de documentos.
- ¿Cómo maneja el componente múltiples archivos o documentos grandes?
Puedes configurar estrategias para la extracción de documentos, como combinar contenido o distribuir el texto de manera uniforme, y establecer límites con opciones de máximo de tokens.
- ¿Qué tipos de salidas están disponibles en este componente?
Puede generar documentos procesados en formatos adecuados para mensajería, uso como documentos sin procesar o como herramientas para agentes dentro de tu flujo.
- ¿Se necesita experiencia técnica para usar el Recuperador de Archivos?
No, el componente está diseñado para ser fácil de usar, con opciones configurables tanto para necesidades básicas como avanzadas.
Prueba el Recuperador de Archivos de FlowHunt
Extrae y procesa fácilmente archivos como documentos en tus flujos de trabajo de IA. Descubre hoy la flexibilidad del componente Recuperador de Archivos.