Recuperador de Archivos

Convierte archivos subidos en documentos accesibles dentro de tu flujo, con opciones para OCR y estrategias de procesamiento de documentos.

Recuperador de Archivos

Descripción del componente

Cómo funciona el componente Recuperador de Archivos

Componente Recuperador de Archivos

El Recuperador de Archivos es un componente de flujo diseñado para extraer y convertir el contenido de archivos en documentos estructurados, haciéndolos accesibles para procesamiento posterior en tus flujos de trabajo de IA. Este componente es especialmente útil cuando necesitas integrar conocimientos a partir de archivos o documentos subidos por usuarios como parte de tu pipeline de IA, como para análisis de documentos, resumen o tareas de generación aumentada por recuperación.

Qué hace el componente

En esencia, el Recuperador de Archivos toma uno o más archivos adjuntos y los procesa para extraer su contenido textual, transformándolos en documentos que pueden usarse en etapas posteriores de tu flujo de trabajo. Ofrece opciones avanzadas como Reconocimiento Óptico de Caracteres (OCR) para documentos basados en imágenes, estrategias de extracción personalizables y control de tokens de salida.

Entradas clave

Nombre de entradaDescripciónTipoPredeterminado / OpcionesAvanzado
ArchivosArchivos a convertir en documentos.FlowSessionAttachmentResponse— (El usuario sube o proporciona archivos)No
Aplicar OCRAplica OCR para extraer texto de documentos basados en imágenes. Útil para PDFs escaneados, imágenes.Booleanfalse
Máx. tokensNúmero máximo de tokens en el texto de salida. Controla el tamaño/longitud del texto extraído.Integer3000
EstrategiaEstrategia para transformar documentos:
- Concatenar documentos, llenar desde el primero hasta el límite de tokens
- Incluir tamaño igual de cada documento
String (Desplegable)Incluir tamaño igual de cada documento
Nombre de herramientaNombre opcional para referirse a esta herramienta en flujos basados en agentes.String
Descripción de herramientaDescripción opcional para ayudar a los agentes a entender cómo usar esta herramienta.String (Multilínea)
VerboseSi se muestra salida detallada (para depuración o logs detallados).Booleanfalse

Salidas

El componente proporciona múltiples salidas para adaptarse a diferentes necesidades posteriores:

Nombre de salidaTipoDescripción
DocumentosMensajeDocumentos procesados como objetos de mensaje, listos para el flujo de trabajo.
Documentos sin procesarDocumentoLos documentos extraídos en bruto, dándote acceso directo al contenido.
HerramientaHerramientaLos documentos disponibles como herramienta para flujos basados en agentes.

¿Por qué usar el Recuperador de Archivos?

  • Integración fluida de conocimiento basado en archivos: Incorpora fácilmente contenido de archivos subidos (PDF, imágenes, texto, etc.) en tus flujos de trabajo de IA.
  • Soporte para OCR: Extrae automáticamente texto de imágenes o documentos escaneados, ampliando la gama de tipos de archivo utilizables.
  • Estrategias de extracción flexibles: Elige entre concatenar documentos o distribuir el contenido de forma equitativa, con límites de tokens para ajustarse a restricciones de modelos posteriores.
  • Listo para agentes: Los campos opcionales de nombre y descripción de herramienta facilitan su referencia en procesos dirigidos por agentes.
  • Personalizable y transparente: Opciones avanzadas para salida detallada y control de tokens ayudan en la depuración y optimización del rendimiento del flujo.

Casos de uso típicos

  • Ingesta de conocimiento: Transformar documentos proporcionados por usuarios en datos estructurados para modelos de IA.
  • Análisis documental: Preparar documentos para tareas de resumen, búsqueda o respuesta a preguntas.
  • Herramientas para agentes: Permitir que agentes de IA accedan a documentos como herramientas con descripciones y referencias claras.

Este componente proporciona una base sólida y flexible para incorporar contenido externo de archivos en tus procesos impulsados por IA, mejorando la inteligencia y adaptabilidad de tus flujos de trabajo.

Ejemplos de plantillas de flujo utilizando el componente Recuperador de Archivos

Para ayudarle a comenzar rápidamente, hemos preparado varios ejemplos de plantillas de flujo que demuestran cómo utilizar el componente Recuperador de Archivos de manera efectiva. Estas plantillas muestran diferentes casos de uso y mejores prácticas, facilitando la comprensión e implementación del componente en sus propios proyectos.

Preguntas frecuentes

¿Qué hace el componente Recuperador de Archivos?

Te permite subir archivos y los convierte automáticamente en documentos, que luego pueden utilizarse en tu flujo de trabajo para procesamiento posterior o como fuentes de conocimiento.

¿Puede el Recuperador de Archivos procesar documentos basados en imágenes?

Sí, admite OCR (Reconocimiento Óptico de Caracteres), lo que permite extraer texto de imágenes dentro de documentos.

¿Cómo maneja el componente múltiples archivos o documentos grandes?

Puedes configurar estrategias para la extracción de documentos, como combinar contenido o distribuir el texto de manera uniforme, y establecer límites con opciones de máximo de tokens.

¿Qué tipos de salidas están disponibles en este componente?

Puede generar documentos procesados en formatos adecuados para mensajería, uso como documentos sin procesar o como herramientas para agentes dentro de tu flujo.

¿Se necesita experiencia técnica para usar el Recuperador de Archivos?

No, el componente está diseñado para ser fácil de usar, con opciones configurables tanto para necesidades básicas como avanzadas.

Prueba el Recuperador de Archivos de FlowHunt

Extrae y procesa fácilmente archivos como documentos en tus flujos de trabajo de IA. Descubre hoy la flexibilidad del componente Recuperador de Archivos.

Saber más