Recuperador de Documentos

El Recuperador de Documentos enlaza modelos de IA con los documentos y URLs que elijas, permitiendo respuestas precisas, actualizadas y relevantes de la IA para tu caso de uso específico.

Recuperador de Documentos

Descripción del componente

Cómo funciona el componente Recuperador de Documentos

El mayor inconveniente de los grandes modelos de lenguaje es su tendencia a presentar información vaga, desactualizada o incluso falsa. Para asegurar que las respuestas estén siempre actualizadas y sean relevantes para tu caso de uso, los modelos generativos deben dirigirse a las fuentes de conocimiento adecuadas.

Este enfoque, llamado Generación Aumentada por Recuperación (RAG), proporciona a los modelos generativos tus propias fuentes de conocimiento. Los componentes de recuperación, incluido el Recuperador de Documentos, te permiten utilizar este método.

¿Qué es el componente Recuperador de Documentos?

Este componente permite que el chatbot recupere conocimiento de tus propias fuentes, asegurando que la información sea relevante, fiable y esté actualizada. Esta información proviene directamente de las fuentes que has especificado en Documentos y Horarios. El papel de este componente es controlar la recuperación.

Flowhunt's Knowledge Retriever

Consulta de Entrada

Especifica la consulta que se utiliza para buscar información relevante. Puede vincularse desde un componente o introducirse manualmente. En la mayoría de los casos, tu consulta de entrada será la Entrada de Chat.

Cantidad de Documentos

Esta configuración limita la cantidad de documentos de los que el flujo debe recuperar información, asegurando que los resultados sigan siendo relevantes y no tarden demasiado en generarse.

Categorías de Documentos

Esta configuración opcional te permite limitar la recuperación a una de las categorías que has creado en la pantalla de Documentos de Fuentes de Conocimiento.

Horarios

Te permite limitar la recuperación a uno de los Horarios que has especificado en la pantalla de Horarios de Fuentes de Conocimiento.

Umbral

Las fuentes en tu base de conocimientos coincidirán con la consulta en diferentes grados. La IA clasificará estos resultados por relevancia de 0 a 1. Esta configuración te permite controlar cuán bien debe coincidir la salida con la consulta.

El umbral exacto depende de tu caso de uso, pero generalmente se recomienda 0,7-0,8 para respuestas muy relevantes de una cantidad razonable de fuentes.

Imagina que estableces el umbral en 0,6 y tienes los siguientes artículos:

  • Artículo A: 0,8
  • Artículo B: 0,65
  • Artículo C: 0,5
  • Artículo D: 0,9

Solo los artículos con un puntaje de relevancia superior a 0,6 aparecerán en la salida, es decir, solo A, B y D.

  • Un umbral alto, como 0,9, devolverá resultados muy relevantes que coinciden estrechamente con la consulta, pero puede tener dificultades para encontrar suficientes documentos y omitir algunos relevantes.
  • Un umbral bajo, por ejemplo, uno por debajo de 0,5, proporcionará información de más documentos, pero corre el riesgo de devolver información irrelevante.

Cómo conectar el componente Recuperador de Documentos a tu flujo

El componente contiene solo una entrada y una salida:

  • Consulta de Entrada: La consulta puede ser cualquier salida de texto. Los casos de uso comunes serían conectar la Entrada de Chat humana o un Generador.
  • Salida: La salida de cualquier componente de tipo recuperador siempre es un Documento.

La salida de Documento contiene datos estructurados no aptos para la salida final del chat. Todos los componentes que toman Documentos como su entrada los transforman a un formato fácil de usar. Estos pueden ser componentes Widget o el transformador de Documento a Texto.

¿Por qué usar el Recuperador de Documentos?

  • Afianzamiento de Modelos de IA: Mejora la precisión factual y la relevancia de las respuestas de la IA proporcionando información real y contextual de la base de conocimiento de tu organización.
  • Aumento Contextual: Proporciona a LLMs o chatbots documentos de apoyo o material de referencia para respuestas más informadas.
  • Filtrado Flexible: La búsqueda puede ajustarse por categoría, horario, URL, estructura del documento o metadatos, asegurando que solo se muestre la información más relevante.
  • Salida Personalizada: Elige cuánto contenido recuperar, cómo dividirlo y qué metadatos incluir, facilitando la adaptación para procesos de IA posteriores o necesidades de la interfaz de usuario.
  • Integración con Agentes: Con descripciones y nombres de herramientas, el componente puede referenciarse como una herramienta en arquitecturas basadas en agentes.

Ejemplos de Uso

  • Generación Aumentada por Recuperación (RAG): Proporciona a LLMs documentos de apoyo para generar respuestas precisas y respaldadas por conocimiento.
  • Chatbots y Asistentes Virtuales: Muestra rápidamente preguntas frecuentes o documentos de políticas en respuesta a preguntas de empleados o clientes.
  • Enriquecimiento de Datos: Obtén producto, autor u otros metadatos para análisis posteriores impulsados por IA o automatización de flujos de trabajo.

Ejemplo

¡Probémoslo ahora! Antes de construir el flujo, debemos asegurarnos de haber creado Documentos o Horarios relevantes. Si no hay una buena fuente presente, el chatbot se disculpará por no poder responder.

Pasos:

  1. Comienza con Entrada de Chat.
  2. Añade el Recuperador de Documentos y conecta la Entrada de Chat como la Consulta de Entrada.
  3. La salida es un Documento que necesita ser transformado; para este ejemplo, usaremos el transformador de Documento a Texto.
  4. A continuación, conecta un Generador de IA.
  5. Ya estás listo para chatear.
Example of how to use Document Retriever in Flowhunt

Ahora nuestro Flujo puede buscar en nuestras fuentes según una consulta humana, transformar los datos estructurados en texto legible y pasarlos a la IA para generar una respuesta amigable para el usuario.

Nuestras Fuentes de Conocimiento contienen un Horario configurado para rastrear la página de precios de FlowHunt y ofrecer información actualizada. Preguntemos al bot sobre ello:

Flowhunt bot's answer about URLsLab's pricing

Ejemplos de plantillas de flujo utilizando el componente Recuperador de Documentos

Para ayudarle a comenzar rápidamente, hemos preparado varios ejemplos de plantillas de flujo que demuestran cómo utilizar el componente Recuperador de Documentos de manera efectiva. Estas plantillas muestran diferentes casos de uso y mejores prácticas, facilitando la comprensión e implementación del componente en sus propios proyectos.

Preguntas frecuentes

¿Qué es el componente Recuperador de Documentos?

Este componente permite que el Flujo recupere conocimiento de tus propias fuentes, como documentos y URLs, asegurando que la información devuelta sea relevante, fiable y esté actualizada.

¿Por qué no puedo conectar un Recuperador de Documentos a la Salida de Chat?

Los componentes de recuperación crean datos estructurados que no son aptos para la salida. Primero debe transformarse a formato de texto o visual antes de enviarlo al componente de Salida de Chat.

¿De dónde obtiene información el Recuperador de Conocimiento?

El componente busca la coincidencia más cercana de la consulta dentro de la información de los URLs, documentos y horarios especificados por el usuario.

¿Cuántos documentos devuelve?

Puedes establecer un límite para la cantidad de resultados devueltos, asegurando que solo el contenido más relevante se incluya en tu flujo.

¿Puedo filtrar qué documentos se buscan?

Sí, puedes filtrar por categorías de documentos, horarios o URLs, enfocando la búsqueda en segmentos específicos de tu base de conocimiento.

¿Puedo conectar tanto el Recuperador de Documentos como GoogleSearch? Si es así, ¿cuál tiene prioridad?

Puedes usar ambos simultáneamente. Cada recuperador lleva a su propia salida, con prioridad establecida por el orden de las salidas en el lienzo. La primera salida desde arriba tiene prioridad.

Prueba el Recuperador de Documentos de FlowHunt

Construye soluciones de IA más inteligentes conectando tus fuentes de conocimiento y asegurando que tu chatbot siempre ofrezca respuestas relevantes y actualizadas.

Saber más