Recuperador de Documentos

El Recuperador de Documentos enlaza modelos de IA con los documentos y URLs que elijas, permitiendo respuestas precisas, actualizadas y relevantes de la IA para tu caso de uso específico.

Recuperador de Documentos

Descripción del componente

Cómo funciona el componente Recuperador de Documentos

The most significant setback of large language models is their tendency to present vague, outdated, or downright false information. To ensure the answers are always up to date and relevant to your use case, generative models need to be pointed to the right knowledge sources.

This approach, called the Retrieval-Augmented Generation (RAG), supplies generative models with your own knowledge sources. The retriever components, including the Document Retriever, allow you to use this method.

What is the Document Retriever component?

This component allows the chatbot to retrieve knowledge from your own sources, ensuring that the information is relevant, reliable, and up-to-date. This information comes directly from the sources you specified in the Documents and Schedules. The role of this component is to control the retrieval.

Flowhunt's Knowledge Retriever

Input Query

Specifies the query that’s used to look up relevant information. It can either be linked from a component or inputted manually. In most cases, your input query will be the Chat Input.

Document Count

This setting limits the amount of documents the flow should retrieve from, making sure the results remain relevant and don’t take too long to generate.

Document categories

This optional setting lets you limit the retrieval to one of the categories you’ve created in the Documents screen of Knowledge Sources.

Schedules

Lets you limit the retrieval to one of the Schedules you’ve specified in the Schedules screen of Knowledge Sources.

Threshold

The sources in your knowledge database will match the query to varying degrees. AI will rank these by relevance from 0 to 1. This setting lets you control how well the output must match the query.

The exact threshold depends on your use case, but generally, 0.7-0.8 is recommended for highly relevant answers from a reasonable amount of sources.

Imagine you set the threshold to 0.6 and have the following articles:

  • Article A: 0.8
  • Article B: 0.65
  • Article C: 0.5
  • Article D: 0.9

Only the articles with a relevance score of over 0.6 will make it into the output, that is, only A, B, and D.

  • A high threshold, such as 0.9, will return very relevant results that closely match the query, but it might struggle to find enough documents and miss some relevant ones.
  • A low threshold, for example, one below 0.5, will provide information from more documents, but it runs the risk of returning irrelevant information.

How to connect the Document Retriever component to your flow

The component contains just one input and one output handle:

  • Input Query: The query can be any text output. Common use cases would be connecting human Chat Input or a Generator.
  • Output: The output of any retriever-type component is always a Document.

The Document output contains structured data unsuitable for the final chat output. All components that take Documents as their input transform them into a user-friendly format. These are either Widget components or the Document to Text transformer.

Why Use the Document Retriever?

  • Grounding AI Models: Enhance the factual accuracy and relevance of AI outputs by providing real, contextual information from your organization’s knowledge base.
  • Contextual Augmentation: Supply LLMs or chatbots with supporting documents or reference material for more informed responses.
  • Flexible Filtering: Search can be fine-tuned by category, schedule, URL, document structure, or metadata, ensuring you surface only the most relevant information.
  • Custom Output: Choose how much content to retrieve, how to split it, and which metadata to include, making it easy to adapt for downstream AI processes or UI needs.
  • Agent Integration: With tool descriptions and naming, the component can be referenced as a tool in agent-based architectures.

Example Use Cases

  • Retrieval-Augmented Generation (RAG): Provide LLMs with supporting documents to generate accurate, knowledge-backed responses.
  • Chatbots and Virtual Assistants: Quickly surface FAQs or policy documents in response to employee/customer questions.
  • Data Enrichment: Pull in product, author, or other metadata for further AI-driven analysis or workflow automation.

Example

Let’s Try it Now! Before building the flow, we must ensure we have created relevant Documents or Schedules. If no good source is present, the chatbot will either apologize for being unable to answer.

Steps:

  1. Start with Chat Input.
  2. Add the Document Retriever and connect Chat Input as the Input Query.
  3. The output is a Document that needs to be transformed; for this example, we will use the Document to Text.
  4. Next, connect an AI Generator.
  5. You’re ready to chat.
Example of how to use Document Retriever in Flowhunt

Now our Flow can search our sources based on a human query, transform the structured data into readable text, and pass it to AI to generate a user-friendly answer.

Our Knowledge Sources contain a Schedule set to crawl FlowHunt’s pricing page for up-to-date information. Let’s ask the bot about it:

Flowhunt bot's answer about URLsLab's pricing

Ejemplos de plantillas de flujo utilizando el componente Recuperador de Documentos

Para ayudarle a comenzar rápidamente, hemos preparado varios ejemplos de plantillas de flujo que demuestran cómo utilizar el componente Recuperador de Documentos de manera efectiva. Estas plantillas muestran diferentes casos de uso y mejores prácticas, facilitando la comprensión e implementación del componente en sus propios proyectos.

Agente de soporte al cliente con integración de API LiveAgent
Agente de soporte al cliente con integración de API LiveAgent

Agente de soporte al cliente con integración de API LiveAgent

Este flujo de trabajo impulsado por IA automatiza el soporte al cliente conectando las consultas de los usuarios con fuentes de conocimiento de la empresa, APIs...

6 min de lectura
Agente de Soporte al Cliente de Shopify con IA
Agente de Soporte al Cliente de Shopify con IA

Agente de Soporte al Cliente de Shopify con IA

Un flujo de trabajo para un agente de atención al cliente impulsado por IA que puede responder consultas sobre productos de Shopify, recuperar el estado de los ...

5 min de lectura
Analizador de Brechas de Contenido SEO
Analizador de Brechas de Contenido SEO

Analizador de Brechas de Contenido SEO

Este flujo de trabajo impulsado por IA analiza la estructura de contenido de tu página web, la compara con las páginas de la competencia mejor posicionadas y pr...

5 min de lectura
Asistente de Base de Conocimiento de ChatGPT
Asistente de Base de Conocimiento de ChatGPT

Asistente de Base de Conocimiento de ChatGPT

Asistente de chatbot de IA impulsado por OpenAI GPT-4o que busca y aprovecha automáticamente documentos internos de la empresa para responder preguntas de los u...

4 min de lectura
Asistente de correo electrónico con IA para Gmail
Asistente de correo electrónico con IA para Gmail

Asistente de correo electrónico con IA para Gmail

Automatiza la gestión de la bandeja de entrada de Gmail con un agente de IA que lee los correos entrantes, utiliza tu base de conocimientos para redactar respue...

4 min de lectura
Búsqueda Semántica en la Base de Conocimiento
Búsqueda Semántica en la Base de Conocimiento

Búsqueda Semántica en la Base de Conocimiento

Busca y recupera fácilmente información de documentos privados de la base de conocimiento usando búsqueda semántica impulsada por IA. El flujo amplía las consul...

3 min de lectura
Chatbot de Atención al Cliente con IA y Transferencia a Humano
Chatbot de Atención al Cliente con IA y Transferencia a Humano

Chatbot de Atención al Cliente con IA y Transferencia a Humano

Un chatbot de atención al cliente impulsado por IA que asiste automáticamente a los usuarios, recupera información de documentos internos y de la web, y transfi...

4 min de lectura
Chatbot de Generación de Leads de HubSpot con IA
Chatbot de Generación de Leads de HubSpot con IA

Chatbot de Generación de Leads de HubSpot con IA

Este flujo de trabajo impulsado por IA automatiza la calificación de leads y la gestión de contactos en HubSpot. El chatbot recopila información del usuario, in...

4 min de lectura
Chatbot de IA con Escalamiento Humano vía Slack
Chatbot de IA con Escalamiento Humano vía Slack

Chatbot de IA con Escalamiento Humano vía Slack

Despliega un chatbot inteligente de soporte al cliente para LiveAgent que responde automáticamente las preguntas de los visitantes, recupera documentos de la ba...

5 min de lectura
Chatbot de IA con FreshChat y Soporte de Base de Conocimientos
Chatbot de IA con FreshChat y Soporte de Base de Conocimientos

Chatbot de IA con FreshChat y Soporte de Base de Conocimientos

Despliega un chatbot de IA inteligente que se integra perfectamente con FreshChat. El chatbot responde a las consultas de los usuarios utilizando tu base de con...

4 min de lectura
Chatbot de IA con integración de LiveChat.com
Chatbot de IA con integración de LiveChat.com

Chatbot de IA con integración de LiveChat.com

Despliega un chatbot potenciado por IA en tu sitio web que aprovecha tu base de conocimientos interna para responder a las consultas de los clientes, y deriva s...

4 min de lectura
Chatbot de IA con Transferencia Humana a través de Tawk
Chatbot de IA con Transferencia Humana a través de Tawk

Chatbot de IA con Transferencia Humana a través de Tawk

Un chatbot de soporte en vivo potenciado por IA que responde preguntas de los clientes utilizando una base de conocimientos interna y transfiere de manera intel...

4 min de lectura
Chatbot de Servicio al Cliente con IA
Chatbot de Servicio al Cliente con IA

Chatbot de Servicio al Cliente con IA

Un chatbot de servicio al cliente impulsado por IA que utiliza tus fuentes de conocimiento internas para proporcionar respuestas instantáneas, precisas y útiles...

4 min de lectura
Chatbot de Smartsupp con Transferencia a Humano
Chatbot de Smartsupp con Transferencia a Humano

Chatbot de Smartsupp con Transferencia a Humano

Este flujo de trabajo crea un chatbot potenciado por IA integrado con Smartsupp, aprovechando una base de conocimientos interna para responder consultas de aten...

4 min de lectura
Chatbot de Soporte con Integración de LiveAgent
Chatbot de Soporte con Integración de LiveAgent

Chatbot de Soporte con Integración de LiveAgent

Automatiza tu soporte al cliente con un chatbot de IA que responde preguntas utilizando tu base de conocimientos interna y conecta sin problemas a los usuarios ...

5 min de lectura
Convierte Documentación Técnica en Artículo SEO
Convierte Documentación Técnica en Artículo SEO

Convierte Documentación Técnica en Artículo SEO

Transforma documentación técnica de una URL en un artículo atractivo y optimizado para SEO para tu sitio web. Este flujo analiza el contenido de los principales...

5 min de lectura
Generador de Conclusiones para Sitios Web y Videos
Generador de Conclusiones para Sitios Web y Videos

Generador de Conclusiones para Sitios Web y Videos

Genera conclusiones concisas a partir de sitios web, documentos subidos o videos de YouTube usando IA. Perfecto para resumir rápidamente los puntos clave y crea...

4 min de lectura
Generador de Párrafos de Artículos Relacionados
Generador de Párrafos de Artículos Relacionados

Generador de Párrafos de Artículos Relacionados

Genera automáticamente un párrafo corto y atractivo para tu sitio web que incluye enlaces a los artículos relacionados más relevantes. Este flujo de trabajo imp...

5 min de lectura
Soporte de Chatbot de IA para LiveAgent
Soporte de Chatbot de IA para LiveAgent

Soporte de Chatbot de IA para LiveAgent

Automatiza la atención al cliente en LiveAgent con un chatbot de IA que responde preguntas utilizando tu base de conocimientos interna, recupera documentos rele...

5 min de lectura
Traductor de archivos Markdown de HUGO
Traductor de archivos Markdown de HUGO

Traductor de archivos Markdown de HUGO

Este flujo de trabajo agiliza la traducción de archivos markdown de HUGO a idiomas de destino mientras preserva la estructura y el formato del archivo. Aprovech...

4 min de lectura

Preguntas frecuentes

¿Qué es el componente Recuperador de Documentos?

Este componente permite que el Flujo recupere conocimiento de tus propias fuentes, como documentos y URLs, asegurando que la información devuelta sea relevante, fiable y esté actualizada.

¿Por qué no puedo conectar un Recuperador de Documentos a la Salida de Chat?

Los componentes de recuperación crean datos estructurados que no son aptos para la salida. Primero debe transformarse a formato de texto o visual antes de enviarlo al componente de Salida de Chat.

¿De dónde obtiene información el Recuperador de Conocimiento?

El componente busca la coincidencia más cercana de la consulta dentro de la información de los URLs, documentos y horarios especificados por el usuario.

¿Cuántos documentos devuelve?

Puedes establecer un límite para la cantidad de resultados devueltos, asegurando que solo el contenido más relevante se incluya en tu flujo.

¿Puedo filtrar qué documentos se buscan?

Sí, puedes filtrar por categorías de documentos, horarios o URLs, enfocando la búsqueda en segmentos específicos de tu base de conocimiento.

¿Puedo conectar tanto el Recuperador de Documentos como GoogleSearch? Si es así, ¿cuál tiene prioridad?

Puedes usar ambos simultáneamente. Cada recuperador lleva a su propia salida, con prioridad establecida por el orden de las salidas en el lienzo. La primera salida desde arriba tiene prioridad.

Prueba el Recuperador de Documentos de FlowHunt

Construye soluciones de IA más inteligentes conectando tus fuentes de conocimiento y asegurando que tu chatbot siempre ofrezca respuestas relevantes y actualizadas.

Saber más

Componente GoogleSearch
Componente GoogleSearch

Componente GoogleSearch

El componente GoogleSearch de FlowHunt mejora la precisión del chatbot utilizando Generación Aumentada por Recuperación (RAG) para acceder a conocimientos actua...

4 min de lectura
AI Components +4
Fuentes de Conocimiento
Fuentes de Conocimiento

Fuentes de Conocimiento

Las Fuentes de Conocimiento facilitan enseñar a la IA según tus necesidades. Descubre todas las formas de vincular el conocimiento con FlowHunt. Conecta fácilme...

3 min de lectura
AI Knowledge Management +3
Respuesta a Preguntas
Respuesta a Preguntas

Respuesta a Preguntas

La Respuesta a Preguntas con Generación Aumentada por Recuperación (RAG) combina la recuperación de información y la generación de lenguaje natural para mejorar...

6 min de lectura
AI Question Answering +4