El Recuperador de Documentos enlaza modelos de IA con los documentos y URLs que elijas, permitiendo respuestas precisas, actualizadas y relevantes de la IA para tu caso de uso específico.
Cómo funciona el componente Recuperador de Documentos
The most significant setback of large language models is their tendency to present vague, outdated, or downright false information. To ensure the answers are always up to date and relevant to your use case, generative models need to be pointed to the right knowledge sources.
This approach, called the Retrieval-Augmented Generation (RAG), supplies generative models with your own knowledge sources. The retriever components, including the Document Retriever, allow you to use this method.
What is the Document Retriever component?
This component allows the chatbot to retrieve knowledge from your own sources, ensuring that the information is relevant, reliable, and up-to-date. This information comes directly from the sources you specified in the Documents and Schedules. The role of this component is to control the retrieval.
Input Query
Specifies the query that’s used to look up relevant information. It can either be linked from a component or inputted manually. In most cases, your input query will be the Chat Input.
Document Count
This setting limits the amount of documents the flow should retrieve from, making sure the results remain relevant and don’t take too long to generate.
Document categories
This optional setting lets you limit the retrieval to one of the categories you’ve created in the Documents screen of Knowledge Sources.
Schedules
Lets you limit the retrieval to one of the Schedules you’ve specified in the Schedules screen of Knowledge Sources.
Threshold
The sources in your knowledge database will match the query to varying degrees. AI will rank these by relevance from 0 to 1. This setting lets you control how well the output must match the query.
The exact threshold depends on your use case, but generally, 0.7-0.8 is recommended for highly relevant answers from a reasonable amount of sources.
Imagine you set the threshold to 0.6 and have the following articles:
Article A: 0.8
Article B: 0.65
Article C: 0.5
Article D: 0.9
Only the articles with a relevance score of over 0.6 will make it into the output, that is, only A, B, and D.
A high threshold, such as 0.9, will return very relevant results that closely match the query, but it might struggle to find enough documents and miss some relevant ones.
A low threshold, for example, one below 0.5, will provide information from more documents, but it runs the risk of returning irrelevant information.
How to connect the Document Retriever component to your flow
The component contains just one input and one output handle:
Input Query: The query can be any text output. Common use cases would be connecting human Chat Input or a Generator.
Output: The output of any retriever-type component is always a Document.
The Document output contains structured data unsuitable for the final chat output. All components that take Documents as their input transform them into a user-friendly format. These are either Widget components or the Document to Text transformer.
Why Use the Document Retriever?
Grounding AI Models: Enhance the factual accuracy and relevance of AI outputs by providing real, contextual information from your organization’s knowledge base.
Contextual Augmentation: Supply LLMs or chatbots with supporting documents or reference material for more informed responses.
Flexible Filtering: Search can be fine-tuned by category, schedule, URL, document structure, or metadata, ensuring you surface only the most relevant information.
Custom Output: Choose how much content to retrieve, how to split it, and which metadata to include, making it easy to adapt for downstream AI processes or UI needs.
Agent Integration: With tool descriptions and naming, the component can be referenced as a tool in agent-based architectures.
Example Use Cases
Retrieval-Augmented Generation (RAG): Provide LLMs with supporting documents to generate accurate, knowledge-backed responses.
Chatbots and Virtual Assistants: Quickly surface FAQs or policy documents in response to employee/customer questions.
Data Enrichment: Pull in product, author, or other metadata for further AI-driven analysis or workflow automation.
Example
Let’s Try it Now! Before building the flow, we must ensure we have created relevant Documents or Schedules. If no good source is present, the chatbot will either apologize for being unable to answer.
Steps:
Start with Chat Input.
Add the Document Retriever and connect Chat Input as the Input Query.
The output is a Document that needs to be transformed; for this example, we will use the Document to Text.
Next, connect an AI Generator.
You’re ready to chat.
Now our Flow can search our sources based on a human query, transform the structured data into readable text, and pass it to AI to generate a user-friendly answer.
Our Knowledge Sources contain a Schedule set to crawl FlowHunt’s pricing page for up-to-date information. Let’s ask the bot about it:
Ejemplos de plantillas de flujo utilizando el componente Recuperador de Documentos
Para ayudarle a comenzar rápidamente, hemos preparado varios ejemplos de plantillas de flujo que demuestran cómo utilizar el componente Recuperador de Documentos de manera efectiva. Estas plantillas muestran diferentes casos de uso y mejores prácticas, facilitando la comprensión e implementación del componente en sus propios proyectos.
Agente de Soporte al Cliente con Base de Conocimientos y Enriquecimiento por API impulsado por IA
Este flujo de trabajo impulsado por IA automatiza el soporte al cliente combinando la búsqueda en la base de conocimientos interna, la recuperación de informaci...
Agente de soporte al cliente con integración de API LiveAgent
Este flujo de trabajo impulsado por IA automatiza el soporte al cliente conectando las consultas de los usuarios con fuentes de conocimiento de la empresa, APIs...
Un flujo de trabajo para un agente de atención al cliente impulsado por IA que puede responder consultas sobre productos de Shopify, recuperar el estado de los ...
Este flujo de trabajo impulsado por IA analiza la estructura de contenido de tu página web, la compara con las páginas de la competencia mejor posicionadas y pr...
Asistente de chatbot de IA impulsado por OpenAI GPT-4o que busca y aprovecha automáticamente documentos internos de la empresa para responder preguntas de los u...
Automatiza la gestión de la bandeja de entrada de Gmail con un agente de IA que lee los correos entrantes, utiliza tu base de conocimientos para redactar respue...
Automatización de Respuesta de Correos de Outlook Potenciada por IA
Automatice las respuestas profesionales de correo electrónico en Outlook utilizando un agente de IA que aprovecha fuentes de conocimiento organizacional. Los co...
Busca y recupera fácilmente información de documentos privados de la base de conocimiento usando búsqueda semántica impulsada por IA. El flujo amplía las consul...
Chatbot de Atención al Cliente con IA y Transferencia a Humano
Un chatbot de atención al cliente impulsado por IA que asiste automáticamente a los usuarios, recupera información de documentos internos y de la web, y transfi...
Chatbot de generación de leads con IA y notificación por correo electrónico
Este chatbot de generación de leads potenciado por IA proporciona soporte personalizado al cliente utilizando tu base de conocimientos interna, identifica posib...
Este flujo de trabajo impulsado por IA automatiza la calificación de leads y la gestión de contactos en HubSpot. El chatbot recopila información del usuario, in...
Despliega un chatbot inteligente de soporte al cliente para LiveAgent que responde automáticamente las preguntas de los visitantes, recupera documentos de la ba...
Chatbot de IA con FreshChat y Soporte de Base de Conocimientos
Despliega un chatbot de IA inteligente que se integra perfectamente con FreshChat. El chatbot responde a las consultas de los usuarios utilizando tu base de con...
Despliega un chatbot potenciado por IA en tu sitio web que aprovecha tu base de conocimientos interna para responder a las consultas de los clientes, y deriva s...
Chatbot de IA con Transferencia Humana a través de Tawk
Un chatbot de soporte en vivo potenciado por IA que responde preguntas de los clientes utilizando una base de conocimientos interna y transfiere de manera intel...
Un chatbot de servicio al cliente impulsado por IA que utiliza tus fuentes de conocimiento internas para proporcionar respuestas instantáneas, precisas y útiles...
Este flujo de trabajo crea un chatbot potenciado por IA integrado con Smartsupp, aprovechando una base de conocimientos interna para responder consultas de aten...
Automatiza tu soporte al cliente con un chatbot de IA que responde preguntas utilizando tu base de conocimientos interna y conecta sin problemas a los usuarios ...
Transforma documentación técnica de una URL en un artículo atractivo y optimizado para SEO para tu sitio web. Este flujo analiza el contenido de los principales...
Generador de Conclusiones para Sitios Web y Videos
Genera conclusiones concisas a partir de sitios web, documentos subidos o videos de YouTube usando IA. Perfecto para resumir rápidamente los puntos clave y crea...
Genera automáticamente un párrafo corto y atractivo para tu sitio web que incluye enlaces a los artículos relacionados más relevantes. Este flujo de trabajo imp...
Automatiza la atención al cliente en LiveAgent con un chatbot de IA que responde preguntas utilizando tu base de conocimientos interna, recupera documentos rele...
Este flujo de trabajo agiliza la traducción de archivos markdown de HUGO a idiomas de destino mientras preserva la estructura y el formato del archivo. Aprovech...
4 min de lectura
Preguntas frecuentes
¿Qué es el componente Recuperador de Documentos?
Este componente permite que el Flujo recupere conocimiento de tus propias fuentes, como documentos y URLs, asegurando que la información devuelta sea relevante, fiable y esté actualizada.
¿Por qué no puedo conectar un Recuperador de Documentos a la Salida de Chat?
Los componentes de recuperación crean datos estructurados que no son aptos para la salida. Primero debe transformarse a formato de texto o visual antes de enviarlo al componente de Salida de Chat.
¿De dónde obtiene información el Recuperador de Conocimiento?
El componente busca la coincidencia más cercana de la consulta dentro de la información de los URLs, documentos y horarios especificados por el usuario.
¿Cuántos documentos devuelve?
Puedes establecer un límite para la cantidad de resultados devueltos, asegurando que solo el contenido más relevante se incluya en tu flujo.
¿Puedo filtrar qué documentos se buscan?
Sí, puedes filtrar por categorías de documentos, horarios o URLs, enfocando la búsqueda en segmentos específicos de tu base de conocimiento.
¿Puedo conectar tanto el Recuperador de Documentos como GoogleSearch? Si es así, ¿cuál tiene prioridad?
Puedes usar ambos simultáneamente. Cada recuperador lleva a su propia salida, con prioridad establecida por el orden de las salidas en el lienzo. La primera salida desde arriba tiene prioridad.
Prueba el Recuperador de Documentos de FlowHunt
Construye soluciones de IA más inteligentes conectando tus fuentes de conocimiento y asegurando que tu chatbot siempre ofrezca respuestas relevantes y actualizadas.
El componente GoogleSearch de FlowHunt mejora la precisión del chatbot utilizando Generación Aumentada por Recuperación (RAG) para acceder a conocimientos actua...
Las Fuentes de Conocimiento facilitan enseñar a la IA según tus necesidades. Descubre todas las formas de vincular el conocimiento con FlowHunt. Conecta fácilme...
La Respuesta a Preguntas con Generación Aumentada por Recuperación (RAG) combina la recuperación de información y la generación de lenguaje natural para mejorar...
6 min de lectura
AI
Question Answering
+4
Consentimiento de Cookies Usamos cookies para mejorar tu experiencia de navegación y analizar nuestro tráfico. See our privacy policy.