Recuperador de Documentos
O Recuperador de Documentos conecta modelos de IA aos documentos e URLs de sua escolha, permitindo respostas precisas, atualizadas e relevantes para o seu caso de uso específico.

Descrição do componente
Como o componente Recuperador de Documentos funciona
O maior desafio dos grandes modelos de linguagem é a tendência de apresentar informações vagas, desatualizadas ou até mesmo falsas. Para garantir que as respostas estejam sempre atualizadas e relevantes para o seu caso de uso, os modelos generativos precisam ser direcionados para as fontes de conhecimento corretas.
Essa abordagem, chamada de Geração Aumentada por Recuperação (RAG), fornece aos modelos generativos suas próprias fontes de conhecimento. Os componentes de recuperação, incluindo o Recuperador de Documentos, permitem que você utilize esse método.
O que é o componente Recuperador de Documentos?
Este componente permite que o chatbot recupere conhecimento de suas próprias fontes, garantindo que as informações sejam relevantes, confiáveis e atualizadas. Essas informações vêm diretamente das fontes que você especificou nas telas de Documentos e Agendas. O papel deste componente é controlar a recuperação.

Consulta de Entrada
Especifica a consulta usada para buscar informações relevantes. Ela pode ser conectada de um componente ou inserida manualmente. Na maioria dos casos, sua consulta de entrada será o Chat Input.
Quantidade de Documentos
Esta configuração limita a quantidade de documentos dos quais o fluxo deve recuperar informações, garantindo que os resultados permaneçam relevantes e não demorem muito para serem gerados.
Categorias de Documentos
Esta configuração opcional permite limitar a recuperação a uma das categorias que você criou na tela de Documentos das Fontes de Conhecimento.
Agendas
Permite limitar a recuperação a uma das Agendas que você especificou na tela de Agendas das Fontes de Conhecimento.
Limite (Threshold)
As fontes do seu banco de conhecimento vão corresponder à consulta em diferentes graus. A IA classificará essas por relevância de 0 a 1. Esta configuração permite controlar quão bem a saída deve corresponder à consulta.
O limite exato depende do seu caso de uso, mas geralmente, recomenda-se 0,7-0,8 para respostas altamente relevantes de uma quantidade razoável de fontes.
Imagine que você defina o limite em 0,6 e tenha os seguintes artigos:
- Artigo A: 0,8
- Artigo B: 0,65
- Artigo C: 0,5
- Artigo D: 0,9
Apenas os artigos com pontuação de relevância acima de 0,6 aparecerão na saída, ou seja, apenas A, B e D.
- Um limite alto, como 0,9, retornará resultados muito relevantes que correspondem de perto à consulta, mas pode ter dificuldade para encontrar documentos suficientes e deixar passar alguns relevantes.
- Um limite baixo, por exemplo, abaixo de 0,5, fornecerá informações de mais documentos, mas corre o risco de retornar informações irrelevantes.
Como conectar o componente Recuperador de Documentos ao seu fluxo
O componente contém apenas uma entrada e uma saída:
- Consulta de Entrada: A consulta pode ser qualquer saída de texto. Os casos de uso mais comuns são conectar o Chat Input humano ou um Gerador.
- Saída: A saída de qualquer componente do tipo recuperador é sempre um Documento.
A saída Documento contém dados estruturados inadequados para a saída final do chat. Todos os componentes que recebem Documentos como entrada os transformam em um formato amigável ao usuário. Estes são componentes Widget ou o transformador de Documento para Texto.
Por que usar o Recuperador de Documentos?
- Ancoragem dos Modelos de IA: Melhore a precisão factual e a relevância das saídas de IA fornecendo informações reais e contextuais da base de conhecimento da sua organização.
- Aumento Contextual: Forneça aos LLMs ou chatbots documentos de apoio ou material de referência para respostas mais informadas.
- Filtragem Flexível: A busca pode ser ajustada por categoria, agenda, URL, estrutura do documento ou metadados, garantindo que apenas as informações mais relevantes sejam exibidas.
- Saída Personalizada: Escolha quanto conteúdo recuperar, como dividi-lo e quais metadados incluir, tornando fácil adaptar para processos de IA posteriores ou necessidades de interface.
- Integração com Agentes: Com descrições e nomes de ferramentas, o componente pode ser referenciado como uma ferramenta em arquiteturas baseadas em agentes.
Exemplos de Uso
- Geração Aumentada por Recuperação (RAG): Forneça aos LLMs documentos de apoio para gerar respostas precisas e fundamentadas em conhecimento.
- Chatbots e Assistentes Virtuais: Apresente rapidamente FAQs ou documentos de políticas em resposta a perguntas de funcionários/clientes.
- Enriquecimento de Dados: Extraia metadados de produto, autor ou outros para análises adicionais via IA ou automação de fluxos de trabalho.
Exemplo
Vamos experimentar agora! Antes de construir o fluxo, precisamos garantir que criamos Documentos ou Agendas relevantes. Se não houver uma boa fonte, o chatbot pedirá desculpas por não conseguir responder.
Passos:
- Comece com o Chat Input.
- Adicione o Recuperador de Documentos e conecte o Chat Input como Consulta de Entrada.
- A saída é um Documento que precisa ser transformado; para este exemplo, usaremos o Documento para Texto.
- Em seguida, conecte um Gerador de IA.
- Pronto para conversar.

Agora nosso Fluxo pode pesquisar nossas fontes com base em uma consulta humana, transformar os dados estruturados em texto legível e repassá-los para a IA gerar uma resposta amigável ao usuário.
Nossas Fontes de Conhecimento contêm uma Agenda configurada para rastrear a página de preços da FlowHunt para informações atualizadas. Vamos perguntar ao bot sobre isso:

Exemplos de modelos de fluxo usando o componente Recuperador de Documentos
Para ajudá-lo a começar rapidamente, preparamos vários modelos de fluxo de exemplo que demonstram como usar o componente Recuperador de Documentos de forma eficaz. Esses modelos apresentam diferentes casos de uso e melhores práticas, tornando mais fácil para você entender e implementar o componente em seus próprios projetos.
Perguntas frequentes
- O que é o componente Recuperador de Documentos?
Este componente permite que o Flow recupere conhecimento de suas próprias fontes, como documentos e URLs, garantindo que as informações retornadas sejam relevantes, confiáveis e atualizadas.
- Por que não posso conectar um Recuperador de Documentos à Saída do Chat?
Componentes de recuperação criam dados estruturados que não são adequados para saída. Eles devem ser transformados em texto ou formato visual antes de serem enviados para o componente de Saída do Chat.
- De onde o Recuperador de Conhecimento obtém informações?
O componente busca a correspondência de consulta mais próxima dentro das informações provenientes de URLs, documentos e agendas especificados pelo usuário.
- Quantos documentos ele retorna?
Você pode definir um limite para o número de resultados retornados, garantindo que apenas o conteúdo mais relevante seja incluído no seu fluxo.
- Posso filtrar quais documentos serão pesquisados?
Sim, você pode filtrar por categorias de documentos, agendas ou URLs, focando a busca em segmentos específicos da sua base de conhecimento.
- Posso conectar tanto o Recuperador de Documentos quanto o GoogleSearch? Se sim, qual é priorizado?
Você pode usar ambos simultaneamente. Cada recuperador leva à sua própria saída, com prioridade definida pela ordem das saídas no canvas. A primeira saída do topo é priorizada.
Experimente o Recuperador de Documentos da FlowHunt
Construa soluções de IA mais inteligentes conectando suas fontes de conhecimento e garantindo que seu chatbot sempre forneça respostas relevantes e atualizadas.