Chatbot RAG em Tempo Real Específico para Domínio
Um chatbot em tempo real que usa a Pesquisa Google restrita ao seu próprio domínio, recupera conteúdo web relevante e utiliza o LLM da OpenAI para responder às perguntas dos usuários com informações atualizadas. Ideal para fornecer respostas precisas e específicas do domínio em portais de atendimento ao cliente ou de informações.


Como o Fluxo de IA funciona
Entrada da Pergunta do Usuário
Captura as perguntas do usuário via entrada do chat ou botões pré-definidos.Expansão da Consulta
Parafraseia e expande a consulta do usuário para melhorar a precisão da recuperação.Pesquisa Google Específica para Domínio
Realiza uma Pesquisa Google limitada ao domínio especificado usando as consultas expandidas.Recuperação de Conteúdo Web
Busca o conteúdo das URLs mais relevantes retornadas pela pesquisa.Geração de Resposta pelo LLM
Utiliza o LLM da OpenAI para gerar uma resposta final enriquecida com contexto, exibida ao usuário.Prompts usados neste fluxo
Abaixo está uma lista completa de todos os prompts usados neste fluxo para alcançar sua funcionalidade. Os prompts são as instruções dadas ao modelo de IA para gerar respostas ou executar ações. Eles orientam a IA na compreensão da intenção do usuário e na geração de saídas relevantes.
Componentes usados neste fluxo
Abaixo está uma lista completa de todos os componentes usados neste fluxo para alcançar sua funcionalidade. Os componentes são os blocos de construção de cada Fluxo de IA. Eles permitem criar interações complexas e automatizar tarefas conectando várias funcionalidades. Cada componente serve a um propósito específico, como lidar com a entrada do usuário, processar dados ou integrar com serviços externos.
Descrição do fluxo
Objetivo e benefícios
Visão Geral
Este fluxo de trabalho implementa um chatbot simples de Geração Aumentada por Recuperação (RAG) que utiliza a Pesquisa Google em tempo real para obter informações atualizadas da internet—especificamente, ele pode ser personalizado para restringir todas as buscas a um determinado domínio. O objetivo principal é criar um chatbot capaz de responder às perguntas dos usuários utilizando o conteúdo mais relevante e recente encontrado online, tornando-o altamente valioso para cenários onde bases de conhecimento estáticas são insuficientes.
Componentes-Chave e Fluxo
O fluxo de trabalho é composto por vários blocos modulares, cada um representando uma capacidade específica. Abaixo está uma divisão da estrutura e funcionalidade do fluxo:
Componente | Função |
---|---|
Entrada do Chat | Recebe as perguntas e mensagens do usuário. |
Histórico do Chat | Mantém o histórico da conversa para respostas contextualizadas. |
Expansão da Consulta | Parafraseia a entrada do usuário em várias consultas alternativas para melhorar a cobertura da busca. |
Pesquisa Google | Executa buscas no Google, restritas por um prefixo de domínio personalizável. |
Recuperador de URL | Extrai conteúdo das URLs retornadas pela Pesquisa Google. |
Modelo de Prompt | Estrutura contexto, entrada do usuário e histórico para o modelo de linguagem. |
OpenAI LLM | Gera respostas usando um modelo de linguagem (por exemplo, GPT-3/4). |
Gerador | Aciona o LLM com o prompt e contexto para produzir a resposta. |
Saída do Chat | Exibe as respostas do chatbot ao usuário. |
Botões de Exemplo | Fornece consultas de exemplo para o usuário testar com um clique. |
Gatilho de Abertura do Chat | Inicializa a conversa e popula os botões de início rápido. |
Como o Fluxo de Trabalho Opera
Quando um usuário abre o chat, o Gatilho de Abertura do Chat é ativado. Isso inicializa a interface do chat e apresenta vários Botões de Exemplo com consultas de exemplo (por exemplo, “qual dinossauro tem 500 dentes?”). Quando o usuário clica em um botão ou digita uma mensagem personalizada através da Entrada do Chat, o fluxo prossegue da seguinte forma:
Expansão da Consulta: A entrada do usuário é parafraseada em várias versões para maximizar a chance de obter resultados relevantes na busca.
Pesquisa Google: As consultas expandidas são enviadas para a Pesquisa Google. Por padrão, a busca é limitada a um domínio específico (definido pelo campo
query_prefix
, ex:site: www.SEUDOMINIO.com
), permitindo focar o conhecimento do chatbot no seu próprio site ou em qualquer fonte confiável.Recuperador de URL: O fluxo recupera o conteúdo dos principais resultados de busca (URLs) como documentos completos.
Montagem do Prompt: O conteúdo recuperado, a entrada do usuário e o histórico do chat são combinados usando o componente Modelo de Prompt para fornecer contexto rico à resposta.
Geração pelo Modelo de Linguagem: O prompt é enviado ao OpenAI LLM, que gera uma resposta coerente e contextualizada.
Saída da Resposta: A resposta gerada é exibida ao usuário através da Saída do Chat.
Exemplo de Fluxo de Caso de Uso
- Usuário abre o chat: Mensagem de boas-vindas e três botões de perguntas de exemplo aparecem.
- Usuário clica em “quando é o dia das mães 2024?”: A pergunta é exibida imediatamente na saída do chat (para feedback instantâneo).
- O fluxo executa a consulta através da expansão, busca, recuperação, montagem do prompt e geração pelo LLM, em seguida exibe a resposta.
Por Que Este Fluxo é Útil
- Conhecimento em Tempo Real: O chatbot pode responder perguntas usando as informações mais recentes disponíveis na internet ou no domínio escolhido.
- Restrição por Domínio: Personalizando o
query_prefix
, você garante que o chatbot obtenha informações somente do seu site de confiança ou base de conhecimento, aumentando a confiabilidade das respostas. - Consciência de Contexto: Incluindo o histórico do chat e o conteúdo recuperado no prompt, as respostas podem ser ajustadas e contextualizadas para conversas de múltiplas interações.
- Escalabilidade e Automação: O design modular permite que o fluxo seja facilmente expandido ou adaptado para vários domínios, suportando implantação em larga escala em diferentes tópicos ou sites.
- Experiência do Usuário: Botões de início rápido e feedback imediato tornam o chatbot acessível para os usuários finais.
Tabela Resumida do Fluxo de Trabalho
Etapa | Descrição |
---|---|
Entrada do Usuário | Usuário digita uma pergunta ou clica em um botão de início rápido |
Expansão da Consulta | A entrada é parafraseada para ampliar a cobertura da busca |
Pesquisa Google | Pesquisas são realizadas no Google, restritas a um domínio específico |
Recuperação de Conteúdo da URL | Conteúdos dos principais resultados de busca são recuperados |
Construção do Prompt | Entrada do usuário, resultados da busca e histórico do chat são compilados em um prompt |
Geração pelo LLM | OpenAI LLM gera uma resposta usando todo o contexto |
Saída | Resposta é exibida ao usuário |
Personalização
- Para focar o chatbot em seu próprio domínio, modifique o campo
query_prefix
no componente Pesquisa Google (ex:site: www.SEUDOMINIO.com
). - Adicione ou altere perguntas de exemplo usando os componentes Botão de Exemplo para uma experiência do usuário mais personalizada.
Casos de Uso Ideais
- Bots de atendimento ao cliente que sempre fornecem respostas baseadas na sua documentação ou conteúdo web atualizado.
- Assistentes de conhecimento internos limitados ao intranet ou portal de suporte da sua empresa.
- Qualquer chatbot que precise sempre citar ou depender de fontes externas e confiáveis (ex: para conformidade ou precisão).
Ao automatizar o processo de busca, recuperação e geração de respostas, este fluxo de trabalho economiza tempo de pesquisa manual e garante que os usuários sempre recebam as informações mais atuais e relevantes disponíveis.
Let us build your own AI Team
We help companies like yours to develop smart chatbots, MCP Servers, AI tools or other types of AI automation to replace human in repetitive tasks in your organization.