Chatbot RAG en Tiempo Real Específico de Dominio

Un chatbot en tiempo real que utiliza la Búsqueda de Google restringida a tu propio dominio, recupera contenido web relevante y aprovecha el LLM de OpenAI para responder consultas de usuarios con información actualizada. Ideal para proporcionar respuestas precisas y específicas de dominio en portales de atención al cliente o información.

Cómo funciona el Flujo de IA - Chatbot RAG en Tiempo Real Específico de Dominio

Cómo funciona el Flujo de IA

Entrada de Consulta de Usuario

Captura las preguntas del usuario a través de la entrada de chat o botones predefinidos.

Expansión de Consulta

Parafrasea y amplía la consulta del usuario para mejorar la precisión de la recuperación.

Búsqueda de Google Específica de Dominio

Realiza una búsqueda en Google limitada al dominio especificado utilizando las consultas ampliadas.

Recuperación de Contenido Web

Obtiene el contenido de las URLs más relevantes devueltas por la búsqueda.

Generación de Respuesta LLM

Utiliza el LLM de OpenAI para generar una respuesta final enriquecida con contexto que se muestra al usuario.

Prompts utilizados en este flujo

A continuación se muestra una lista completa de todos los prompts utilizados en este flujo para lograr su funcionalidad. Los prompts son las instrucciones dadas al modelo de IA para generar respuestas o realizar acciones. Guían a la IA en la comprensión de la intención del usuario y la generación de resultados relevantes.

Componentes utilizados en este flujo

A continuación se muestra una lista completa de todos los componentes utilizados en este flujo para lograr su funcionalidad. Los componentes son los elementos básicos de cada Flujo de IA. Le permiten crear interacciones complejas y automatizar tareas mediante la conexión de diversas funcionalidades. Cada componente sirve para un propósito específico, como manejar la entrada del usuario, procesar datos o integrarse con servicios externos.

Descripción del flujo

Propósito y beneficios

Descripción general

Este flujo de trabajo implementa un chatbot simple de Generación Aumentada con Recuperación (RAG) que aprovecha la Búsqueda de Google en tiempo real para recuperar información actualizada de internet; específicamente, se puede personalizar para restringir todas las búsquedas a un dominio en particular. El objetivo principal es crear un chatbot que pueda responder las consultas de los usuarios utilizando el contenido más relevante y reciente encontrado en línea, lo que lo hace muy valioso para escenarios donde las bases de conocimiento estáticas son insuficientes.

Componentes clave y flujo

El flujo de trabajo se compone de varios bloques modulares, cada uno representando una capacidad específica. A continuación, se muestra un desglose de la estructura y funcionalidad del flujo de trabajo:

ComponenteFunción
Entrada de ChatRecibe consultas y mensajes de chat del usuario.
Historial de ChatMantiene el historial de la conversación para respuestas con conciencia de contexto.
Expansión de ConsultaParafrasea la entrada del usuario en múltiples consultas alternativas para mejorar la cobertura de búsqueda.
Búsqueda de GoogleEjecuta búsquedas en Google, restringidas por un prefijo de dominio personalizable.
Recuperador de URLExtrae contenido de las URLs devueltas por la Búsqueda de Google.
Plantilla de PromptEstructura el contexto, la entrada del usuario y el historial para el modelo de lenguaje.
OpenAI LLMGenera respuestas utilizando un modelo de lenguaje (por ejemplo, GPT-3/4).
GeneradorInvoca el LLM con el prompt y el contexto para producir la respuesta.
Salida de ChatMuestra las respuestas del chatbot al usuario.
Widgets de BotónProporciona consultas de ejemplo rápidas para que los usuarios las prueben con un solo clic.
Disparador de Chat AbiertoInicializa la conversación y muestra botones de inicio rápido.

Cómo funciona el flujo de trabajo

Cuando un usuario abre el chat, se activa el Disparador de Chat Abierto. Esto inicializa la interfaz de chat y presenta varios Widgets de Botón con consultas de ejemplo (por ejemplo, “¿qué dinosaurio tiene 500 dientes?”). Cuando un usuario hace clic en un botón o ingresa un mensaje personalizado a través de la Entrada de Chat, el flujo de trabajo procede de la siguiente manera:

  1. Expansión de Consulta: La entrada del usuario se parafrasea en múltiples versiones para maximizar la probabilidad de recuperar resultados de búsqueda relevantes.

  2. Búsqueda de Google: Las consultas ampliadas se envían a la Búsqueda de Google. Por defecto, la búsqueda está limitada a un dominio específico (establecido por el campo query_prefix, por ejemplo, site: www.TUDOMINIO.com), lo que te permite enfocar el conocimiento del chatbot en tu propio sitio web o en cualquier fuente confiable.

  3. Recuperador de URL: El flujo de trabajo recupera el contenido de los principales resultados de búsqueda (URLs) como documentos completos.

  4. Ensamblaje del Prompt: El contenido recuperado, la entrada del usuario y el historial de chat se combinan utilizando el componente Plantilla de Prompt para proporcionar un contexto rico para la respuesta.

  5. Generación del Modelo de Lenguaje: El prompt se envía al OpenAI LLM, que genera una respuesta coherente y contextualmente relevante.

  6. Salida de Respuesta: La respuesta generada se muestra al usuario a través de la Salida de Chat.

Ejemplo de flujo de caso de uso

  • El usuario abre el chat: Aparece un mensaje de bienvenida y tres botones con preguntas de ejemplo.
  • El usuario hace clic en “¿cuándo es el día de la madre 2024?”: La pregunta se muestra inmediatamente en la salida del chat (para retroalimentación instantánea).
  • El flujo de trabajo procesa la consulta mediante expansión, búsqueda, recuperación, ensamblaje de prompt y generación LLM, y luego muestra la respuesta.

Por qué es útil este flujo de trabajo

  • Conocimiento en tiempo real: El chatbot puede responder preguntas utilizando la información más reciente disponible en internet o en tu dominio elegido.
  • Restricción de dominio: Al personalizar el query_prefix, puedes asegurar que el chatbot obtenga información solo de tu sitio web confiable o base de conocimiento, mejorando la fiabilidad de las respuestas.
  • Conciencia de contexto: Al incluir el historial del chat y el contenido recuperado en el prompt, las respuestas pueden adaptarse y ser relevantes para conversaciones de varios turnos.
  • Escalabilidad y automatización: El diseño modular permite ampliar o adaptar fácilmente el flujo de trabajo para varios dominios, admitiendo el despliegue a gran escala en diferentes temas o sitios web.
  • Experiencia de usuario: Los botones de inicio rápido y la retroalimentación instantánea hacen que el chatbot sea accesible para los usuarios finales.

Tabla resumen del flujo de trabajo

PasoDescripción
Entrada del usuarioEl usuario escribe una pregunta o hace clic en un botón de inicio rápido
Expansión de consultaLa entrada se parafrasea para una mayor cobertura de búsqueda
Búsqueda de GoogleSe realizan búsquedas en Google, restringidas a un dominio dado
Recuperación de contenido de URLSe obtienen los contenidos de los principales resultados de búsqueda
Construcción del promptLa entrada del usuario, los resultados de búsqueda y el historial de chat se compilan en un prompt
Generación LLMEl LLM de OpenAI genera una respuesta usando todo el contexto
SalidaLa respuesta se muestra al usuario

Personalización

  • Para enfocar el chatbot en tu propio dominio, modifica el campo query_prefix en el componente Búsqueda de Google (por ejemplo, site: www.TUDOMINIO.com).
  • Agrega o cambia consultas de ejemplo usando los componentes Widget de Botón para una experiencia de usuario más personalizada.

Casos de uso ideales

  • Bots de atención al cliente que siempre dan respuestas basadas en tu documentación o contenido web actualizado.
  • Asistentes de conocimiento internos limitados a la intranet de tu empresa o portal de soporte.
  • Cualquier chatbot que deba citar o basarse siempre en fuentes externas y autorizadas (por ejemplo, por cumplimiento o precisión).

Al automatizar el proceso de búsqueda, recuperación y generación de respuestas, este flujo de trabajo ahorra tiempo de investigación manual y garantiza que los usuarios siempre obtengan la información más actual y relevante disponible.

Permitanos construir su propio equipo de IA

Ayudamos a empresas como la suya a desarrollar chatbots inteligentes, servidores MCP, herramientas de IA u otros tipos de automatización con IA para reemplazar a humanos en tareas repetitivas de su organización.

Saber más