Omitir la indexación de contenido

Utiliza la función de omitir indexación de FlowHunt para excluir contenido repetitivo o inadecuado de la base de conocimientos de tu chatbot de IA, garantizando interacciones relevantes y seguras.

Omitir la indexación de contenido

No importa cuán poderosa sea, la IA sigue siendo una máquina que transmite la información que aprende. No entiende chistes, hipótesis ni sarcasmo, que a menudo son los causantes de las respuestas más graciosas (y a veces gravemente dañinas). Para asegurarte de que tu Chatbot no genere el próximo escándalo de IA y para ayudarle a comprender mejor tu contenido, puedes indicarle qué contenido debe omitir.

La forma de garantizar la fiabilidad de la IA es monitorizando la información de la que aprende. No todo tu contenido será adecuado para que el Chatbot lo utilice. La clase flowhunt-skip te permite marcar el contenido que FlowHunt no debe indexar. Cualquier elemento HTML con esta clase será ignorado durante el procesamiento del contenido.

Cuándo usar el parámetro skip

Hay dos razones principales para utilizar esta clase, pero siéntete libre de aplicarla a cualquier contenido que consideres innecesario o inapropiado para el bot.

  1. Omitir contenido repetitivo: Si se sigue indexando contenido similar, a la IA le resultará difícil diferenciar y categorizar de qué trata el contenido. Omitir información duplicada también te ahorra dinero en el procesamiento de texto a largo plazo.

  2. Omitir información arriesgada o inapropiada: Debes omitir cualquier información que pueda hacer que la IA dé respuestas erróneas, dañinas o fuera de contexto. Ten especial cuidado si el tono de tu marca utiliza a menudo bromas o lenguaje fuerte. Aunque sea genial para otros contenidos, es posible que los usuarios no aprecien un bot sarcástico.

Cómo usar el parámetro flowhunt-skip

FlowHunt rastrea e indexa tu sitio web para dar contexto al Chatbot. Todo lo que FlowHunt indexa puede ser utilizado por tu Chatbot en algún momento.

Añadir la clase flowhunt-skip a los elementos HTML te permite marcar el contenido que no deseas indexar. Cualquier elemento que tenga esta clase será ignorado y nunca llegará al Chatbot.

Aquí tienes un ejemplo de uso de la clase:

<div class="flowhunt-skip">
  <h2>Contenido duplicado</h2>
  <p>Este contenido es duplicado. No quiero que FlowHunt lo indexe de nuevo.</p>
</div>

También puedes omitir sólo un párrafo o una parte de un elemento:

<div>
  <h2>Mi contenido</h2>
  <p>Este párrafo debe ser indexado.</p>
  <p class="flowhunt-skip">No quiero que el Chatbot utilice esta información.</p>
  <p>Este párrafo debe ser indexado.</p>
</div>

¿Cómo funciona la indexación?

El proceso de rastreo se ejecuta en segundo plano y se basa en los horarios que configures. Sólo descarga la página HTML. Cualquier imagen o medio simplemente se almacena como un enlace. Se siguen las redirecciones y se evalúan las URLs canónicas.

Una vez rastreado, el contenido HTML se convierte en texto plano markdown. Es posible que se elimine parte de la información durante este proceso. El texto markdown final se ofrece al Chatbot como contexto. El bot puede recuperar esta información cuando lo necesite.

¿Cómo sabe la IA qué información elegir?

El texto markdown se divide en fragmentos, se vectoriza y se almacena en una base de datos vectorial. Este tipo de base de datos asigna valores al significado de las palabras. Como resultado, la IA puede entender palabras relacionadas en lugar de necesitar una coincidencia exacta.

Las palabras se distribuyen en una cuadrícula según los valores asignados. Esto permite que el ordenador entienda qué palabras son cercanas en significado entre sí:

Texto dividido en fragmentos, vectorizado y almacenado en una base de datos vectorial

Nota: Este es un modelo muy simplificado. En la práctica, la IA hace esto con miles de palabras, frases y oraciones completas.

La recuperación de información desde bases de datos vectoriales se llama búsqueda semántica. Es la capacidad de la IA de buscar y evaluar el significado de las palabras en la base de datos vectorial, usándolas para proporcionar respuestas.

Cuando un usuario envía una consulta, el bot convierte las palabras en vectores. Luego busca en la base de datos coincidencias cercanas con tu contenido. Si encuentra coincidencias o contenido similar, utiliza esa información para elaborar una respuesta.

¿Por qué es tan importante la búsqueda semántica?

Imagina que tienes una tienda de mascotas online. Un cliente realiza la siguiente consulta:

“¿Venden comida para gatitos?”

Sí, pero el nombre del producto incluye la palabra “junior” en vez de “gatito”. El bot podrá entender que “comida para gatos junior” es lo mismo (o muy similar) que “comida para gatitos” y guiará con éxito al cliente al producto correcto.

Sin búsqueda semántica en la base de datos vectorial, el Chatbot simplemente respondería que no tienes “comida para gatitos”, haciendo que pierdas un cliente futuro. No tienes que preocuparte de que algo así ocurra usando FlowHunt.

Preguntas frecuentes

¿Qué es la función de omitir indexación en FlowHunt?

La función de omitir indexación te permite excluir contenido específico para que no sea utilizado por tu chatbot de IA. Al añadir la clase flowhunt-skip a los elementos HTML, aseguras que el contenido inadecuado o repetitivo no se indexe ni se utilice en las respuestas del chatbot.

¿Por qué debería omitir cierto contenido al entrenar mi chatbot de IA?

Omitir contenido repetitivo, inapropiado o potencialmente engañoso ayuda a que tu chatbot de IA proporcione respuestas más relevantes, seguras y precisas. También mejora el rendimiento y reduce los costes innecesarios de procesamiento.

¿Cómo uso la clase flowhunt-skip?

Añade la clase flowhunt-skip a cualquier elemento HTML que no quieras indexar. FlowHunt ignorará estos elementos durante su proceso de rastreo, manteniéndolos fuera de la base de conocimientos de tu chatbot.

¿Cómo procesa y almacena FlowHunt el contenido indexado?

FlowHunt rastrea tu sitio, convierte el HTML a markdown, divide el texto en fragmentos y los almacena en una base de datos vectorial. Esto permite la búsqueda semántica para que la IA pueda entender palabras relacionadas y ofrecer respuestas relevantes a las consultas de los usuarios.

¿Qué es la búsqueda semántica y por qué es importante?

La búsqueda semántica utiliza bases de datos vectoriales para entender los significados y relaciones de las palabras, no sólo coincidencias exactas. Esto permite que tu chatbot proporcione respuestas más inteligentes y contextuales, incluso si los usuarios usan diferentes palabras.

¿Listo para crear tu propia IA?

Chatbots inteligentes y herramientas de IA bajo un mismo techo. Conecta bloques intuitivos para convertir tus ideas en Flujos automatizados.

Saber más