Indexierung von Inhalten überspringen

Nutzen Sie die Skip-Indexierungsfunktion von FlowHunt, um wiederholte oder ungeeignete Inhalte aus der Wissensbasis Ihres KI-Chatbots auszuschließen und so relevante und sichere Interaktionen zu gewährleisten.

Indexierung von Inhalten überspringen

Egal wie leistungsfähig sie ist, KI ist immer noch nur eine Maschine, die die Informationen weitergibt, die sie gelernt hat. Sie versteht keine Witze, Hypothesen oder Sarkasmus – und gerade das führt oft zu urkomisch schlechten (und manchmal auch ernsthaft schädlichen) Antworten. Damit Ihr Chatbot nicht den nächsten KI-Skandal verursacht und Ihre Inhalte besser versteht, können Sie ihm mitteilen, welche Inhalte er überspringen soll.

Die Zuverlässigkeit der KI sichern Sie, indem Sie die Informationen überwachen, aus denen sie lernt. Nicht alle Ihre Inhalte sind für den Chatbot geeignet. Die flowhunt-skip-Klasse ermöglicht es Ihnen, Inhalte zu kennzeichnen, die FlowHunt nicht indexieren soll. Jedes HTML-Element mit dieser Klasse wird bei der Verarbeitung ignoriert.

Wann sollte man den Skip-Parameter verwenden

Es gibt zwei Hauptgründe, warum Sie diese Klasse verwenden sollten, aber Sie können sie auch für alle Inhalte nutzen, die Sie für den Bot als unnötig oder ungeeignet erachten.

  1. Wiederholte Inhalte überspringen: Wenn ähnliche Inhalte immer wieder indexiert werden, fällt es der KI schwer, sie zu unterscheiden und zu kategorisieren. Das Überspringen von doppelten Informationen spart Ihnen zudem auf lange Sicht Kosten bei der Textverarbeitung.

  2. Risikoreiche oder ungeeignete Informationen überspringen: Sie sollten Informationen überspringen, die die KI zu falschen, schädlichen oder aus dem Kontext gerissenen Antworten verleiten könnten. Seien Sie besonders vorsichtig, wenn Ihr Marken-Ton häufig Witze oder starke Sprache verwendet. Das mag in anderen Inhalten gut funktionieren, aber Nutzer schätzen einen schnippischen Bot möglicherweise nicht.

Wie verwende ich den flowhunt-skip-Parameter

FlowHunt durchsucht und indexiert Ihre Website, um dem Chatbot Kontext zu liefern. Alles, was FlowHunt indexiert, kann Ihr Chatbot irgendwann verwenden.

Wenn Sie HTML-Elementen die flowhunt-skip-Klasse hinzufügen, markieren Sie Inhalte, die Sie nicht indexieren möchten. Jedes Element mit dieser Klasse wird ignoriert und erreicht den Chatbot nie.

Hier ein Beispiel für die Verwendung der Klasse:

<div class="flowhunt-skip">
  <h2>Doppelter Inhalt</h2>
  <p>Dieser Inhalt ist doppelt. Ich möchte nicht, dass FlowHunt ihn erneut indexiert.</p>
</div>

Sie können auch nur einen einzelnen Absatz oder einen Teil eines Elements überspringen:

<div>
  <h2>Mein Inhalt</h2>
  <p>Dieser Absatz soll indexiert werden.</p>
  <p class="flowhunt-skip">Ich möchte nicht, dass der Chatbot diese Information verwendet.</p>
  <p>Dieser Absatz soll indexiert werden.</p>
</div>

Wie funktioniert die Indexierung

Der Crawling-Prozess läuft im Hintergrund und folgt den von Ihnen festgelegten Zeitplänen. Es wird nur die HTML-Seite heruntergeladen. Bilder oder Medien werden lediglich als Links gespeichert. Weiterleitungen werden befolgt und kanonische URLs berücksichtigt.

Nach dem Crawlen wird der HTML-Inhalt in reinen Markdown-Text umgewandelt. Dabei können manche Informationen entfernt werden. Der finale Markdown-Text wird dem Chatbot als Kontext angeboten. Der Bot kann diese Informationen dann bei Bedarf abrufen.

Wie weiß die KI, welche Informationen sie auswählen soll

Der Markdown-Text wird in Abschnitte geteilt, vektorisiert und in einer Vektordatenbank gespeichert. Diese Art von Datenbank weist den Wortbedeutungen Werte zu. So kann die KI verwandte Begriffe verstehen, ohne eine exakte Wortübereinstimmung zu benötigen.

Die Wörter werden anhand ihrer Werte in einem Raster angeordnet. Dadurch kann der Computer verstehen, welche Wörter sich in ihrer Bedeutung ähneln:

Text split into chunks, vectorized, and stored in a vector database

Hinweis: Dies ist ein stark vereinfachtes Modell. In der Praxis verarbeitet die KI Tausende von Wörtern, Phrasen und ganzen Sätzen.

Das Abrufen von Informationen aus Vektordatenbanken nennt man semantische Suche. Es ist die Fähigkeit der KI, die Bedeutung von Wörtern in der Vektordatenbank zu durchsuchen und auszuwerten und diese für Antworten zu verwenden.

Wenn ein Nutzer eine Anfrage stellt, wandelt der Bot die Wörter in Vektoren um. Anschließend sucht er in der Datenbank nach passenden oder ähnlichen Inhalten aus Ihren Texten. Bei einem Treffer nutzt er diese Informationen, um eine Antwort zu formulieren.

Warum ist die semantische Suche so wichtig

Stellen Sie sich vor, Sie betreiben einen Online-Tierladen. Ein Kunde stellt folgende Anfrage:

„Verkaufen Sie Futter für Kätzchen?“

Sie tun es, aber der Produktname enthält das Wort „Junior“ statt „Kätzchen“. Der Bot kann verstehen, dass „Junior-Katzenfutter“ dasselbe (oder sehr ähnlich) wie „Futter für Kätzchen“ ist und den Kunden erfolgreich zum richtigen Produkt führen.

Ohne semantische Suche in der Vektordatenbank würde der Chatbot einfach antworten, dass Sie kein „Futter für Kätzchen“ führen – und Sie würden einen potenziellen Kunden verlieren. Mit FlowHunt müssen Sie sich darüber keine Sorgen machen.

Häufig gestellte Fragen

Was ist die Skip-Indexierungsfunktion in FlowHunt?

Mit der Skip-Indexierungsfunktion können Sie bestimmte Inhalte von der Nutzung durch Ihren KI-Chatbot ausschließen. Wenn Sie die flowhunt-skip-Klasse zu HTML-Elementen hinzufügen, stellen Sie sicher, dass ungeeignete oder wiederholte Inhalte nicht indexiert oder in Chatbot-Antworten verwendet werden.

Warum sollte ich bestimmte Inhalte beim Training meines KI-Chatbots überspringen?

Durch das Überspringen von wiederholten, unangemessenen oder potenziell irreführenden Inhalten kann Ihr KI-Chatbot relevantere, sicherere und genauere Antworten liefern. Außerdem verbessert es die Leistung und reduziert unnötige Verarbeitungskosten.

Wie verwende ich die flowhunt-skip-Klasse?

Fügen Sie die flowhunt-skip-Klasse zu jedem HTML-Element hinzu, das Sie nicht indexieren möchten. FlowHunt ignoriert diese Elemente beim Crawling und hält sie aus der Wissensbasis Ihres Chatbots heraus.

Wie verarbeitet und speichert FlowHunt indexierte Inhalte?

FlowHunt crawlt Ihre Website, wandelt HTML in Markdown um, teilt den Text in Abschnitte und speichert sie in einer Vektordatenbank. Dadurch ist eine semantische Suche möglich, sodass die KI verwandte Begriffe versteht und relevante Antworten auf Benutzeranfragen liefern kann.

Was ist semantische Suche und warum ist sie wichtig?

Die semantische Suche nutzt Vektordatenbanken, um Wortbedeutungen und -beziehungen zu verstehen, nicht nur exakte Übereinstimmungen. Dadurch kann Ihr Chatbot intelligentere, kontextbezogene Antworten geben, selbst wenn Nutzer andere Formulierungen verwenden.

Bereit, Ihren eigenen KI-Chatbot zu erstellen?

Intelligente Chatbots und KI-Tools unter einem Dach. Verbinden Sie intuitive Bausteine, um Ihre Ideen in automatisierte Flows umzusetzen.

Mehr erfahren