Přeskakování indexace obsahu

Přeskakování indexace obsahu

Využijte funkci přeskakování indexace ve FlowHunt k vyloučení opakujícího se nebo nevhodného obsahu ze znalostní báze vašeho AI chatbota a zajistěte tak relevantní a bezpečné konverzace.

Ať už je AI jakkoli výkonná, stále je to jen stroj, který předává informace, které se naučil. Nerozumí vtipům, hypotetickým situacím ani sarkasmu, což bývá často příčinou těch nejvtipnějších (a někdy i opravdu nebezpečných) odpovědí. Abyste zabránili tomu, že váš Chatbot způsobí další AI skandál, a aby lépe rozuměl vašemu obsahu, můžete mu určit, který obsah má přeskočit.

Základem spolehlivosti AI je sledovat, z čeho se učí. Ne všechen váš obsah je vhodný k použití chatbotem. Třída flowhunt-skip vám umožní označit obsah, který FlowHunt nemá indexovat. Jakýkoli HTML prvek s touto třídou bude při zpracování obsahu ignorován.

Kdy použít parametr skip

Existují dva hlavní důvody, proč tuto třídu použít, ale bez obav ji využijte u jakéhokoli obsahu, který považujete za zbytečný nebo nevhodný pro použití chatbotem.

  1. Přeskakování opakujícího se obsahu: Pokud se podobný obsah indexuje opakovaně, znesnadňuje to AI rozlišení a kategorizaci témat. Přeskakování duplicitních informací vám navíc dlouhodobě šetří náklady na zpracování textu.

  2. Přeskakování rizikových nebo nevhodných informací: Přeskočte jakékoli informace, které by mohly způsobit, že AI poskytne nesprávné, škodlivé nebo vytržené odpovědi. Buďte obezřetní zejména tehdy, pokud váš brand často používá vtipy nebo silná slova. Zatímco pro ostatní obsah je to v pořádku, uživatelé by jízlivého bota nemuseli ocenit.

Jak použít parametr flowhunt-skip

FlowHunt prochází a indexuje váš web, aby poskytl chatbotovi kontext. Cokoli FlowHunt na stránkách zaindexuje, může chatbot kdykoli použít.

Přidáním třídy flowhunt-skip do HTML prvků označíte obsah, který nechcete indexovat. Veškerý obsah s touto třídou bude ignorován a nikdy se k chatbotovi nedostane.

Zde je příklad použití třídy:

<div class="flowhunt-skip">
  <h2>Duplicitní obsah</h2>
  <p>Tento obsah je duplicitní. Nechci, aby ho FlowHunt znovu indexoval.</p>
</div>

Můžete přeskočit také pouze jeden odstavec nebo část prvku:

<div>
  <h2>Můj obsah</h2>
  <p>Tento odstavec by měl být indexován.</p>
  <p class="flowhunt-skip">Nechci, aby chatbot použil tuto informaci.</p>
  <p>Tento odstavec by měl být indexován.</p>
</div>

Jak funguje proces indexace

Proces procházení běží na pozadí a řídí se vámi nastaveným plánem. Stahuje pouze HTML stránku. Všechny obrázky nebo média jsou pouze ukládány jako odkazy. Přesměrování jsou následována a kanonické URL jsou vyhodnocovány.

Po procházení se HTML obsah převede na prostý markdown text. Některé informace mohou být během tohoto procesu odstraněny. Výsledný markdown text je nabídnut chatbotovi jako kontext. Bot si pak tuto informaci kdykoli vyhledá.

Jak AI pozná, které informace vybrat

Markdown text je rozdělen na bloky, převeden na vektory a uložen do vektorové databáze. Tento typ databáze přiřazuje slovům hodnoty podle jejich významu. Díky tomu AI rozumí souvisejícím výrazům, aniž by potřebovala přesnou shodu slov.

Slova jsou rozmístěna v síti podle přiřazených hodnot. To umožňuje počítači zjistit, která slova jsou si významově blízká:

Text split into chunks, vectorized, and stored in a vector database

Poznámka: Toto je velmi zjednodušený model. V praxi AI zpracovává tisíce slov, frází i celých vět.

Získávání informací z vektorových databází se nazývá sémantické vyhledávání. Jde o schopnost AI vyhledávat a hodnotit význam slov v databázi a použít je při odpovědi.

Když uživatel zadá dotaz, bot převede slova na vektory. Následně v databázi hledá nejbližší shody z vašeho obsahu. Najde-li přesné nebo podobné informace, použije je k sestavení odpovědi.

Proč je sémantické vyhledávání tak důležité

Představte si, že vlastníte internetový obchod s potřebami pro mazlíčky. Zákazník položí tento dotaz:

„Prodáváte krmivo pro koťata?“

Ano, ale název produktu obsahuje slovo „junior“ místo „kotě“. Bot dokáže pochopit, že „krmivo pro kočky junior“ je totéž (nebo velmi podobné) jako „krmivo pro koťata“ a úspěšně zákazníka navede na správný produkt.

Bez sémantického vyhledávání ve vektorové databázi by chatbot jednoduše odpověděl, že „krmivo pro koťata“ nenabízíte, a přišli byste o zákazníka. S FlowHunt se vám nic takového nestane.

Často kladené otázky

Co je funkce přeskakování indexace ve FlowHunt?

Funkce přeskakování indexace vám umožňuje vyloučit konkrétní obsah, aby ho váš AI chatbot nepoužíval. Přidáním třídy flowhunt-skip do HTML prvků zajistíte, že nevhodný nebo opakující se obsah nebude indexován ani použit v odpovědích chatbota.

Proč bych měl učení svého AI chatbota některý obsah přeskočit?

Přeskakování opakujícího se, nevhodného nebo potenciálně zavádějícího obsahu pomáhá vašemu AI chatbotovi poskytovat relevantnější, bezpečnější a přesnější odpovědi. Zlepšíte tím i výkon a snížíte zbytečné náklady na zpracování.

Jak použiji třídu flowhunt-skip?

Přidejte třídu flowhunt-skip do jakéhokoli HTML prvku, který nechcete indexovat. FlowHunt tyto prvky při procházení webu ignoruje, a tím se nedostanou do znalostní báze vašeho chatbota.

Jak FlowHunt zpracovává a ukládá indexovaný obsah?

FlowHunt prochází váš web, převádí HTML na markdown, rozděluje text na bloky a ukládá je do vektorové databáze. To umožňuje sémantické vyhledávání, aby AI porozuměla souvisejícím slovům a dodala relevantní odpovědi na dotazy uživatelů.

Co je sémantické vyhledávání a proč je důležité?

Sémantické vyhledávání využívá vektorové databáze k pochopení významu slov a jejich vztahů, nejen přesných shod. Díky tomu váš chatbot poskytuje chytřejší a kontextové odpovědi, i když uživatelé použijí jiné výrazy.

Připraveni vytvořit svého vlastního AI asistenta?

Chytří Chatboti a AI nástroje pod jednou střechou. Propojte intuitivní bloky a proměňte své nápady v automatizované Flows.

Zjistit více

Obohacení obsahu
Obohacení obsahu

Obohacení obsahu

Obohacení obsahu pomocí AI vylepšuje surový, nestrukturovaný obsah aplikací technik umělé inteligence za účelem extrakce smysluplných informací, struktury a poz...

10 min čtení
AI Content Enrichment +7
Dokumenty
Dokumenty

Dokumenty

Váš chatbot může okamžitě přistupovat k dokumentům, HTML stránkám i YouTube videím a používat je pro přizpůsobení vašemu unikátnímu kontextu. Ideální pro přidán...

2 min čtení
AI Chatbot Knowledge Management +3
Porozumění a prevence halucinací v AI chatbotech
Porozumění a prevence halucinací v AI chatbotech

Porozumění a prevence halucinací v AI chatbotech

Co jsou halucinace v AI, proč vznikají a jak se jim vyhnout? Naučte se, jak udržet odpovědi vašeho AI chatbota přesné pomocí praktických, na člověka zaměřených ...

4 min čtení
Theory Intermediate