Ohita sisällön indeksointi

Ohita sisällön indeksointi

AI Chatbot Indexing Semantic Search

Ei ole väliä, kuinka tehokas tekoäly on – se on silti vain kone, joka välittää oppimaansa tietoa. Se ei ymmärrä vitsejä, hypoteettisia tilanteita tai sarkasmia, jotka usein johtavat hilpeän huonoihin (ja joskus jopa vaarallisiin) vastauksiin. Jotta chatbotisi ei aiheuttaisi seuraavaa tekoälykohua ja ymmärtäisi sisältösi paremmin, voit kertoa sille, mitä sisältöä sen kannattaa ohittaa.

Tekoälyn luotettavuus varmistetaan seuraamalla, mistä tiedoista se oppii. Kaikki sisältösi ei ole sopivaa chatbotin käytettäväksi. flowhunt-skip-luokan avulla voit merkitä sisällön, jota FlowHuntin ei tule indeksoida. Kaikki HTML-elementit, joissa on tämä luokka, jätetään huomiotta sisällön käsittelyn aikana.

Milloin skip-parametria kannattaa käyttää

Tämän luokan käyttöön on kaksi pääsyytä, mutta voit käyttää sitä vapaasti mihinkä tahansa sisältöön, jonka koet turhaksi tai sopimattomaksi botin käytettäväksi.

  1. Toistuvan sisällön ohittaminen: Jos samanlaista sisältöä indeksoidaan toistuvasti, tekoälyn on vaikea erotella ja luokitella, mistä sisällössä on kyse. Dublikaattitiedon ohittaminen säästää pitkällä aikavälillä myös tekstinkäsittelykustannuksissa.

  2. Riskialttiin tai sopimattoman tiedon ohittaminen: Kannattaa ohittaa kaikki tieto, joka voi johtaa tekoälyn vääriin, haitallisiin tai asiayhteydestään irrotettuihin vastauksiin. Ole erityisen varovainen, jos brändisi äänensävy käyttää usein vitsejä tai voimakasta kieltä. Vaikka tämä toimisi muussa sisällössä hyvin, käyttäjät eivät välttämättä arvosta näsäviisasta bottia.

Miten flowhunt-skip-parametria käytetään

FlowHunt indeksoi ja ryömii verkkosivustosi antaakseen chatbotille kontekstia. Kaikki, mitä FlowHunt indeksoi, voi päätyä chatbotin käyttöön jossain vaiheessa.

Lisäämällä flowhunt-skip-luokan HTML-elementteihin voit merkitä sisällön, jota et halua indeksoitavan. Kaikki elementit, joissa on tämä luokka, ohitetaan eikä ne koskaan päädy chatbotille.

Tässä esimerkki luokan käytöstä:

<div class="flowhunt-skip">
  <h2>Toistuva sisältö</h2>
  <p>Tämä sisältö on dublikaattia. En halua FlowHuntin indeksoivan sitä uudelleen.</p>
</div>

Voit myös ohittaa vain yksittäisen kappaleen tai osan yhdestä elementistä:

<div>
  <h2>Oma sisältöni</h2>
  <p>Tämä kappale tulisi indeksoida.</p>
  <p class="flowhunt-skip">En halua chatbotin käyttävän tätä tietoa.</p>
  <p>Tämä kappale tulisi indeksoida.</p>
</div>

Miten indeksointi toimii

Ryömintäprosessi toimii taustalla ja perustuu asettamiisi aikatauluihin. Se lataa vain HTML-sivun. Kaikki kuvat tai mediat tallennetaan pelkkinä linkkeinä. Kaikki uudelleenohjaukset seurataan ja kanoniset URL-osoitteet arvioidaan.

Ryöminnän jälkeen HTML-sisältö muunnetaan tavalliseksi markdown-tekstiksi. Osa tiedoista saatetaan poistaa tämän prosessin aikana. Lopullinen markdown-teksti tarjotaan chatbotille kontekstiksi, ja botti voi hakea tätä tietoa aina tarvittaessa.

Mistä tekoäly tietää, mitä tietoa käyttää

Markdown-teksti pilkotaan osiin, vektorisoidaan ja tallennetaan vektoritietokantaan. Tällainen tietokanta antaa arvoja sanojen merkityksille. Näin tekoäly pystyy ymmärtämään toisiinsa liittyviä sanoja ilman, että niiden täytyy olla täsmälleen samoja.

Sanat sijoitetaan ruudukkoon niiden arvojen perusteella. Tämä mahdollistaa koneen ymmärtää, mitkä sanat ovat merkitykseltään lähellä toisiaan:

Teksti pilkotaan osiin, vektorisoidaan ja tallennetaan vektoritietokantaan

Huom: Tämä on hyvin yksinkertaistettu malli. Käytännössä tekoäly tekee tämän tuhansille sanoille, lauseille ja kokonaisille virkkele.

Tietojen hakua vektoritietokannasta kutsutaan semanttiseksi hauksi. Se on tekoälyn kyky etsiä ja arvioida sanojen merkityksiä vektoritietokannassa ja käyttää niitä vastauksia laatiessaan.

Kun käyttäjä lähettää kyselyn, botti muuntaa sanat vektoreiksi. Se etsii tietokannasta sisältöä, joka vastaa tai on lähellä kysymyksen sanoja. Löydettyään osumia tai samankaltaista sisältöä, botti käyttää niitä vastauksensa pohjana.

Miksi semanttinen haku on niin tärkeää

Kuvittele, että omistat verkkolemmikkikaupan. Asiakas kysyy seuraavan kysymyksen:

”Myyttekö ruokaa kissanpennuille?”

Myyt kyllä, mutta tuotteen nimessä on sana “junior” eikä “kissanpentu”. Botti osaa ymmärtää, että “junior-kissanruoka” on sama (tai hyvin samanlainen) kuin “ruoka kissanpennuille” ja ohjaa asiakkaan oikean tuotteen pariin.

Ilman semanttista hakua vektoritietokannassa chatbot vastaisi yksinkertaisesti, ettei “ruokaa kissanpennuille” ole saatavilla, jolloin menettäisit potentiaalisen asiakkaan. FlowHuntin kanssa sinun ei tarvitse olla huolissasi tällaisista tilanteista.

Usein kysytyt kysymykset

Mikä on FlowHuntin ohita indeksointi -ominaisuus?

Ohita indeksointi -ominaisuuden avulla voit sulkea tietyn sisällön pois AI-chatbottisi käytöstä. Lisäämällä flowhunt-skip-luokan HTML-elementteihin varmistat, ettei sopimatonta tai toistuvaa sisältöä indeksoida eikä käytetä chatbotin vastauksissa.

Miksi tietty sisältö kannattaa ohittaa AI-chatbottia koulutettaessa?

Toistuvan, sopimattoman tai mahdollisesti harhaanjohtavan sisällön ohittaminen auttaa AI-chatbottiasi tarjoamaan relevantimpia, turvallisempia ja tarkempia vastauksia. Se myös parantaa suorituskykyä ja vähentää turhia käsittelykustannuksia.

Miten käytän flowhunt-skip-luokkaa?

Lisää flowhunt-skip-luokka kaikkiin HTML-elementteihin, joita et halua indeksoitavan. FlowHunt ohittaa nämä elementit indeksoinnin aikana, jolloin ne eivät päädy chatbotin tietopohjaan.

Miten FlowHunt käsittelee ja tallentaa indeksoidun sisällön?

FlowHunt indeksoi sivustosi, muuntaa HTML:n markdown-muotoon, pilkkoo tekstin osiin ja tallentaa ne vektoritietokantaan. Näin mahdollistetaan semanttinen haku, jotta tekoäly ymmärtää sanayhteydet ja pystyy tarjoamaan käyttäjilleen relevantteja vastauksia.

Mitä on semanttinen haku ja miksi se on tärkeää?

Semanttinen haku hyödyntää vektoritietokantoja ymmärtääkseen sanojen merkityksiä ja suhteita, ei pelkästään täsmäosumia. Tämän ansiosta chatbot pystyy tarjoamaan älykkäämpiä, kontekstuaalisia vastauksia, vaikka käyttäjät käyttäisivät erilaisia sanamuotoja.

Valmis rakentamaan oman tekoälyn?

Älykkäät chatbotit ja tekoälytyökalut saman katon alla. Yhdistä intuitiivisia lohkoja muuttaaksesi ideasi automatisoiduiksi Floweiksi.

Lue lisää

Ymmärrä ja ehkäise hallusinaatioita tekoälychatboteissa
Ymmärrä ja ehkäise hallusinaatioita tekoälychatboteissa

Ymmärrä ja ehkäise hallusinaatioita tekoälychatboteissa

Mitä ovat hallusinaatiot tekoälyssä, miksi niitä tapahtuu ja miten voit välttää ne? Opi pitämään tekoälychatbottisi vastaukset tarkkoina käytännöllisillä, ihmis...

3 min lukuaika
Theory Intermediate
Dokumentit
Dokumentit

Dokumentit

Chatbottisi voi välittömästi käyttää ja hyödyntää dokumentteja, HTML-sivuja sekä jopa YouTube-videoita räätälöidäkseen ainutlaatuisen kontekstisi. Täydellinen l...

2 min lukuaika
AI Chatbot Knowledge Management +3
Tietolähteet
Tietolähteet

Tietolähteet

Tietolähteiden avulla voit opettaa tekoälyä tarpeidesi mukaan vaivattomasti. Tutustu kaikkiin tapoihin yhdistää tietoa FlowHuntissa. Yhdistä helposti verkkosivu...

2 min lukuaika
AI Knowledge Management +3