Hvordan konfigurere Document Retriever

Document Retriever-komponenten lar chatboten hente kunnskap fra kilder du har spesifisert i Dokumenter og Tidsplaner. Rollen til denne komponenten er å kontrollere uthenting, og flere parametere påvirker hvordan komponenten henter informasjon fra disse dokumentene.

Fra H1 hvis finnes – Start utlesning ved hovedtittel

Alternativet Fra H1 hvis finnes instruerer retrieveren til å begynne å hente innhold fra H1-overskriften den finner (vanligvis artikkelens hovedtittel).

Hva skjer?

Hvis valgt: Alt før første H1 (som navigasjon, brødsmulesti eller innloggingslenker) ignoreres. Utlesningen starter ved hovedinnholdet i artikkelen.
Hvis ikke valgt: Innhentingen starter helt øverst på siden, inkludert all navigasjon, overskrifter og eventuell metadata over hovedartikkelen.

Eksempel på bruk:
Du ønsker kun å hente selve veiledningen, uten navigasjon eller sideoverskrifter som finnes på nettsiden din.

Merk:
Fra H1 hvis finnes er aktivert i Document Retriever-komponenten som standard.

Last fra peker – Hent fra en spesifikk markør

Alternativet Last fra peker gir deg mer presisjon ved å la Document Retriever kun hente data fra en peker i den muligens lengre artikkelen.

Hva skjer?

Hvis valgt (og en peker er satt): Uttrekk starter ved den spesifiserte pekeren og alt før den hoppes over, selv om den kommer etter H1.
Hvis ikke valgt: Uttrekk starter fra standardposisjonen (øverst i dokumentet, eller fra første H1 hvis det alternativet også er valgt).

Hva er en “peker”?
En peker er vanligvis en unik streng eller overskrift som finnes i dokumentet (for eksempel en H2, en bestemt frase eller seksjonstittel).

Eksempel på bruk:
Du ønsker å hoppe over introduksjonsseksjoner og hente informasjon for en spesifikk relevant del av en muligens lang artikkel eller et dokument (f.eks. fra “Trinn 4: Legg til en live chat-knapp” i en oppsettveiledning).

Hopp over siste overskrift – Ekskluder bunntekst eller repeterende overskrifter

Alternativet Hopp over siste overskrift er nyttig for å ignorere den siste overskriften i dokumentet, som ofte gjentas eller brukes til navigasjon eller bunntekstformål.

Hva skjer?

Hvis valgt: Den siste overskriften (f.eks. gjentatt artikkeltittel eller “Andre artikler”-seksjon) ignoreres ved uthenting.
Hvis ikke valgt: Alle overskrifter, inkludert den siste, tas med i utdataene.

Eksempel på bruk:
Du ønsker å unngå at Document Retriever laster inn en bunntekst-navigasjonsoverskrift (for eksempel “Andre artikler” på slutten av en hjelpeside), slik at bare hovedinnholdet blir behandlet.

Merk:
Hopp over siste overskrift kan være nyttig for dokumenter som automatisk genererer bunntekster eller repeterende navigasjonselementer. Har du ikke slike seksjoner, kan bruk av denne parameteren føre til at deler av artikkelen med gyldig informasjon ikke blir hentet ut. Det anbefales derfor å la dette alternativet være av frem til det foreligger en gyldig grunn til å aktivere det.

Maks antall tokens – Kontroller maksimal utdata-lengde

Parameteren Maks antall tokens lar deg styre det maksimale antallet tokens (ord og tegnsetting, slik AI-modellen teller) som Document Retriever vil hente fra teksten.

Hva skjer?

Det uthentede innholdet begrenses til det spesifiserte antallet tokens. Alt innhold over denne grensen blir avkortet og ikke tatt med i utdataene.
Denne parameteren hjelper med å håndtere svært lange dokumenter, slik at utdataene holder seg innenfor AI-modellenes prosesseringsgrenser.

Standardverdi:
Standardverdien er vanligvis 3000 tokens, men du kan justere dette ved behov.

Eksempel på bruk:
Hvis du behandler lange dokumenter, kan en lavere verdi for Maks antall tokens bidra til å holde svarene korte. For best resultat bør du likevel vurdere å aktivere “Last fra peker”-parameteren. Da starter uthentingen på den mest relevante delen av dokumentet, i stedet for fra begynnelsen, slik at du får ut et fokusert og håndterbart tekstutdrag innenfor valgt token-grense. Denne kombinasjonen er spesielt nyttig når du ønsker korte, kontekstrelevante utdrag fra store kilder.

Merk:
Hvis du ser at informasjon blir kuttet, kan du øke verdien for Maks antall tokens. Ønsker du kortere, mer fokuserte utdata, reduser parameteren for Maks antall tokens.

Strategi – Kontroller hvordan flere dokumenter slås sammen til tekst

Når Document Retriever finner flere relevante dokumenter, bestemmer parameteren Strategi hvordan de slås sammen til én tekst for chatboten din, med hensyn til “Maks antall tokens”.

To strategialternativer:

Inkluder lik størrelse fra hvert dokument:
Token-grensen deles jevnt. For eksempel, med tre dokumenter og en grense på 3 000 tokens, får hvert dokument opptil 1 000 tokens. Dette sikrer at alle kilder bidrar likt, noe som er nyttig hvis du ønsker et balansert svar som henter fra flere dokumenter.
- Bruk når: Du har dokumentasjon hvor ulike aspekter av et emne er fordelt på flere dokumenter, og det kreves input fra flere kilder for å lage et fullstendig svar. Denne tilnærmingen er mest effektiv når ingen enkeltkilde inneholder alle nødvendige detaljer, og du vil sikre at informasjon fra hvert relevant dokument er representert i svaret, slik at du får et mangfoldig eller godt avrundet perspektiv.
Koble sammen dokumenter, fyll fra det første opp til token-grensen:
Dokumenter legges til etter relevans til grensen er nådd. Det mest relevante dokumentet fyller plassen først; hvis det er plass igjen, legges mindre relevante dokumenter til i rekkefølge. Hvis det første dokumentet er langt, kan det bruke hele grensen alene.
- Bruk når: Du har dokumentasjon hvor hver enkelt fil inneholder detaljerte opplysninger om hvert tema, og det er mest hensiktsmessig å hente så mye som mulig fra dette dokumentet, i stedet for å kombinere informasjon fra flere dokumenter som omhandler lignende emner.

Hvordan velge?

Bruk Inkluder lik størrelse fra hvert dokument hvis du ønsker balansert representasjon fra alle kilder.
Bruk Koble sammen dokumenter, fyll fra det første opp til token-grensen hvis du vil prioritere de mest relevante dokumentene og ikke er så opptatt av å inkludere alle kildene.

Merk:
Disse strategiene påvirker kun hvordan teksten settes sammen fra de uthentede dokumentene før den sendes til neste steg (for eksempel AI-generering). De endrer ikke hvilke dokumenter som hentes—bare hvordan innholdet deres kombineres og kuttes for å passe innenfor innstillingen for Maks antall tokens.

Andre parametere i Document Retriever

Selv om denne artikkelen fokuserer på oppsett av parameterne ‘Fra H1 hvis finnes’, ‘Last fra peker’, ‘Hopp over siste overskrift’ og ‘Maks antall tokens’, tilbyr Document Retriever også flere andre parametere som hjelper med å styre hvordan dokumenter velges og hentes:

Antall dokumenter

Denne innstillingen begrenser hvor mange dokumenter flyten skal hente, for å sikre relevante resultater og raske svar.

Dokumentkategorier

Denne valgfrie innstillingen lar deg begrense uthenting til én eller flere kategorier du har opprettet i Dokumenter-delen under Kunnskapskilder.

Skjul ressurser

Dette lar deg inkludere eller skjule en egen seksjon, før selve chatbot-svaret, med en liste over ressurser som ble hentet av retrieveren. For integrasjon med LiveAgent må dette være valgt, da denne seksjonen ikke støttes og ikke vil vises riktig i LiveAgent chatbot-widgeten.

Tidsplaner

Lar deg begrense uthenting til én eller flere tidsplaner du har angitt for crawling eller oppdatering av innhold i Kunnskapskilder.

Terskelverdi

Styrer hvor tett de uthentede dokumentene må matche innspørringen, ved hjelp av en relevans-score (fra 0 til 1). For eksempel anbefales en terskel mellom 0,7–0,8 for svært relevante svar. Høyere terskel gir mer presise treff, mens lavere terskel kan inkludere mindre relevante dokumenter.

Eksempel:
Hvis du setter terskelverdien til 0,6 og har fire artikler med relevans-score på 0,8, 0,65, 0,5 og 0,9, vil kun de over 0,6 (altså 0,8, 0,65 og 0,9) brukes for uthenting.

Feilsøking

Hvis svaret chatboten gir ikke inneholder informasjon du er sikker på at chatboten har tilgjengelig i dokumentene eller tidsplanene dine, kan du sjekke samtalehistorikken med “Verbose”-alternativet for å se detaljerte logger over om Document Retriever ble brukt og hvilke dokumenter som ble hentet. Juster eventuelt innstillinger og prompt basert på disse loggene.

Hvordan konfigurere Document Retriever

Fra H1 hvis finnes – Start utlesning ved hovedtittel

Last fra peker – Hent fra en spesifikk markør

Hopp over siste overskrift – Ekskluder bunntekst eller repeterende overskrifter

Maks antall tokens – Kontroller maksimal utdata-lengde

Strategi – Kontroller hvordan flere dokumenter slås sammen til tekst