Prinúťte LLM overovať svoje odpovede a uvádzať zdroje

Zistite, ako vytvoriť chatboty s Retrieval Interleaved Generation (RIG), aby boli odpovede AI presné, overené a obsahovali overiteľné zdroje.

Prinúťte LLM overovať svoje odpovede a uvádzať zdroje

Čo je RIG (Retrieval Interleaved Generation)?

Retrieval Interleaved Generation, alebo skrátene RIG, je najmodernejšia AI metóda, ktorá plynulo spája vyhľadávanie informácií a vytváranie odpovedí. V minulosti AI modely využívali RAG (Retrieval Augmented Generation) alebo len generovanie, no RIG tieto procesy spája, aby zvýšil presnosť AI. Prepletaním vyhľadávania a generovania môžu AI systémy čerpať z rozsiahlejšej základne znalostí a ponúkať presnejšie a relevantnejšie odpovede. Hlavným cieľom RIG je znížiť chybovosť a zvýšiť dôveryhodnosť výstupov AI, vďaka čomu je nevyhnutným nástrojom pre vývojárov, ktorí chcú doladiť presnosť AI. Retrieval Interleaved Generation tak prichádza ako alternatíva k RAG (Retrieval Augmented Generation) na generovanie AI odpovedí na základe kontextu.

RIG vs RAG illustration

Ako funguje RIG (Retrieval Interleaved Generation)?

Takto funguje RIG. Nasledujúce fázy sú inšpirované pôvodným blogom](https://research.google/blog/grounding-ai-in-reality-with-a-little-help-from-data-commons/ “Preskúmajte modely DataGemma od Googlu, ktoré spájajú AI s reálnymi údajmi pre faktické, spoľahlivé odpovede. Pridajte sa k nám pri formovaní dôveryhodnej AI!”), ktorý sa viac zameriava na všeobecné použitie s využitím Data Commons API. Vo väčšine prípadov však budete chcieť používať ako všeobecnú [znalostnú databázu (napr. Wikipedia alebo Data Commons), tak aj vlastné dáta. Tu je postup, ako môžete využiť silu flowov vo FlowHunt na vytvorenie RIG chatbota z vlastnej znalostnej databázy aj zo všeobecnej, ako je Wikipedia.

  1. Používateľská otázka sa posunie do generátora, ktorý vygeneruje vzorovú odpoveď s citáciou príslušných sekcií. V tomto kroku môže generátor dokonca vytvoriť dobrú odpoveď, ktorá je však “halucinovaná” s nesprávnymi údajmi a štatistikami.

    RIG Stage 1: Sample answer generation
  2. V ďalšej fáze použijeme AI Agenta, ktorý tento výstup prijme a v každej sekcii upraví údaje pripojením na Wikipédiu a navyše pridá zdroje ku každej príslušnej sekcii.

    RIG Stage 2: Fact-checking and source attribution

Ako môžete vidieť, táto metóda výrazne zvyšuje presnosť chatbota a zaručuje, že každá vygenerovaná sekcia má zdroj a je podložená pravdivými informáciami.

Ako vytvoriť RIG chatbota vo FlowHunt?

Pridajte prvú fázu (Jednoduchý generátor vzorových odpovedí):

Prvá časť flowu pozostáva z Chat vstupu, šablóny promptu a generátora. Stačí ich navzájom prepojiť. Najdôležitejšia je šablóna promptu. Použil som nasledovné:

Zadaná je otázka používateľa. Na základe používateľovej otázky vygeneruj čo najlepšiu odpoveď s vymyslenými údajmi alebo percentami. Po každej z rôznych sekcií tvojej odpovede uveď, aký zdroj použiť na získanie správnych údajov a na úpravu danej sekcie s korektnými údajmi. Môžeš špecifikovať, že treba použiť interný zdroj znalostí na získanie údajov v prípade, že ide o vlastné údaje používateľovho produktu alebo služby, alebo použi Wikipédiu ako všeobecný zdroj znalostí.

Príklad vstupu: Ktoré krajiny sú najlepšie v oblasti obnoviteľnej energie a aká je najlepšia metrika na jej meranie a aká je táto hodnota pre top krajinu?
Príklad výstupu: Najlepšími krajinami v oblasti obnoviteľnej energie sú Nórsko, Švédsko, Portugalsko, USA [Vyhľadať vo Wikipédii s dopytom “Top Countries in renewable Energy”], bežnou metrikou pre obnoviteľnú energiu je Capacity factor [Vyhľadať vo Wikipédii s dopytom “metric for renewable energy”], a krajina číslo jeden má 20% capacity factor [vyhľadať vo Wikipédii “biggest capacity factor”]

Začnime!
Vstup používateľa: {input}

Tu používame Few Shot prompting, aby generátor vytvoril výstup presne v požadovanom formáte.

Sample prompt template in FlowHunt

Pridajte časť pre overenie faktov:

Teraz pridajte druhú časť, ktorá overuje vzorovú odpoveď a upraví ju na základe skutočných zdrojov pravdy. Tu použijeme Wikipédiu a AI Agentov, pretože je jednoduchšie a flexibilnejšie napojiť Wikipédiu na AI Agenta ako na jednoduché Generátory. Prepojte výstup generátora s AI Agentom a pripojte k AI Agentovi nástroj Wikipedia. Tu je cieľ, ktorý používam pre AI Agenta:

Dostanete vzorovú odpoveď na otázku používateľa. Vzorová odpoveď môže obsahovať nesprávne údaje. Použite nástroj Wikipedia v zadaných sekciách so špecifikovaným dopytom, aby ste použili informácie z Wikipédie na úpravu odpovede. V každej určenej sekcii uveďte odkaz na Wikipédiu. ZÍSKAJTE ÚDAJE Z NÁSTROJOV A UPRAVTE ODPOVEĎ V DANEJ SEKCIÍ. PRIDAJTE ODKAZ NA ZDROJ DO DANEJ SEKCIÍ, NIE NA KONIEC.

Podobne môžete k AI Agentovi pridať Document Retriever, ktorý sa dokáže pripojiť k vašej vlastnej znalostnej databáze a vyhľadávať dokumenty.

Connecting Wikipedia to AI Agent

Tento presný flow si môžete vyskúšať tu.

Pochopenie Retrieval-Augmented Generation (RAG)

Aby ste naozaj ocenili RIG, oplatí sa najprv pozrieť na jeho predchodcu, Retrieval-Augmented Generation (RAG). RAG spája silné stránky systémov, ktoré vyhľadávajú relevantné dáta, a modelov, ktoré generujú zmysluplný a vhodný obsah. Prechod od RAG k RIG je veľký krok vpred. RIG nielen vyhľadáva a generuje, ale tieto procesy aj prelína pre vyššiu presnosť a efektivitu. To umožňuje AI systémom zlepšovať porozumenie aj výstupy krok za krokom, pričom poskytujú výsledky, ktoré sú nielen presné, ale aj relevantné a zmysluplné. Prepojením vyhľadávania s generovaním môžu AI systémy čerpať z obrovského množstva informácií a zároveň udržiavať odpovede koherentné a relevantné.

Budúcnosť Retrieval Interleaved Generation

Budúcnosť Retrieval Interleaved Generation vyzerá sľubne, s množstvom pokrokov a výskumných smerov na obzore. Ako AI neustále napreduje, RIG sa stane kľúčovým prvkom pri formovaní sveta strojového učenia a AI aplikácií. Jeho potenciálny vplyv presahuje dnešné možnosti a sľubuje premeniť spôsob, akým AI systémy spracúvajú a generujú informácie. S prebiehajúcim výskumom očakávame ďalšie inovácie, ktoré zlepšia integráciu RIG do rôznych AI rámcov, čo povedie k efektívnejším, presnejším a spoľahlivejším AI systémom. Ako sa tieto trendy rozvíjajú, dôležitosť RIG bude len rásť, čím upevní svoju úlohu ako základ AI presnosti a výkonu.

Na záver, Retrieval Interleaved Generation predstavuje významný krok vpred v úsilí o presnosť a efektivitu AI. Umným prepojením vyhľadávania a generovania RIG zlepšuje výkon veľkých jazykových modelov, podporuje viacstupňové uvažovanie a ponúka zaujímavé možnosti vo vzdelávaní aj overovaní faktov. Do budúcnosti nepochybne ďalší vývoj RIG prinesie nové inovácie do AI a upevní jeho úlohu ako dôležitého nástroja na ceste k inteligentnejším a spoľahlivejším systémom umelej inteligencie.

Najčastejšie kladené otázky

Čo je Retrieval Interleaved Generation (RIG)?

RIG je AI metóda, ktorá kombinuje vyhľadávanie informácií a generovanie odpovedí, vďaka čomu môžu chatboty overovať svoje vlastné odpovede a poskytovať výstupy podložené zdrojmi.

Ako RIG zlepšuje presnosť chatbota?

RIG prepája kroky vyhľadávania a generovania, pričom využíva nástroje ako Wikipedia alebo vaše vlastné dáta, takže každá časť odpovede je podložená spoľahlivými zdrojmi a overená pre presnosť.

Ako môžem vytvoriť RIG chatbota pomocou FlowHunt?

S FlowHunt môžete navrhnúť RIG chatbota prepojením šablón promptov, generátorov a AI agentov s internými aj externými zdrojmi znalostí, čím umožníte automatické overovanie faktov a citovanie zdrojov.

Aký je rozdiel medzi RAG a RIG?

Zatiaľ čo RAG (Retrieval Augmented Generation) najskôr vyhľadá informácie a potom generuje odpovede, RIG tieto kroky pre každú časť odpovede prelína, čo vedie k vyššej presnosti a spoľahlivejším, zdrojovaným odpovediam.

Yasha je talentovaný softvérový vývojár so špecializáciou na Python, Javu a strojové učenie. Yasha píše technické články o AI, prompt engineeringu a vývoji chatbotov.

Yasha Boroumand
Yasha Boroumand
CTO, FlowHunt

Pripravení vytvoriť vlastnú AI?

Začnite tvoriť inteligentné chatboty a AI nástroje s intuitívnou platformou FlowHunt bez kódovania. Prepojte bloky a jednoducho automatizujte svoje nápady.

Zistiť viac

Retrieval vs Cache Augmented Generation (CAG vs. RAG)
Retrieval vs Cache Augmented Generation (CAG vs. RAG)

Retrieval vs Cache Augmented Generation (CAG vs. RAG)

Objavte kľúčové rozdiely medzi Retrieval-Augmented Generation (RAG) a Cache-Augmented Generation (CAG) v AI. Zistite, ako RAG dynamicky získava informácie v reá...

5 min čítania
RAG CAG +5
Retrieval Augmented Generation (RAG)
Retrieval Augmented Generation (RAG)

Retrieval Augmented Generation (RAG)

Retrieval Augmented Generation (RAG) je pokročilý AI rámec, ktorý kombinuje tradičné systémy na vyhľadávanie informácií s generatívnymi veľkými jazykovými model...

3 min čítania
RAG AI +4
Odpovedanie na otázky
Odpovedanie na otázky

Odpovedanie na otázky

Odpovedanie na otázky s Retrieval-Augmented Generation (RAG) kombinuje vyhľadávanie informácií a generovanie prirodzeného jazyka na vylepšenie veľkých jazykovýc...

5 min čítania
AI Question Answering +4