Prinúťte LLM overovať svoje odpovede a uvádzať zdroje

Zistite, ako vytvoriť chatboty s Retrieval Interleaved Generation (RIG), aby boli odpovede AI presné, overené a obsahovali overiteľné zdroje.

Prinúťte LLM overovať svoje odpovede a uvádzať zdroje

Čo je RIG (Retrieval Interleaved Generation)?

Retrieval Interleaved Generation, alebo skrátene RIG, je najmodernejšia AI metóda, ktorá plynulo spája vyhľadávanie informácií a vytváranie odpovedí. V minulosti AI modely využívali RAG (Retrieval Augmented Generation) alebo len generovanie, no RIG tieto procesy spája, aby zvýšil presnosť AI. Prepletaním vyhľadávania a generovania môžu AI systémy čerpať z rozsiahlejšej základne znalostí a ponúkať presnejšie a relevantnejšie odpovede. Hlavným cieľom RIG je znížiť chybovosť a zvýšiť dôveryhodnosť výstupov AI, vďaka čomu je nevyhnutným nástrojom pre vývojárov, ktorí chcú doladiť presnosť AI. Retrieval Interleaved Generation tak prichádza ako alternatíva k RAG (Retrieval Augmented Generation) na generovanie AI odpovedí na základe kontextu.

RIG vs RAG illustration

Ako funguje RIG (Retrieval Interleaved Generation)?

Takto funguje RIG. Nasledujúce fázy sú inšpirované pôvodným blogom](https://research.google/blog/grounding-ai-in-reality-with-a-little-help-from-data-commons/ “Preskúmajte modely DataGemma od Googlu, ktoré spájajú AI s reálnymi údajmi pre faktické, spoľahlivé odpovede. Pridajte sa k nám pri formovaní dôveryhodnej AI!”), ktorý sa viac zameriava na všeobecné použitie s využitím Data Commons API. Vo väčšine prípadov však budete chcieť používať ako všeobecnú [znalostnú databázu (napr. Wikipedia alebo Data Commons), tak aj vlastné dáta. Tu je postup, ako môžete využiť silu flowov vo FlowHunt na vytvorenie RIG chatbota z vlastnej znalostnej databázy aj zo všeobecnej, ako je Wikipedia.

  1. Používateľská otázka sa posunie do generátora, ktorý vygeneruje vzorovú odpoveď s citáciou príslušných sekcií. V tomto kroku môže generátor dokonca vytvoriť dobrú odpoveď, ktorá je však “halucinovaná” s nesprávnymi údajmi a štatistikami.

    RIG Stage 1: Sample answer generation
  2. V ďalšej fáze použijeme AI Agenta, ktorý tento výstup prijme a v každej sekcii upraví údaje pripojením na Wikipédiu a navyše pridá zdroje ku každej príslušnej sekcii.

    RIG Stage 2: Fact-checking and source attribution

Ako môžete vidieť, táto metóda výrazne zvyšuje presnosť chatbota a zaručuje, že každá vygenerovaná sekcia má zdroj a je podložená pravdivými informáciami.

Ako vytvoriť RIG chatbota vo FlowHunt?

Pridajte prvú fázu (Jednoduchý generátor vzorových odpovedí):

Prvá časť flowu pozostáva z Chat vstupu, šablóny promptu a generátora. Stačí ich navzájom prepojiť. Najdôležitejšia je šablóna promptu. Použil som nasledovné:

Zadaná je otázka používateľa. Na základe používateľovej otázky vygeneruj čo najlepšiu odpoveď s vymyslenými údajmi alebo percentami. Po každej z rôznych sekcií tvojej odpovede uveď, aký zdroj použiť na získanie správnych údajov a na úpravu danej sekcie s korektnými údajmi. Môžeš špecifikovať, že treba použiť interný zdroj znalostí na získanie údajov v prípade, že ide o vlastné údaje používateľovho produktu alebo služby, alebo použi Wikipédiu ako všeobecný zdroj znalostí.

Príklad vstupu: Ktoré krajiny sú najlepšie v oblasti obnoviteľnej energie a aká je najlepšia metrika na jej meranie a aká je táto hodnota pre top krajinu?
Príklad výstupu: Najlepšími krajinami v oblasti obnoviteľnej energie sú Nórsko, Švédsko, Portugalsko, USA [Vyhľadať vo Wikipédii s dopytom “Top Countries in renewable Energy”], bežnou metrikou pre obnoviteľnú energiu je Capacity factor [Vyhľadať vo Wikipédii s dopytom “metric for renewable energy”], a krajina číslo jeden má 20% capacity factor [vyhľadať vo Wikipédii “biggest capacity factor”]

Začnime!
Vstup používateľa: {input}

Tu používame Few Shot prompting, aby generátor vytvoril výstup presne v požadovanom formáte.

Sample prompt template in FlowHunt

Pridajte časť pre overenie faktov:

Teraz pridajte druhú časť, ktorá overuje vzorovú odpoveď a upraví ju na základe skutočných zdrojov pravdy. Tu použijeme Wikipédiu a AI Agentov, pretože je jednoduchšie a flexibilnejšie napojiť Wikipédiu na AI Agenta ako na jednoduché Generátory. Prepojte výstup generátora s AI Agentom a pripojte k AI Agentovi nástroj Wikipedia. Tu je cieľ, ktorý používam pre AI Agenta:

Dostanete vzorovú odpoveď na otázku používateľa. Vzorová odpoveď môže obsahovať nesprávne údaje. Použite nástroj Wikipedia v zadaných sekciách so špecifikovaným dopytom, aby ste použili informácie z Wikipédie na úpravu odpovede. V každej určenej sekcii uveďte odkaz na Wikipédiu. ZÍSKAJTE ÚDAJE Z NÁSTROJOV A UPRAVTE ODPOVEĎ V DANEJ SEKCIÍ. PRIDAJTE ODKAZ NA ZDROJ DO DANEJ SEKCIÍ, NIE NA KONIEC.

Podobne môžete k AI Agentovi pridať Document Retriever, ktorý sa dokáže pripojiť k vašej vlastnej znalostnej databáze a vyhľadávať dokumenty.

Connecting Wikipedia to AI Agent

Tento presný flow si môžete vyskúšať tu.

Pochopenie Retrieval-Augmented Generation (RAG)

Aby ste naozaj ocenili RIG, oplatí sa najprv pozrieť na jeho predchodcu, Retrieval-Augmented Generation (RAG). RAG spája silné stránky systémov, ktoré vyhľadávajú relevantné dáta, a modelov, ktoré generujú zmysluplný a vhodný obsah. Prechod od RAG k RIG je veľký krok vpred. RIG nielen vyhľadáva a generuje, ale tieto procesy aj prelína pre vyššiu presnosť a efektivitu. To umožňuje AI systémom zlepšovať porozumenie aj výstupy krok za krokom, pričom poskytujú výsledky, ktoré sú nielen presné, ale aj relevantné a zmysluplné. Prepojením vyhľadávania s generovaním môžu AI systémy čerpať z obrovského množstva informácií a zároveň udržiavať odpovede koherentné a relevantné.

Budúcnosť Retrieval Interleaved Generation

Budúcnosť Retrieval Interleaved Generation vyzerá sľubne, s množstvom pokrokov a výskumných smerov na obzore. Ako AI neustále napreduje, RIG sa stane kľúčovým prvkom pri formovaní sveta strojového učenia a AI aplikácií. Jeho potenciálny vplyv presahuje dnešné možnosti a sľubuje premeniť spôsob, akým AI systémy spracúvajú a generujú informácie. S prebiehajúcim výskumom očakávame ďalšie inovácie, ktoré zlepšia integráciu RIG do rôznych AI rámcov, čo povedie k efektívnejším, presnejším a spoľahlivejším AI systémom. Ako sa tieto trendy rozvíjajú, dôležitosť RIG bude len rásť, čím upevní svoju úlohu ako základ AI presnosti a výkonu.

Na záver, Retrieval Interleaved Generation predstavuje významný krok vpred v úsilí o presnosť a efektivitu AI. Umným prepojením vyhľadávania a generovania RIG zlepšuje výkon veľkých jazykových modelov, podporuje viacstupňové uvažovanie a ponúka zaujímavé možnosti vo vzdelávaní aj overovaní faktov. Do budúcnosti nepochybne ďalší vývoj RIG prinesie nové inovácie do AI a upevní jeho úlohu ako dôležitého nástroja na ceste k inteligentnejším a spoľahlivejším systémom umelej inteligencie.

Najčastejšie kladené otázky

Čo je Retrieval Interleaved Generation (RIG)?

RIG je AI metóda, ktorá kombinuje vyhľadávanie informácií a generovanie odpovedí, vďaka čomu môžu chatboty overovať svoje vlastné odpovede a poskytovať výstupy podložené zdrojmi.

Ako RIG zlepšuje presnosť chatbota?

RIG prepája kroky vyhľadávania a generovania, pričom využíva nástroje ako Wikipedia alebo vaše vlastné dáta, takže každá časť odpovede je podložená spoľahlivými zdrojmi a overená pre presnosť.

Ako môžem vytvoriť RIG chatbota pomocou FlowHunt?

S FlowHunt môžete navrhnúť RIG chatbota prepojením šablón promptov, generátorov a AI agentov s internými aj externými zdrojmi znalostí, čím umožníte automatické overovanie faktov a citovanie zdrojov.

Aký je rozdiel medzi RAG a RIG?

Zatiaľ čo RAG (Retrieval Augmented Generation) najskôr vyhľadá informácie a potom generuje odpovede, RIG tieto kroky pre každú časť odpovede prelína, čo vedie k vyššej presnosti a spoľahlivejším, zdrojovaným odpovediam.

Yasha je talentovaný softvérový vývojár so špecializáciou na Python, Javu a strojové učenie. Yasha píše technické články o AI, prompt engineeringu a vývoji chatbotov.

Yasha Boroumand
Yasha Boroumand
CTO, FlowHunt

Pripravení vytvoriť vlastnú AI?

Začnite tvoriť inteligentné chatboty a AI nástroje s intuitívnou platformou FlowHunt bez kódovania. Prepojte bloky a jednoducho automatizujte svoje nápady.

Zistiť viac