Saa LLM:t tarkistamaan vastauksensa ja lisäämään lähteet

Saa LLM:t tarkistamaan vastauksensa ja lisäämään lähteet

AI Chatbot Fact-Checking RIG

Mikä on RIG (Retrieval Interleaved Generation)?

Retrieval Interleaved Generation eli lyhyesti RIG on huipputason tekoälymenetelmä, joka yhdistää sulavasti tiedon haun ja vastausten tuottamisen. Aiemmin tekoälymalleissa käytettiin RAG:ia (Retrieval Augmented Generation) tai pelkkää generointia, mutta RIG yhdistää nämä prosessit parantaakseen tekoälyn tarkkuutta. Yhdistämällä tiedonhaku ja generointi tekoälyjärjestelmät voivat hyödyntää laajempaa tietopohjaa tarjoten tarkempia ja osuvampia vastauksia. RIG:n päätavoite on vähentää virheitä ja parantaa tekoälyn tuottamien vastausten luotettavuutta, tehden siitä olennaisen työkalun kehittäjille, jotka haluavat hioa tekoälyn tarkkuutta. Näin ollen Retrieval Interleaved Generation on vaihtoehto RAG:lle (Retrieval Augmented Generation) tekoälypohjaisten vastausten tuottamiseen kontekstin perusteella.

RIG vs RAG illustration

Miten RIG (Retrieval Interleaved Generation) toimii?

Näin RIG toimii. Seuraavat vaiheet on inspiroitu alkuperäisestä blogista](https://research.google/blog/grounding-ai-in-reality-with-a-little-help-from-data-commons/ “Tutustu Googlen DataGemma-malleihin, jotka yhdistävät tekoälyn todelliseen dataan faktoihin perustuvien, luotettavien vastausten saamiseksi. Tule mukaan rakentamaan luotettavaa tekoälyä!”), joka painottuu enemmän yleiskäyttöön Data Commons API:n avulla. Useimmissa tapauksissa haluat kuitenkin hyödyntää sekä yleistä [tietopohjaa (esim. Wikipedia tai Data Commons) että omaa dataasi. Näin voit hyödyntää FlowHuntin flow-rakenteita rakentaaksesi RIG-chatbotin sekä omasta tietopohjastasi että yleisestä tietolähteestä kuten Wikipediasta.

  1. Käyttäjän kysymys syötetään generaattorille, joka tuottaa mallivastauksen ja viittaukset vastaaviin osioihin. Tässä vaiheessa generaattori voi tuottaa hyvän vastauksen, mutta se saattaa sisältää keksittyä tietoa ja tilastoja.

    RIG Stage 1: Sample answer generation
  2. Seuraavassa vaiheessa käytetään tekoälyagenttia, joka ottaa tämän vastauksen ja tarkentaa tiedot jokaisessa osiossa yhdistämällä Wikipediaan sekä lisää lähteet kuhunkin vastaavaan osioon.

    RIG Stage 2: Fact-checking and source attribution

Kuten huomaat, tämä menetelmä parantaa chatbotin tarkkuutta merkittävästi ja varmistaa, että jokaisella generoidulla osiolla on lähde ja että se perustuu totuuteen.

Kuinka luoda RIG-chatbot FlowHuntilla?

Lisää ensimmäinen vaihe (yksinkertainen mallivastausgeneraattori):

Ensimmäinen osa flow’ta koostuu chat-syötteestä, kehotepohjasta ja generaattorista. Yhdistä ne yksinkertaisesti yhteen. Tärkein osa on kehotepohja. Olen käyttänyt seuraavaa:

Käyttäjän kysymys on annettu. Laadi käyttäjän kysymyksen perusteella paras mahdollinen vastaus, jossa käytetään keksittyä tietoa tai prosenttiosuuksia. Jokaisen eri osion jälkeen lisää tieto siitä, mitä lähdettä tulisi käyttää oikean tiedon hakemiseen ja kyseisen osion tarkentamiseen oikealla tiedolla. Voit joko määrittää käytettäväksi sisäisen tietolähteen, jos käyttäjällä on omaa dataa tuotteeseen tai palveluun liittyen, tai käyttää Wikipediaa yleisenä tietolähteenä.

Esimerkki syöte: Mitkä maat ovat johtavia uusiutuvassa energiassa ja mikä on paras mittari tämän arviointiin ja mikä on tuo mittaustulos parhaalle maalle?
Esimerkkivastaus: Johtavat maat uusiutuvassa energiassa ovat Norja, Ruotsi, Portugali, USA [Etsi Wikipediasta haulla “Top Countries in renewable Energy”], tavallinen mittari uusiutuvalle energialle on Capacity factor [Etsi Wikipediasta haulla “metric for renewable energy”], ja ykkösmaa saavuttaa 20 % kapasiteettikertoimen [etsi Wikipediasta “biggest capacity factor”]

Aloitetaan nyt!
Käyttäjän syöte: {input}

Tässä käytämme Few Shot -promptingia saadaksemme generaattorilta juuri haluamamme muotoisen vastauksen.

Sample prompt template in FlowHunt

Lisää faktantarkistusosio:

Lisää nyt toinen osa, joka tarkistaa mallivastauksen oikeellisuuden ja tarkentaa vastauksen oikeisiin tietolähteisiin perustuen. Tässä käytämme Wikipediaa ja tekoälyagentteja, sillä Wikipedia on helpompi ja joustavampi yhdistää tekoälyagenttiin kuin yksinkertaiseen generaattoriin. Yhdistä generaattorin tuloste tekoälyagenttiin ja Wikipedia-työkalu tekoälyagenttiin. Tässä on käyttämäni tavoite tekoälyagentille:

Sinulle annetaan mallivastaus käyttäjän kysymykseen. Mallivastaus saattaa sisältää vääriä tietoja. Käytä Wikipedia-työkalua annetuissa osioissa määritellyllä haulla ja hyödynnä Wikipedian tietoja vastauksen tarkentamiseen. Lisää Wikipedian linkki jokaiseen määriteltyyn osioon. HAE DATA TYÖKALUISTASI JA TARKENNA VASTAUS KYSEISESSÄ OSIOSSA. LISÄÄ LÄHDELINKKI JUURI KYSEISEEN OSIOON, EI VASTAUKSEN LOPPUUN.

Samoin voit lisätä tekoälyagenttiin dokumenttihakijan, joka voi yhdistää oman mukautetun tietopohjasi dokumenttien hakua varten.

Connecting Wikipedia to AI Agent

Voit kokeilla tätä tarkalleen samanlaista flow’ta täällä.

Retrieval-Augmented Generation (RAG) -menetelmän ymmärtäminen

Jotta RIG:ia voisi todella arvostaa, kannattaa ensin tarkastella sen edeltäjää, Retrieval-Augmented Generationia (RAG). RAG yhdistää järjestelmien vahvuudet, jotka hakevat olennaista tietoa ja tuottavat johdonmukaista ja sopivaa sisältöä. Siirtymä RAG:ista RIG:iin on suuri askel eteenpäin. RIG ei ainoastaan hae ja generoi, vaan se myös yhdistää nämä vaiheet tarkkuuden ja tehokkuuden parantamiseksi. Tämä mahdollistaa tekoälyjärjestelmien ymmärryksen ja tuotoksen parantamisen vaiheittain, tarjoten lopputuloksia, jotka ovat sekä tarkkoja että osuvia ja oivaltavia. Yhdistämällä tiedonhaku ja generointi tekoälyjärjestelmät voivat hyödyntää valtavia tietomääriä pitäen vastaukset silti johdonmukaisina ja relevantteina.

Retrieval Interleaved Generationin tulevaisuus

Retrieval Interleaved Generationin tulevaisuus näyttää lupaavalta, ja edessä on monia kehitysaskeleita ja tutkimussuuntautumia. Tekoälyn jatkaessa kasvuaan tulee RIG:llä olemaan keskeinen rooli koneoppimisen ja tekoälysovellusten kehityksessä. Sen vaikutukset ulottuvat nykyistä pidemmälle ja lupaavat muuttaa tapaa, jolla tekoälyjärjestelmät prosessoivat ja tuottavat tietoa. Jatkuvan tutkimuksen myötä odotetaan uusia innovaatioita, jotka parantavat RIG:n integrointia erilaisiin tekoälyalustoihin, mikä johtaa tehokkaampiin, tarkempiin ja luotettavampiin tekoälyjärjestelmiin. Näiden kehitysten myötä RIG:n merkitys kasvaa entisestään ja vakiinnuttaa sen aseman tekoälyn tarkkuuden ja suorituskyvyn kulmakivenä.

Yhteenvetona voidaan todeta, että Retrieval Interleaved Generation on merkittävä edistysaskel tekoälyn tarkkuuden ja tehokkuuden tavoittelussa. Yhdistämällä tiedonhaku ja generointi taidokkaasti RIG parantaa suurten kielimallien suorituskykyä, kehittää monivaiheista päättelyä ja tarjoaa kiinnostavia mahdollisuuksia opetuksessa ja faktantarkistuksessa. Tulevaisuutta ajatellen RIG:n jatkuva kehitys tulee epäilemättä vauhdittamaan uusia tekoälyinnovaatioita, vahvistaen sen roolia älykkäämpien ja luotettavampien tekoälyjärjestelmien kehityksessä.

Usein kysytyt kysymykset

Mitä on Retrieval Interleaved Generation (RIG)?

RIG on tekoälymenetelmä, joka yhdistää tiedonhausta ja vastausten generoinnista, mahdollistaen chatbotille omien vastaustensa faktantarkistuksen ja lähteisiin perustuvat, tarkat vastaukset.

Miten RIG parantaa chatbotin tarkkuutta?

RIG yhdistää haku- ja generointivaiheet, hyödyntäen esimerkiksi Wikipediaa tai omia tietojasi, jotta jokainen vastausosio perustuu luotettaviin lähteisiin ja tarkistetaan oikeellisuuden osalta.

Kuinka rakennan RIG-chatbotin FlowHuntilla?

FlowHuntissa voit suunnitella RIG-chatbotin yhdistämällä kehotepohjia, generaattoreita ja tekoälyagentteja sekä sisäisiin että ulkoisiin tietolähteisiin, mahdollistaen automaattisen faktantarkistuksen ja lähdeviitteet.

Mikä ero on RAG:n ja RIG:n välillä?

RAG (Retrieval Augmented Generation) hakee tietoa ja generoi sitten vastauksen, kun taas RIG vuorottelee näitä vaiheita jokaisen osion kohdalla, mikä tuottaa tarkempia ja luotettavampia, lähteisiin perustuvia vastauksia.

Yasha on lahjakas ohjelmistokehittäjä, joka on erikoistunut Pythoniin, Javaan ja koneoppimiseen. Yasha kirjoittaa teknisiä artikkeleita tekoälystä, prompt engineeringistä ja chatbot-kehityksestä.

Yasha Boroumand
Yasha Boroumand
CTO, FlowHunt

Valmis rakentamaan oman tekoälysi?

Aloita älykkäiden chatbotien ja tekoälytyökalujen rakentaminen FlowHuntin intuitiivisella, koodittomalla alustalla. Yhdistä blokkeja ja automatisoi ideasi helposti.

Lue lisää

Retrieval Augmented Generation (RAG)
Retrieval Augmented Generation (RAG)

Retrieval Augmented Generation (RAG)

Retrieval Augmented Generation (RAG) on kehittynyt tekoälykehys, joka yhdistää perinteiset tiedonhakujärjestelmät generatiivisiin suuriin kielimalleihin (LLM:t)...

3 min lukuaika
RAG AI +4
RIG Wikipedia Assistant Chatbot (Retrieval Interleaved Generator)
RIG Wikipedia Assistant Chatbot (Retrieval Interleaved Generator)

RIG Wikipedia Assistant Chatbot (Retrieval Interleaved Generator)

Tutustu RIG Wikipedia Assistant -työkaluun, joka on suunniteltu tarkkaan tiedonhakuun Wikipediasta. Ihanteellinen tutkimukseen ja sisällöntuotantoon – se tarjoa...

1 min lukuaika
AI Wikipedia +5