Document Retriever
Document Retriever collega i modelli AI ai documenti e agli URL che scegli, consentendo risposte AI accurate, aggiornate e pertinenti per il tuo caso d’uso specifico.

Descrizione del componente
Come funziona il componente Document Retriever
Il principale limite dei grandi modelli linguistici è la loro tendenza a fornire informazioni vaghe, obsolete o addirittura false. Per garantire che le risposte siano sempre aggiornate e pertinenti al tuo caso d’uso, i modelli generativi devono essere collegati alle giuste fonti di conoscenza.
Questo approccio, chiamato Retrieval-Augmented Generation (RAG), fornisce ai modelli generativi le tue fonti di conoscenza. I componenti retriever, incluso il Document Retriever, consentono di utilizzare questo metodo.
Cos’è il componente Document Retriever?
Questo componente permette al chatbot di recuperare conoscenza dalle tue fonti, assicurando che le informazioni siano pertinenti, affidabili e aggiornate. Queste informazioni provengono direttamente dalle fonti che hai specificato nelle sezioni Documenti e Pianificazioni. Il ruolo di questo componente è controllare il recupero delle informazioni.

Query di Input
Specifica la query utilizzata per cercare informazioni pertinenti. Può essere collegata da un altro componente o inserita manualmente. Nella maggior parte dei casi, la tua query di input sarà l’Input Chat.
Numero di Documenti
Questa impostazione limita la quantità di documenti da cui il flow deve recuperare dati, assicurando che i risultati restino pertinenti e non richiedano troppo tempo per essere generati.
Categorie di Documenti
Questa impostazione opzionale ti consente di limitare il recupero a una delle categorie che hai creato nella schermata Documenti delle Fonti di Conoscenza.
Pianificazioni
Ti permette di limitare il recupero a una delle Pianificazioni che hai specificato nella schermata Pianificazioni delle Fonti di Conoscenza.
Soglia
Le fonti nella tua base di conoscenza corrisponderanno alla query in misura variabile. L’AI le classificherà per rilevanza da 0 a 1. Questa impostazione ti permette di controllare quanto la risposta deve corrispondere alla query.
La soglia esatta dipende dal tuo caso d’uso, ma generalmente si consiglia 0.7-0.8 per risposte molto pertinenti da un numero ragionevole di fonti.
Immagina di impostare la soglia a 0.6 e di avere i seguenti articoli:
- Articolo A: 0.8
- Articolo B: 0.65
- Articolo C: 0.5
- Articolo D: 0.9
Solo gli articoli con un punteggio di rilevanza superiore a 0.6 saranno inclusi nell’output, cioè solo A, B e D.
- Una soglia alta, come 0.9, restituirà risultati molto pertinenti che corrispondono strettamente alla query, ma potrebbe faticare a trovare abbastanza documenti e perdere alcuni rilevanti.
- Una soglia bassa, ad esempio sotto 0.5, fornirà informazioni da più documenti, ma rischia di restituire dati non pertinenti.
Come collegare il componente Document Retriever al tuo flow
Il componente contiene solo un input e un output:
- Input Query: La query può essere qualsiasi output di testo. I casi d’uso comuni sono il collegamento dell’Input Chat umano o di un Generatore.
- Output: L’output di qualsiasi componente di tipo retriever è sempre un Documento.
L’output Documento contiene dati strutturati non adatti all’output finale della chat. Tutti i componenti che ricevono Documenti come input li trasformano in un formato adatto all’utente. Questi sono i componenti Widget oppure il trasformatore da Documento a Testo.
Perché usare il Document Retriever?
- Rendere i modelli AI più affidabili: Migliora l’accuratezza e la pertinenza delle risposte AI fornendo informazioni reali e contestuali dalla base di conoscenza della tua organizzazione.
- Arricchimento contestuale: Fornisci a LLM o chatbot documenti di supporto o materiale di riferimento per risposte più informate.
- Filtri flessibili: La ricerca può essere raffinata per categoria, pianificazione, URL, struttura del documento o metadati, garantendo che vengano selezionate solo le informazioni più rilevanti.
- Output personalizzato: Scegli quante informazioni recuperare, come suddividerle e quali metadati includere, facilitando l’adattamento ai processi AI a valle o alle esigenze dell’interfaccia.
- Integrazione con agenti: Grazie a descrizioni e nomi degli strumenti, il componente può essere utilizzato come tool in architetture basate su agenti.
Casi d’Uso Esempio
- Retrieval-Augmented Generation (RAG): Fornire ai LLM documenti di supporto per generare risposte accurate e basate sulla conoscenza.
- Chatbot e Assistenti Virtuali: Fornire rapidamente FAQ o documenti di policy in risposta alle domande di dipendenti/clienti.
- Arricchimento dei dati: Recuperare metadati su prodotto, autore o altro per ulteriori analisi AI o automazione dei workflow.
Esempio
Proviamolo subito! Prima di costruire il flow, dobbiamo assicurarci di aver creato Documenti o Pianificazioni rilevanti. Se non è presente una buona fonte, il chatbot si scuserà per l’impossibilità di rispondere.
Passaggi:
- Inizia con Input Chat.
- Aggiungi il Document Retriever e collega l’Input Chat come Input Query.
- L’output è un Documento che deve essere trasformato; in questo esempio useremo il componente Documento a Testo.
- Successivamente, collega un AI Generator.
- Ora sei pronto a chattare.

Ora il nostro Flow può cercare nelle nostre fonti in base a una query umana, trasformare i dati strutturati in testo leggibile e passarli all’AI per generare una risposta adatta all’utente.
Le nostre Fonti di Conoscenza includono una Pianificazione impostata per monitorare la pagina prezzi di FlowHunt per informazioni aggiornate. Chiediamo al bot:

Esempi di modelli di flusso che utilizzano il componente Document Retriever
Per aiutarti a iniziare rapidamente, abbiamo preparato diversi modelli di flusso di esempio che mostrano come utilizzare efficacemente il componente Document Retriever. Questi modelli presentano diversi casi d'uso e best practice, rendendo più facile per te comprendere e implementare il componente nei tuoi progetti.
Domande frequenti
- Cos'è il componente Document Retriever?
Questo componente consente al Flow di recuperare conoscenza dalle tue fonti, come documenti e URL, assicurando che le informazioni restituite siano pertinenti, affidabili e aggiornate.
- Perché non posso collegare un Document Retriever all'Output della Chat?
I componenti Retriever creano dati strutturati che non sono adatti all'output. Devono prima essere trasformati in testo o formato visivo prima di essere inviati al componente Chat Output.
- Da dove recupera le informazioni il Knowledge Retriever?
Il componente cerca la corrispondenza più vicina alla query tra le informazioni provenienti da URL, documenti e pianificazioni specificati dall'utente.
- Quanti documenti restituisce?
Puoi impostare un limite al numero di risultati restituiti, assicurando che solo i contenuti più pertinenti siano inclusi nel tuo flow.
- Posso filtrare quali documenti vengono cercati?
Sì, puoi filtrare per categorie di documenti, pianificazioni o URL, focalizzando la ricerca su segmenti specifici della tua base di conoscenza.
- Posso collegare sia il Document Retriever che GoogleSearch? In tal caso, quale viene prioritizzato?
Puoi usarli entrambi contemporaneamente. Ogni retriever conduce al proprio output, con priorità stabilita dall'ordine degli output nel canvas. Ha priorità il primo output dall'alto.
Prova il Document Retriever di FlowHunt
Costruisci soluzioni AI più intelligenti collegando le tue fonti di conoscenza e assicurando che il tuo chatbot fornisca sempre risposte pertinenti e aggiornate.