
Exportă în fișier
Componenta Exportă în fișier din FlowHunt îți permite să salvezi text sau date generate în timpul fluxului de lucru în fișiere descărcabile în diverse formate, ...
Transformă datele structurate în text markdown lizibil cu componenta Document la Text de la FlowHunt, oferind controale personalizabile pentru rezultate eficiente și relevante generate de AI.
Descrierea componentei
AI-ul poate analiza cantități mari de date în câteva secunde, dar doar unele dintre date vor fi relevante sau potrivite pentru output. Componenta Document la Text îți oferă control asupra modului în care datele preluate sunt procesate și transformate în text.
Componenta Document la Text este concepută pentru a transforma documente de cunoștințe introduse într-un format de text simplu. Acest lucru este deosebit de util în fluxurile de lucru de AI și procesare a datelor unde este nevoie de date text pentru procesări ulterioare, analiză sau ca input pentru modele de limbaj.
Această componentă preia unul sau mai multe documente structurate (precum HTML, Markdown, PDF-uri sau alte formate suportate) și extrage conținutul textual. Poți specifica exact care părți din documente să fie exportate, dacă să incluzi sau nu metadate și cum să gestionezi secțiunile sau titlurile documentului. Output-ul este un obiect mesaj unificat ce conține textul extras, gata pentru sarcini precum sumarizare, clasificare sau răspuns la întrebări.
Componenta acceptă mai multe inputuri configurabile:
Nume Input | Tip | Obligatoriu | Descriere | Valoare Implicită |
---|---|---|---|---|
Documente | Listă[Document] | Da | Documentele de cunoștințe ce trebuie transformate în text. | N/A (furnizat de utilizator) |
De la H1 dacă există | Boolean | Da | Începe extragerea de la primul header H1, dacă este prezent. | true |
Încarcă de la pointer | Boolean | Da | Începe extragerea de la pointerul care se potrivește cel mai bine cu query-ul sau încarcă tot dacă nu există potrivire. | true |
Max Tokens | Integer | Nu | Numărul maxim de tokeni în textul de output. | 3000 |
Omite ultimul header | Boolean | Da | Omite ultimul header (adesea un footer) pentru a optimiza output-ul. | false |
Strategie | String | Da | Strategia de extragere a textului: concatenează documentele sau include părți egale din fiecare. | “Include dimensiune egală din fiecare document” |
Exportă conținut | Multi-select | Nu | Ce tipuri de conținut să fie incluse (ex: H1, H2, Paragraf). | Toate tipurile selectate |
Include Metadate | Multi-select | Nu | Câmpuri de metadate ce se pot include în output, dacă sunt disponibile. | Produs |
Tipuri de conținut disponibile: H1, H2, H3, H4, H5, H6, Paragraf
Opțiuni metadate: Autor, Produs, BreadcrumbList, VideoObject, BlogPosting, FAQPage, WebSite, opengraph
Componenta generează următorul output:
Capacitate | Descriere |
---|---|
Tipuri de input | Listă de Documente |
Tip output | Mesaj (Text + Metadate) |
Granularitate conținut | Selectează titluri/paragrafe de inclus |
Opțiuni metadate | Selectează multiple câmpuri de metadate pentru export |
Control dimensiune output | Setează număr maxim de tokeni |
Strategii de extragere | Concatenare sau echilibrare între documente |
Selecție secțiune | Începe de la H1, de la pointer sau omite ultimul header |
Botul poate parcurge multe documente pentru a crea output-ul text. Setarea Strategie îți oferă control asupra modului în care utilizează aceste documente inteligent, rămânând în limita de tokeni.
În prezent, există două strategii posibile:
Aceasta este o componentă de tip transformator, ceea ce înseamnă că intermediază între două output-uri. Document la Text preia output-ul Documentelor generate de componentele Retriever:
Cunoștințele sunt convertite în text Markdown lizibil pe măsură ce trec prin transformator. Acest text poate fi apoi conectat la componente care necesită input text, precum splittere, widget-uri sau output-uri.
Iată un exemplu de flow ce folosește componenta Document la Text pentru a face legătura între Document Retrievers și AI Generator:
Componenta preia cunoștințe din componente de tip recuperator și le transformă în text markdown lizibil, care poate fi apoi conectat la orice componentă ce acceptă text ca input.
Începe să construiești soluții AI mai inteligente cu Document la Text de la FlowHunt. Convertește perfect datele în text valorificabil și îmbunătățește-ți fluxurile de lucru automatizate.
Componenta Exportă în fișier din FlowHunt îți permite să salvezi text sau date generate în timpul fluxului de lucru în fișiere descărcabile în diverse formate, ...
Componenta Parsează datele transformă datele structurate în text simplu folosind șabloane personalizabile. Permite formatarea flexibilă și conversia datelor de ...
Prezentați documente relevante direct în răspunsurile chatbot-ului folosind Widget-ul Sursă de Cunoștințe. Acest component afișează documentele selectate ca wid...