
Kunskapskällwidget
Visa relevanta dokument direkt i dina chatbot-svar med Kunskapskällwidgeten. Denna komponent visar utvalda kunskapsdokument som visuellt särskiljande widgets, v...
Omvandla strukturerad data till läsbar markdown-text med FlowHunts komponent Dokument till Text, som erbjuder anpassningsbara kontroller för effektiv och relevant AI-driven utmatning.
Komponentbeskrivning
AI kan analysera stora mängder data på några sekunder, men bara en del av datan kommer vara relevant eller lämplig för utmatning. Komponenten Dokument till Text ger dig kontroll över hur data från hämtare bearbetas och omvandlas till text.
Dokument till Text-komponenten är utformad för att omvandla kunskapsdokument till ett rent textformat. Detta är särskilt användbart i AI- och databearbetningsflöden där textdata behövs för vidare bearbetning, analys eller som indata till språkmodeller.
Den här komponenten tar emot ett eller flera strukturerade dokument (såsom HTML, Markdown, PDF eller andra stödda format) och extraherar textinnehållet. Du kan exakt ange vilka delar av dokumenten som ska exporteras, om metadata ska inkluderas, och hur dokumentsektioner eller rubriker ska hanteras. Utmatningen är ett enhetligt meddelandeobjekt som innehåller den extraherade texten, redo för nedströmsuppgifter som summering, klassificering eller frågehantering.
Komponenten accepterar flera konfigurerbara indata:
Indatanamn | Typ | Obligatorisk | Beskrivning | Standardvärde |
---|---|---|---|---|
Dokument | List[Document] | Ja | Kunskapsdokumenten att omvandla till text. | N/A (användarens val) |
Från H1 om finns | Boolean | Ja | Starta extraheringen från första H1-rubriken om den finns. | true |
Ladda från pekare | Boolean | Ja | Starta extraheringen från pekaren som bäst matchar inmatningsfrågan, eller ladda alla om ingen matchar. | true |
Max antal tecken | Integer | Nej | Maximalt antal tecken i utmatningstexten. | 3000 |
Hoppa över sista rubrik | Boolean | Ja | Hoppa över sista rubriken (ofta en sidfot) för att optimera utmatningen. | false |
Strategi | String | Ja | Textens extraheringsstrategi: sammanfoga dokument eller inkludera lika mycket från varje. | “Inkludera lika mycket från varje dokument” |
Exportera innehåll | Flera val | Nej | Vilka innehållstyper som ska inkluderas (t.ex. H1, H2, stycke). | Alla typer valda |
Inkludera metadata | Flera val | Nej | Vilka metadatafält som ska inkluderas i utmatningen om de finns. | Produkt |
Tillgängliga innehållstyper: H1, H2, H3, H4, H5, H6, Stycke
Metadata-alternativ: Författare, Produkt, BreadcrumbList, VideoObject, BlogPosting, FAQPage, WebSite, opengraph
Komponenten ger följande utdata:
Funktionalitet | Beskrivning |
---|---|
Indatatyper | Lista över dokument |
Utdatatyp | Meddelande (Text + Metadata) |
Innehållsgranularitet | Välj rubriker/stycken att inkludera |
Metadata-alternativ | Välj flera metadatafält att exportera |
Kontroll över utmatningsstorlek | Ställ in max antal tecken |
Extraheringsstrategier | Sammanfoga eller balansera mellan dokument |
Sektionsval | Börja från H1, från pekare, eller hoppa över sista rubrik |
Boten kan genomsöka många dokument för att skapa textutmatningen. Inställningen Strategi låter dig styra hur den använder dessa dokument smart inom teckengränsen.
För närvarande finns två möjliga strategier:
Detta är en transformator-komponent, vilket innebär att den överbryggar gapet mellan två utdata. Dokument till Text tar emot dokument som levererats av hämtarkomponenter:
Kunskapen konverteras till läsbar Markdown-text när den passerar genom transformatorn. Denna text kan sedan kopplas till komponenter som kräver textindata, såsom delare, widgets eller utmatningar.
Här är ett exempel på ett flöde som använder komponenten Dokument till Text för att överbrygga gapet mellan dokumenthämtare och AI-generatorn:
Komponenten hämtar kunskap från hämtarkomponenter och omvandlar det till läsbar markdown-text, som sedan kan kopplas till vilken komponent som helst som tar text som indata.
Börja bygga smartare AI-lösningar med FlowHunts komponent Dokument till Text. Konvertera data sömlöst till användbar text och förbättra dina automatiserade arbetsflöden.
Visa relevanta dokument direkt i dina chatbot-svar med Kunskapskällwidgeten. Denna komponent visar utvalda kunskapsdokument som visuellt särskiljande widgets, v...
Generera CSV-filer enkelt inom dina automatiserade arbetsflöden med komponenten CSV-utmatning. Omvandla strukturerad data till nedladdningsbart CSV-format—perfe...
Komponenten Parsa Data omvandlar strukturerad data till vanlig text med hjälp av anpassningsbara mallar. Den möjliggör flexibel formatering och konvertering av ...