
Jäsennä data
Parse Data -komponentti muuntaa jäsennellyn datan pelkäksi tekstiksi mukautettavien mallipohjien avulla. Sen avulla voit joustavasti muotoilla ja muuntaa datatu...
Muunna rakenteinen data luettavaan markdown-tekstiin FlowHuntin Dokumentista tekstiksi -komponentilla, joka tarjoaa räätälöitävät ohjaimet tehokkaaseen ja olennaiseen tekoälyn tuottamaan tulokseen.
Komponentin kuvaus
Tekoäly voi analysoida suuria tietomääriä sekunneissa, mutta vain osa datasta on olennaista tai sopivaa tulostettavaksi. Dokumentista tekstiksi -komponentti antaa sinulle hallinnan siihen, miten hakijoiden data käsitellään ja muunnetaan tekstiksi.
Dokumentista tekstiksi -komponentti on suunniteltu muuntamaan syötetyt tietodokumentit tavalliseen tekstimuotoon. Tämä on erityisen hyödyllistä tekoäly- ja datankäsittelyprosesseissa, joissa tekstimuotoista dataa tarvitaan jatkokäsittelyä, analysointia tai kielimalleille syöttämistä varten.
Tämä komponentti ottaa yhden tai useamman rakenteisen dokumentin (kuten HTML, Markdown, PDF tai muut tuetut muodot) ja purkaa niistä tekstisisällön. Voit määritellä tarkasti, mitkä osat dokumenteista viedään ulos, sisällytetäänkö metatietoja ja miten dokumentin osioita tai otsikoita käsitellään. Tuloksena on yhtenäinen viestiobjekti, joka sisältää puretun tekstin ja on valmis jatkokäsittelyyn, kuten tiivistämiseen, luokitteluun tai kysymyksiin vastaamiseen.
Komponentti hyväksyy useita muokattavia syötteitä:
Syötteen nimi | Tyyppi | Pakollinen | Kuvaus | Oletusarvo |
---|---|---|---|---|
Dokumentit | List[Document] | Kyllä | Tiedot, jotka muunnetaan tekstiksi. | N/A (käyttäjän annettava) |
Alkaen H1 jos on | Boolean | Kyllä | Aloita purku ensimmäisestä H1-otsikosta, jos sellainen löytyy. | true |
Lataa osoittimesta | Boolean | Kyllä | Aloita purku osoittimesta, joka parhaiten vastaa syötekyselyä, tai lataa kaikki, jos ei löydy. | true |
Max Tokens | Integer | Ei | Tulostetekstin enimmäismerkkimäärä (tokenit). | 3000 |
Ohita viimeinen otsikko | Boolean | Kyllä | Ohita viimeinen otsikko (usein alatunniste) tulosteen optimoimiseksi. | false |
Strategia | String | Kyllä | Tekstin purkustrategia: yhdistä dokumentit tai sisällytä yhtä paljon jokaisesta. | “Sisällytä yhtä paljon jokaisesta dokumentista” |
Vie sisältö | Monivalinta | Ei | Mitä sisältötyyppejä sisällytetään (esim. H1, H2, kappale). | Kaikki tyypit valittu |
Sisällytä metatiedot | Monivalinta | Ei | Mitä metatietokenttiä sisällytetään tulosteeseen, jos saatavilla. | Product |
Käytettävissä olevat sisältötyypit: H1, H2, H3, H4, H5, H6, Kappale
Metatietovaihtoehdot: Author, Product, BreadcrumbList, VideoObject, BlogPosting, FAQPage, WebSite, opengraph
Komponentti tuottaa seuraavan tulosteen:
Ominaisuus | Kuvaus |
---|---|
Syötetietotyypit | Dokumenttilista |
Tulostyyppi | Viesti (Teksti + Metatiedot) |
Sisällön tarkkuus | Valitse mukaan otettavat otsikot/kappaleet |
Metatietovaihtoehdot | Valitse useita metatietokenttiä vietäväksi |
Tulosteen koon hallinta | Aseta tokenien enimmäismäärä |
Purkustrategiat | Yhdistä tai tasapainota dokumenttien välillä |
Osioiden valinta | Aloita H1:stä, osoittimesta tai ohita viimeinen otsikko |
Botti voi selata useita dokumentteja luodakseen tekstitulosteen. Strategia-asetus antaa sinun hallita, miten näitä dokumentteja hyödynnetään älykkäästi pysyen token-rajan sisällä.
Tällä hetkellä kaksi mahdollista strategiaa:
Tämä on muunninkomponentti, eli se toimii siltana kahden tulosteen välillä. Dokumentista tekstiksi ottaa Retriever-komponenttien tuottamat dokumentit:
Tieto muunnetaan luettavaan Markdown-tekstiin kulkiessaan muuntimen läpi. Tämä teksti voidaan liittää seuraaviin komponentteihin, jotka tarvitsevat tekstisyötettä, kuten splitters, widgetit tai tulosteet.
Tässä on esimerkkityönkulku, jossa Dokumentista tekstiksi -komponenttia käytetään siltana Document Retrieverin ja AI Generatorin välillä:
Komponentti hakee tietoa hakija-tyyppisistä komponenteista ja muuntaa sen luettavaan markdown-tekstiin, jonka voi liittää mihin tahansa komponenttiin, joka ottaa tekstin syötteenä.
Aloita älykkäämpien tekoälyratkaisujen rakentaminen FlowHuntin Dokumentista tekstiksi -komponentilla. Muunna data saumattomasti toiminnalliseksi tekstiksi ja tehosta automatisoituja työnkulkuja.
Parse Data -komponentti muuntaa jäsennellyn datan pelkäksi tekstiksi mukautettavien mallipohjien avulla. Sen avulla voit joustavasti muotoilla ja muuntaa datatu...
Vie tiedostoon -komponentin avulla FlowHuntissa voit tallentaa työnkulun aikana syntyvää tekstiä tai dataa ladattaviin tiedostoihin useissa eri muodoissa, kuten...
Tekstin luokittelu, tunnetaan myös nimillä tekstin kategorisointi tai tekstin tunnisteiden lisääminen, on keskeinen NLP-tehtävä, jossa tekstidokumenteille annet...