
Phân Tích Dữ Liệu
Thành phần Phân Tích Dữ Liệu chuyển đổi dữ liệu có cấu trúc thành văn bản thuần túy bằng cách sử dụng các mẫu tùy chỉnh. Nó cho phép định dạng linh hoạt và chuy...
Chuyển đổi dữ liệu có cấu trúc thành văn bản markdown dễ đọc với thành phần Chuyển Đổi Tài Liệu Thành Văn Bản của FlowHunt, cung cấp các điều khiển tùy chỉnh cho đầu ra AI hiệu quả và phù hợp.
Mô tả thành phần
AI có thể phân tích một lượng lớn dữ liệu chỉ trong vài giây, nhưng chỉ một phần dữ liệu là phù hợp hoặc thích hợp để xuất ra. Thành phần Chuyển Đổi Tài Liệu Thành Văn Bản giúp bạn kiểm soát cách dữ liệu từ các bộ truy xuất được xử lý và chuyển đổi thành văn bản.
Thành phần Chuyển Đổi Tài Liệu Thành Văn Bản được thiết kế để chuyển đổi các tài liệu kiến thức đầu vào thành định dạng văn bản thuần túy. Điều này đặc biệt hữu ích trong các quy trình AI và xử lý dữ liệu, nơi dữ liệu dạng văn bản là cần thiết cho các bước xử lý tiếp theo, phân tích hoặc làm đầu vào cho các mô hình ngôn ngữ.
Thành phần này nhận một hoặc nhiều tài liệu có cấu trúc (như HTML, Markdown, PDF hoặc các định dạng khác được hỗ trợ) và trích xuất nội dung văn bản. Bạn có thể chỉ định chính xác phần nào của tài liệu sẽ xuất ra, có bao gồm siêu dữ liệu hay không, và cách xử lý các phần hoặc tiêu đề của tài liệu. Đầu ra là một đối tượng tin nhắn hợp nhất chứa văn bản đã trích xuất, sẵn sàng cho các tác vụ tiếp theo như tóm tắt, phân loại hoặc trả lời câu hỏi.
Thành phần chấp nhận một số đầu vào có thể cấu hình:
Tên Đầu Vào | Loại | Bắt Buộc | Mô Tả | Giá Trị Mặc Định |
---|---|---|---|---|
Tài Liệu | List[Document] | Có | Các tài liệu kiến thức cần chuyển đổi thành văn bản. | N/A (người dùng cung cấp) |
Từ H1 nếu có | Boolean | Có | Bắt đầu trích xuất từ tiêu đề H1 đầu tiên nếu có. | true |
Tải từ con trỏ | Boolean | Có | Bắt đầu trích xuất từ con trỏ phù hợp nhất với truy vấn đầu vào, hoặc tải tất cả nếu không khớp. | true |
Số lượng Token Tối Đa | Integer | Không | Số lượng token tối đa trong văn bản đầu ra. | 3000 |
Bỏ qua tiêu đề cuối | Boolean | Có | Bỏ qua tiêu đề cuối cùng (thường là chân trang) để tối ưu hóa đầu ra. | false |
Chiến lược | String | Có | Chiến lược trích xuất văn bản: nối tài liệu hoặc chia đều từ mỗi tài liệu. | “Bao gồm kích thước bằng nhau từ mỗi tài liệu” |
Xuất nội dung | Multi-select | Không | Loại nội dung nào sẽ xuất ra (ví dụ: H1, H2, Đoạn văn). | Chọn tất cả loại |
Bao gồm Siêu dữ liệu | Multi-select | Không | Trường siêu dữ liệu sẽ bao gồm trong đầu ra nếu có. | Product |
Các loại nội dung khả dụng: H1, H2, H3, H4, H5, H6, Đoạn văn
Tùy chọn siêu dữ liệu: Tác giả, Sản phẩm, BreadcrumbList, VideoObject, BlogPosting, FAQPage, WebSite, opengraph
Thành phần tạo ra đầu ra sau:
Khả năng | Mô tả |
---|---|
Loại đầu vào | Danh sách Tài Liệu |
Loại đầu ra | Tin nhắn (Văn bản + Siêu dữ liệu) |
Độ chi tiết nội dung | Chọn tiêu đề/đoạn văn cần xuất ra |
Tùy chọn Siêu dữ liệu | Chọn nhiều trường siêu dữ liệu để xuất |
Kiểm soát kích thước đầu ra | Thiết lập số lượng token tối đa |
Chiến lược trích xuất | Nối hoặc chia đều giữa các tài liệu |
Lựa chọn phần | Bắt đầu từ H1, từ con trỏ, hoặc bỏ qua tiêu đề cuối |
Bot có thể thu thập nhiều tài liệu để tạo ra đầu ra văn bản. Thiết lập Chiến lược giúp bạn kiểm soát cách nó sử dụng các tài liệu này một cách thông minh trong phạm vi giới hạn token.
Hiện tại có hai chiến lược khả dụng:
Đây là một thành phần transformer, nghĩa là nó kết nối giữa hai đầu ra. Chuyển Đổi Tài Liệu Thành Văn Bản nhận Tài Liệu được xuất ra từ các thành phần Bộ Truy Xuất:
Kiến thức sẽ được chuyển đổi thành văn bản Markdown dễ đọc khi đi qua transformer. Văn bản này sau đó có thể kết nối với các thành phần cần đầu vào dạng văn bản, như splitter, widget hoặc đầu ra.
Dưới đây là ví dụ về luồng sử dụng thành phần Chuyển Đổi Tài Liệu Thành Văn Bản để kết nối giữa Bộ Truy Xuất Tài Liệu và AI Generator:
Thành phần này lấy kiến thức từ các thành phần kiểu bộ truy xuất và chuyển đổi chúng thành văn bản markdown dễ đọc, sau đó có thể kết nối với bất kỳ thành phần nào nhận văn bản làm đầu vào.
Bắt đầu xây dựng các giải pháp AI thông minh hơn với thành phần Chuyển Đổi Tài Liệu Thành Văn Bản của FlowHunt. Dễ dàng chuyển đổi dữ liệu thành văn bản có thể hành động và nâng cao quy trình tự động hóa của bạn.
Thành phần Phân Tích Dữ Liệu chuyển đổi dữ liệu có cấu trúc thành văn bản thuần túy bằng cách sử dụng các mẫu tùy chỉnh. Nó cho phép định dạng linh hoạt và chuy...
Thành phần Xuất ra Tệp trong FlowHunt cho phép bạn lưu văn bản hoặc dữ liệu được tạo trong quy trình làm việc của mình vào các tệp có thể tải về với nhiều định ...
Thành phần Trình tạo Đầu ra Có cấu trúc cho phép bạn tạo ra dữ liệu có cấu trúc chính xác từ bất kỳ lời nhắc đầu vào nào bằng mô hình LLM bạn chọn. Định nghĩa c...