Trích Xuất Dữ Liệu Email & Tệp sang CSV

Quy trình làm việc này trích xuất và tổ chức các thông tin quan trọng từ email và các tệp đính kèm, sử dụng AI để xử lý và cấu trúc dữ liệu, sau đó xuất kết quả dưới dạng tệp CSV giúp dễ dàng phân tích và báo cáo. Lý tưởng để tự động hóa quản lý dữ liệu email và tích hợp với bảng tính.

Cách Luồng AI hoạt động - Trích Xuất Dữ Liệu Email & Tệp sang CSV

Luồng

Cách Luồng AI hoạt động

Thu Thập Email và Tệp Đính Kèm.
Thu thập nội dung email và các tệp tải lên làm điểm khởi đầu cho quá trình xử lý.
Truy Xuất và Tổng Hợp Nội Dung Tệp & URL.
Trích xuất nội dung từ các tệp đính kèm và URL được chỉ định để sử dụng làm ngữ cảnh cho các bước xử lý tiếp theo.
Phân Tích và Tổ Chức Dữ Liệu với AI Agent.
Sử dụng AI agent để rà soát, tóm tắt và tổ chức dữ liệu email cùng các tài liệu liên quan, tận dụng lịch sử trò chuyện và thông tin ngữ cảnh.
Tạo Dữ Liệu Đầu Ra Có Cấu Trúc.
Chuyển đổi dữ liệu đã tổ chức thành định dạng có cấu trúc bằng AI, chuẩn bị cho việc xuất dữ liệu.
Xuất Kết Quả sang CSV.
Xuất dữ liệu có cấu trúc dưới dạng tệp CSV, giúp dễ dàng truy cập, phân tích và chia sẻ.

Các prompt được sử dụng trong luồng này

Dưới đây là danh sách đầy đủ tất cả các prompt được sử dụng trong luồng này để đạt được chức năng của nó. Prompt là các hướng dẫn đã được cấp cho mô hình AI để tạo ra các phản hồi hoặc thực hiện các hành động. Chúng hướng dẫn AI trong việc hiểu ý định của người dùng và tạo ra các kết quả đầu ra liên quan.

Các thành phần được sử dụng trong luồng này

Dưới đây là danh sách đầy đủ tất cả các thành phần được sử dụng trong luồng này để đạt được chức năng của nó. Các thành phần là các khối xây dựng của mọi Luồng AI. Chúng cho phép bạn tạo ra các tương tác phức tạp và tự động hóa các tác vụ bằng cách kết nối các chức năng khác nhau. Mỗi thành phần phục vụ một mục đích cụ thể, chẳng hạn như xử lý đầu vào của người dùng, xử lý dữ liệu hoặc tích hợp với các dịch vụ bên ngoài.

ChatInput

Thành phần Chat Input trong FlowHunt khởi tạo tương tác với người dùng bằng cách thu thập tin nhắn từ Playground. Nó là điểm khởi đầu của các flow, cho phép quy trình xử lý cả đầu vào dạng văn bản lẫn tệp tin.

Trình Truy Xuất Tệp

Thành phần Trình Truy Xuất Tệp trong FlowHunt cho phép bạn đưa các tệp vào quy trình làm việc và chuyển đổi chúng thành tài liệu để xử lý thêm. Nó hỗ trợ các chiến lược xử lý nhiều tài liệu và có thể sử dụng OCR trên hình ảnh trong tệp, giúp lý tưởng cho việc trích xuất và chuyển đổi thông tin từ nhiều loại tệp khác nhau.

Thành phần Prompt trong FlowHunt

Tìm hiểu cách thành phần Prompt của FlowHunt cho phép bạn xác định vai trò và hành vi của bot AI, đảm bảo phản hồi phù hợp và cá nhân hóa. Tùy chỉnh prompt và mẫu template để xây dựng luồng chatbot hiệu quả, nhận biết ngữ cảnh.

Tác nhân Gọi Công cụ

Khám phá Tác nhân Gọi Công cụ trong FlowHunt—một thành phần quy trình làm việc nâng cao cho phép các tác nhân AI lựa chọn và sử dụng công cụ bên ngoài một cách thông minh để trả lời các truy vấn phức tạp. Lý tưởng để xây dựng các giải pháp AI thông minh yêu cầu sử dụng công cụ linh hoạt, suy luận lặp lại và tích hợp với nhiều nguồn tài nguyên.

Thành phần Lịch sử Trò chuyện

Thành phần Lịch sử Trò chuyện trong FlowHunt cho phép chatbot ghi nhớ các tin nhắn trước đó, đảm bảo cuộc trò chuyện liền mạch và nâng cao trải nghiệm khách hàng đồng thời tối ưu hóa việc sử dụng bộ nhớ và token.

Urlcontent

LLM Gemini

FlowHunt hỗ trợ hàng chục mô hình AI, bao gồm Google Gemini. Tìm hiểu cách sử dụng Gemini trong công cụ AI và chatbot của bạn, chuyển đổi giữa các mô hình, và kiểm soát các cài đặt nâng cao như tokens và temperature.

Trình tạo Đầu ra Có cấu trúc

Thành phần Trình tạo Đầu ra Có cấu trúc cho phép bạn tạo ra dữ liệu có cấu trúc chính xác từ bất kỳ lời nhắc đầu vào nào bằng mô hình LLM bạn chọn. Định nghĩa chính xác các trường dữ liệu và định dạng đầu ra bạn muốn, đảm bảo các phản hồi nhất quán và đáng tin cậy cho các quy trình AI nâng cao.

Xuất ra CSV

Tạo file CSV dễ dàng trong các quy trình tự động hóa của bạn với thành phần CSV Output. Chuyển đổi dữ liệu có cấu trúc thành định dạng CSV có thể tải về—lý tưởng để xuất kết quả, chia sẻ dữ liệu hoặc tích hợp với các hệ thống bên ngoài.

Mô tả luồng

Mục đích và lợi ích

Quy trình làm việc này được thiết kế để tự động hóa việc trích xuất, cấu trúc và quản lý dữ liệu từ email và các tài liệu liên quan như tệp đính kèm và URL. Nó tận dụng các mô hình ngôn ngữ tiên tiến cùng kỹ thuật xây dựng prompt để xử lý thông tin phi cấu trúc và xuất ra bản tóm tắt có cấu trúc, đặc biệt hữu ích cho các nhiệm vụ như phân loại email, hỗ trợ khách hàng, hoặc trích xuất dữ liệu quy mô lớn từ các kênh giao tiếp.

Tổng Quan

Luồng quy trình kết nối nhiều thành phần xử lý đầu vào người dùng, truy xuất nội dung tệp và URL, xây dựng prompt, xử lý bằng mô hình ngôn ngữ lớn (LLM), lý luận dựa trên agent, và xuất dữ liệu có cấu trúc. Các lợi ích chính bao gồm khả năng mở rộng, tự động hóa, và xử lý các tác vụ trích xuất dữ liệu phức tạp hoặc khối lượng lớn với sự can thiệp thủ công tối thiểu.

Quy Trình Từng Bước

1. Nhập Dữ Liệu Người Dùng và Tệp Đính Kèm

  • Chat Input: Quy trình bắt đầu bằng việc nhận đầu vào của người dùng (email hoặc tin nhắn) và các tệp đính kèm tùy chọn qua giao diện chat.
  • File Retriever: Mọi tệp đính kèm sẽ được xử lý để trích xuất nội dung văn bản, sử dụng các chiến lược như OCR (nếu cần) và giới hạn token đảm bảo hiệu quả.

2. Bổ Sung Ngữ Cảnh

  • URL Retriever: Quy trình cũng có thể truy xuất nội dung từ các URL được chỉ định, phân tích và chia nhỏ thông tin để sử dụng cho các bước tiếp theo. Điều này hữu ích khi email tham chiếu tới tài nguyên ngoài hoặc kho kiến thức.

  • Chat History: Hệ thống lưu lại 5 tin nhắn trò chuyện gần nhất (tối đa 800 token), cung cấp ngữ cảnh giúp hiểu và duy trì mạch hội thoại tốt hơn.

3. Kỹ Thuật Xây Dựng Prompt

  • Prompt Templates: Quy trình sử dụng các mẫu để xây dựng prompt động cho LLM và agent, kết hợp:

    • Nội dung email/tin nhắn
    • Nội dung trích xuất từ tệp
    • Lịch sử trò chuyện để làm ngữ cảnh
    • Hướng dẫn ở cấp hệ thống

    Các prompt này được thiết kế để tối đa hóa khả năng hiểu và cấu trúc thông tin đầu vào của LLM.

4. Điều Phối LLM và Agent

  • Google Gemini LLM: Quy trình sử dụng Gemini 2.5 Flash để xử lý ngôn ngữ chất lượng cao, với nhiệt độ bằng 0 để đảm bảo kết quả nhất quán.

  • Tool Calling Agent: Một agent nâng cao nhận prompt đã tạo, lịch sử trò chuyện và các công cụ (như truy xuất tệp/URL) để:

    • Rà soát và tổ chức dữ liệu email
    • Trích xuất và cấu trúc thông tin liên quan
    • Cung cấp cái nhìn tổng quan dựa trên email và tệp đính kèm
    • Sử dụng kiến thức ngoài thông qua các công cụ nếu cần

    Agent được hướng dẫn bởi thông điệp hệ thống tập trung vào hiệu suất và cấu trúc dữ liệu.

5. Cấu Trúc và Xuất Dữ Liệu

  • Structured Output Generator: Phản hồi của agent cùng ngữ cảnh bổ sung sẽ được chuyển qua prompt và LLM (cũng là Gemini) để tạo đầu ra có cấu trúc. Các trường yêu cầu gồm:

    • User Name: Tên người dùng
    • Email: Địa chỉ email của bệnh nhân
    • Message: Tin nhắn được đề cập trong email
  • CSV Output: Dữ liệu có cấu trúc sau đó được xuất ra tệp CSV, giúp dễ dàng xử lý, phân tích hoặc nhập vào các hệ thống khác.

6. Phản Hồi Người Dùng

  • Chat Output: Quy trình cũng cung cấp tổng quan và câu trả lời của agent dưới dạng phản hồi chat, đảm bảo người dùng nhận được phản hồi ngay lập tức.

Bảng Tổng Kết Thành Phần

Thành phầnVai trò
Chat InputThu thập tin nhắn và tệp đính kèm của người dùng
File RetrieverTrích xuất văn bản từ tài liệu tải lên
URL RetrieverTruy xuất và xử lý nội dung từ các URL chỉ định
Chat HistoryLưu giữ ngữ cảnh các tin nhắn gần đây
Prompt TemplateXây dựng prompt động cho LLM/agent
Gemini LLMXử lý prompt và sinh phản hồi
Tool Calling AgentĐiều phối công cụ và LLM để trích xuất/cấu trúc dữ liệu
Structured Output GeneratorĐịnh dạng thông tin trích xuất thành đối tượng có cấu trúc
CSV OutputXuất dữ liệu có cấu trúc sang định dạng CSV
Chat OutputHiển thị phản hồi của agent trong chat

Ứng Dụng và Lợi Ích

  • Khả Năng Mở Rộng: Tự động hóa công việc lặp lại khi trích xuất và cấu trúc dữ liệu từ email và tài liệu, giảm sức lao động thủ công.
  • Tính Nhất Quán: Sử dụng LLM và mẫu prompt giúp xử lý đồng nhất trên khối lượng dữ liệu lớn.
  • Dễ Mở Rộng: Dễ dàng thích ứng với các loại đầu vào mới (tệp, URL) và định dạng đầu ra (đối tượng có cấu trúc, CSV).
  • Tự Động Hóa: Phù hợp cho hỗ trợ khách hàng, xử lý hồ sơ y tế, hoặc bất kỳ quy trình nào cần dữ liệu có cấu trúc từ nguồn phi cấu trúc.

Vì Sao Quy Trình Này Hữu Ích

Quy trình làm việc này giúp giảm đáng kể thời gian và công sức cần thiết để trích xuất dữ liệu có thể hành động và có cấu trúc từ email và tệp đính kèm. Nó có khả năng mở rộng cao—xử lý nhiều tin nhắn và loại tệp cùng lúc—và tự động hóa một quá trình vốn cần nhiều nhân lực. Nhờ tích hợp các mô hình LLM tiên tiến, agent công cụ và kỹ thuật prompt, quy trình đảm bảo độ chính xác cao và khả năng thích nghi tốt, trở thành công cụ mạnh mẽ cho doanh nghiệp, tổ chức nhằm tối ưu hóa quy trình xử lý thông tin.

Hãy để chúng tôi xây dựng Đội ngũ AI riêng cho bạn

Chúng tôi giúp các công ty như của bạn phát triển chatbot thông minh, Máy chủ MCP, công cụ AI hoặc các loại tự động hóa AI khác để thay thế con người trong các tác vụ lặp đi lặp lại trong tổ chức của bạn.

Tìm hiểu thêm

Trình Tạo Thư AI
Trình Tạo Thư AI

Trình Tạo Thư AI

Dễ dàng tạo các loại thư trang trọng, thân mật hoặc pháp lý phù hợp với nhu cầu của bạn. Quy trình làm việc sử dụng AI này lấy thông tin đầu vào của bạn và tạo ...

4 phút đọc
Tự Động Hóa Phản Hồi Email Outlook Bằng AI
Tự Động Hóa Phản Hồi Email Outlook Bằng AI

Tự Động Hóa Phản Hồi Email Outlook Bằng AI

Tự động hóa phản hồi email chuyên nghiệp trong Outlook bằng một tác nhân AI tận dụng các nguồn tri thức của tổ chức. Email đến được nhận, phân tích và trả lời b...

4 phút đọc
Trợ Lý Gmail AI cho Quản Lý Email
Trợ Lý Gmail AI cho Quản Lý Email

Trợ Lý Gmail AI cho Quản Lý Email

Tối ưu hóa quy trình làm việc Gmail của bạn với trợ lý AI có thể tìm kiếm, tổ chức và quản lý email, tạo và gửi thư mới, cũng như tự động hóa việc quản lý nhãn....

5 phút đọc