Mô tả luồng
Mục đích và lợi ích
Quy trình này, có tiêu đề “Trình trích xuất dữ liệu hóa đơn OCR”, được thiết kế để tự động hóa việc trích xuất các thông tin thiết yếu từ hình ảnh hóa đơn. Nó tận dụng công nghệ OCR (Nhận dạng Ký tự Quang học) và các mô hình ngôn ngữ để trình bày các chi tiết quan trọng của hóa đơn dưới dạng bảng markdown dễ đọc và tệp CSV có thể xuất ra. Tự động hóa này đặc biệt hữu ích với các doanh nghiệp xử lý số lượng lớn hóa đơn, bởi nó loại bỏ việc nhập dữ liệu thủ công, giảm lỗi và nâng cao hiệu suất vận hành.
Tổng quan quy trình
Khi người dùng tương tác với giao diện chatbot, chuỗi hành động sau sẽ diễn ra:
Khởi tạo Chatbot & Chào mừng
- Ngay khi chat được mở, quy trình sẽ gửi một tin nhắn chào mừng. Tin nhắn này giới thiệu mục đích của chatbot—trích xuất dữ liệu hóa đơn từ hình ảnh tải lên.
Tải lên hình ảnh hóa đơn
- Người dùng được nhắc tải lên một hình ảnh hóa đơn. Giao diện chat được thiết lập để nhận tệp hình ảnh làm đầu vào.
Trích xuất dữ liệu thông qua prompt
Khi hình ảnh được tải lên, quy trình sẽ tạo một prompt có cấu trúc cho mô hình AI. Prompt này hướng dẫn AI trích xuất các chi tiết sau từ hóa đơn:
- Số hóa đơn
- Loại hóa đơn
- Ngôn ngữ hóa đơn
- Các mặt hàng trong hóa đơn
- Giá cho từng mặt hàng
- Tổng số tiền
Prompt yêu cầu AI xuất thông tin đã trích xuất dưới dạng bảng markdown, mỗi mặt hàng một dòng.
OCR và Trích xuất thông tin bằng AI
- Quy trình gửi cả prompt và hình ảnh tải lên đến một nút generator (có thể sử dụng LLM đa phương thức hoặc AI có khả năng OCR). Mô hình xử lý hình ảnh, trích xuất các chi tiết liên quan và định dạng kết quả như yêu cầu.
Hiển thị và xuất kết quả
- Bảng markdown chứa các chi tiết hóa đơn đã trích xuất được hiển thị trực tiếp trong giao diện chat để người dùng xem ngay.
- Đồng thời, quy trình cũng trích xuất thêm các trường dữ liệu có cấu trúc như tên công ty, mã số VAT, mô tả dịch vụ và số tiền, và tạo tệp CSV. Tệp này có thể tải về dễ dàng, thuận tiện tích hợp vào hệ thống kế toán hoặc ERP.
Phân tích từng bước
Bước | Thành phần | Chức năng |
---|
1 | Chat Opened Trigger | Phát hiện khi người dùng mở chat. |
2 | Message Widget | Gửi tin nhắn chào mừng và hướng dẫn cho người dùng. |
3 | Chat Input | Nhận đầu vào từ người dùng, đặc biệt là tệp hình ảnh hóa đơn. |
4 | Prompt Template | Chuẩn bị prompt chi tiết cho mô hình AI, phù hợp với dữ liệu hóa đơn. |
5 | Generator | Thực hiện OCR và trích xuất dữ liệu từ hình ảnh hóa đơn dựa trên prompt đã chuẩn bị. |
6 | Chat Output | Trình bày thông tin trích xuất được dưới dạng bảng markdown trong chat. |
7 | Structured Generator | Trích xuất thêm dữ liệu có cấu trúc để xuất ra CSV (tên công ty, mã số VAT, dịch vụ, số tiền). |
8 | CSV Output | Tạo và cung cấp tệp CSV có thể tải về từ dữ liệu có cấu trúc. |
Lợi ích và các trường hợp ứng dụng
- Khả năng mở rộng: Tự động hóa tác vụ lặp lại là đọc và nhập liệu hóa đơn, cho phép xử lý lượng lớn hóa đơn với ít sự can thiệp của con người.
- Độ chính xác: Giảm lỗi nhập liệu thủ công và đảm bảo trích xuất đúng các trường thông tin cần thiết.
- Tích hợp: Tệp CSV đầu ra giúp tích hợp dễ dàng với phần mềm kế toán, hệ thống ERP hoặc cơ sở dữ liệu.
- Thân thiện người dùng: Giao diện chat giúp quy trình trở nên dễ tiếp cận cho cả người không chuyên, với hướng dẫn rõ ràng và phản hồi ngay lập tức.
Ví dụ kết quả đầu ra
Sau khi xử lý hình ảnh hóa đơn, người dùng nhận được một bảng tương tự sau trong chat:
Số hóa đơn | Loại | Ngôn ngữ | Mô tả mặt hàng | Giá mỗi mặt hàng | Tổng số tiền |
---|
12345 | Bán hàng | Tiếng Anh | Widget A | $10 | $100 |
12345 | Bán hàng | Tiếng Anh | Widget B | $20 | $40 |
Ngoài ra, người dùng có thể tải về tệp CSV chứa các trường có cấu trúc như:
- Tên công ty
- Mã số thuế VAT
- Mô tả dịch vụ
- Số tiền
Tại sao quy trình này hữu ích
Quy trình này giúp đơn giản hóa một công việc vốn thủ công và dễ xảy ra sai sót. Bằng cách tự động hóa việc trích xuất và tổ chức dữ liệu hóa đơn, doanh nghiệp có thể tiết kiệm thời gian, giảm chi phí và tập trung nguồn lực cho các hoạt động giá trị cao hơn. Kết quả đầu ra kép (bảng chat và tệp CSV) đảm bảo vừa có thể xem ngay vừa dễ dàng sử dụng lâu dài, phù hợp cho mọi quy mô đội nhóm.