وصف التدفق
الغرض والفوائد
تم تصميم سير العمل هذا، الذي يحمل عنوان “مستخرج بيانات الفواتير OCR”، لأتمتة عملية استخراج المعلومات الأساسية من صور الفواتير. يعتمد على تقنية التعرف الضوئي على الحروف (OCR) ونماذج اللغة لعرض تفاصيل الفاتورة الرئيسية في كل من جدول ماركداون سهل القراءة وملف CSV قابل للتصدير. هذه الأتمتة مفيدة بشكل خاص للشركات التي تتعامل مع كميات كبيرة من الفواتير، حيث تقضي على الإدخال اليدوي للبيانات، وتقلل الأخطاء، وتزيد من كفاءة العمليات.
نظرة عامة على سير العمل
عند تفاعل المستخدم مع واجهة الدردشة، تحدث سلسلة الإجراءات التالية:
بدء تشغيل الدردشة والترحيب
- بمجرد فتح الدردشة، يتم تفعيل رسالة ترحيبية. تقدم هذه الرسالة للمستخدم هدف الدردشة—استخراج بيانات الفاتورة من الصور المرفوعة.
رفع صورة الفاتورة
- يُطلب من المستخدم رفع صورة فاتورة. تم إعداد واجهة الدردشة لقبول ملفات الصور كمدخلات.
استخراج البيانات من خلال مطالبة مُهيكلة
بمجرد رفع الصورة، يقوم سير العمل بإنشاء مطالبة منظمة لنموذج الذكاء الاصطناعي. توجه هذه المطالبة الذكاء الاصطناعي لاستخراج التفاصيل التالية من الفاتورة:
- رقم الفاتورة
- نوع الفاتورة
- لغة الفاتورة
- العناصر المدرجة في الفاتورة
- سعر كل عنصر
- المبلغ الإجمالي
تطلب المطالبة تحديدًا من الذكاء الاصطناعي إخراج المعلومات المستخرجة في تنسيق جدول ماركداون، بصف واحد لكل عنصر في الفاتورة.
OCR بالذكاء الاصطناعي واستخراج المعلومات
- يرسل سير العمل المطالبة والصورة المرفوعة إلى عقدة التوليد (غالبًا مدعومة بنموذج LLM متعدد الوسائط أو ذكاء اصطناعي يدعم OCR). يعالج النموذج الصورة، ويستخرج التفاصيل ذات الصلة، ويهيكل النتائج كما هو مطلوب.
عرض وتصدير النتائج
- يتم عرض جدول الماركداون الذي يحتوي على تفاصيل الفاتورة المستخرجة مباشرة في واجهة الدردشة للمراجعة الفورية.
- في نفس الوقت، يستخرج سير العمل حقول بيانات منظمة مثل اسم الشركة، رقم ضريبة القيمة المضافة، وصف الخدمة، والمبلغ المفوتر، ويولد ملف CSV. يكون هذا الملف متاحًا للتنزيل، مما يسهل دمج البيانات في أنظمة المحاسبة أو تخطيط الموارد المؤسسية.
تفصيل الخطوات
الخطوة | المكون | الوظيفة |
---|
1 | مشغل فتح الدردشة | يكتشف متى يفتح المستخدم الدردشة. |
2 | أداة الرسائل | يرسل رسالة ترحيب وتعليمات للمستخدم. |
3 | مدخل الدردشة | يقبل مدخلات المستخدم، وخاصة ملف صورة الفاتورة. |
4 | قالب المطالبة | يُعد مطالبة استخراج مفصلة لنموذج الذكاء الاصطناعي، مخصصة لبيانات الفواتير. |
5 | المولد | ينفذ OCR واستخراج البيانات من صورة الفاتورة بناءً على المطالبة المُعدة. |
6 | مخرج الدردشة | يعرض المعلومات المستخرجة في جدول ماركداون داخل الدردشة. |
7 | المولد المنظم | يستخرج بيانات منظمة إضافية لتصديرها كملف CSV (اسم الشركة، رقم الضريبة، الخدمة، المبلغ). |
8 | مخرج CSV | يُنشئ ويوفر ملف CSV قابل للتنزيل من البيانات المنظمة. |
الفوائد وحالات الاستخدام
- القابلية للتوسع: يؤتمت المهمة المتكررة لقراءة وتسجيل بيانات الفواتير، مما يسمح بمعالجة كميات كبيرة من الفواتير بأقل تدخل بشري.
- الدقة: يقلل من أخطاء الإدخال اليدوي للبيانات ويضمن استخراج الحقول المطلوبة بشكل متسق.
- التكامل: يتيح ملف CSV الناتج التكامل السلس مع برامج المحاسبة أو أنظمة تخطيط الموارد أو قواعد البيانات.
- سهولة الاستخدام: تجعل واجهة الدردشة العملية في متناول المستخدمين غير التقنيين، مع تعليمات واضحة وتغذية راجعة فورية.
مثال على الناتج
بعد معالجة صورة الفاتورة، يتلقى المستخدم جدولاً مماثلاً لما يلي في الدردشة:
رقم الفاتورة | النوع | اللغة | وصف العنصر | سعر كل عنصر | المبلغ الإجمالي |
---|
12345 | مبيعات | إنجليزي | القطعة A | $10 | $100 |
12345 | مبيعات | إنجليزي | القطعة B | $20 | $40 |
بالإضافة إلى ذلك، يمكن للمستخدم تنزيل ملف CSV يحتوي على حقول منظمة مثل:
- اسم الشركة
- رقم ضريبة القيمة المضافة
- وصف الخدمة
- المبلغ
لماذا هذا سير العمل مفيد
يقوم هذا سير العمل بتبسيط عملية كانت تقليديًا يدوية وعرضة للأخطاء. من خلال أتمتة استخراج وتنظيم بيانات الفواتير، يمكن للشركات توفير الوقت، تقليل التكاليف، والتركيز على أنشطة ذات قيمة أعلى. يضمن الإخراج المزدوج (جدول الدردشة وملف CSV) وضوحًا فوريًا وقابلية استخدام البيانات على المدى الطويل، مما يجعل الحل عمليًا للفرق من جميع الأحجام.