التجزئة الدلالية
التجزئة الدلالية هي تقنية في رؤية الحاسوب تقوم بتقسيم الصور إلى عدة مقاطع، مع إعطاء كل بكسل تسمية فئة تمثل كائنًا أو منطقة. تمكّن من فهم تفصيلي لتطبيقات مثل الق...
تقوم تجزئة الكائنات الفردية باكتشاف وتجزئة كل كائن في الصورة على مستوى البكسل، مما يمكّن من التعرف الدقيق على الكائنات لتطبيقات الذكاء الاصطناعي المتقدمة.
تتضمن تجزئة الكائنات الفردية اكتشاف وتحديد كل كائن مميز يظهر في الصورة. بخلاف اكتشاف الكائنات التقليدي الذي يوفر مربعات احتواء حول الكائنات، فإن تجزئة الكائنات الفردية تذهب إلى خطوة أبعد من خلال تحديد الموقع الدقيق لكل كائن بصورة بكسلية، مما ينتج عنه فهم أكثر دقة وتفصيلاً لمحتوى الصورة.
تعد تجزئة الكائنات الفردية ضرورية في الحالات التي يكون من المهم فيها ليس فقط اكتشاف الكائنات، بل أيضاً التمييز بين عدة أفراد من نفس الفئة وفهم أشكالهم ومواقعهم الدقيقة داخل الصورة.
لفهم تجزئة الكائنات الفردية بشكل كامل، من المفيد مقارنتها مع أنواع أخرى من مهام تقسيم الصور: التجزئة الدلالية والتجزئة البانورامية.
تشمل التجزئة الدلالية تصنيف كل بكسل في الصورة وفقاً لمجموعة من الفئات أو التصنيفات المحددة مسبقاً. جميع البكسلات التي تنتمي إلى فئة معينة (مثل “سيارة”، “شخص”، “شجرة”) تُصنف وفقاً لذلك دون تمييز بين الكائنات المنفصلة من نفس الفئة.
أما تجزئة الكائنات الفردية فتصنّف كل بكسل وتفرق أيضاً بين الكائنات المنفصلة من نفس الفئة. إذا كان هناك عدة سيارات في الصورة، ستحدد تجزئة الكائنات الفردية كل سيارة بشكل منفصل وتمنح معرفات فريدة لكل واحدة. هذا أمر بالغ الأهمية في التطبيقات التي تتطلب التعرف على الكائنات الفردية وتتبعها.
تجمع التجزئة البانورامية بين أهداف التجزئة الدلالية وتجزئة الكائنات الفردية. فهي تقدم فهماً كاملاً للمشهد من خلال تعيين تسمية دلالية ومعرف كائن لكل بكسل في الصورة. تتعامل مع فئات “الكائنات” (الأشياء القابلة للعد مثل الأشخاص والسيارات) وفئات “الأشياء” (المناطق غير الواضحة مثل السماء أو الطريق أو العشب). تركز تجزئة الكائنات الفردية بشكل أساسي على “الكائنات”، حيث تكتشف وتجزئ كل كائن فردي.
عادةً ما تستخدم خوارزميات تجزئة الكائنات الفردية تقنيات التعلم العميق، وخصوصاً الشبكات العصبية الالتفافية (CNNs)، لتحليل الصور وتوليد أقنعة تجزئة لكل كائن فردي.
يعد Mask R-CNN من أكثر البنى المستخدمة لتجزئة الكائنات الفردية. فهو يضيف فرعاً لتنبؤ أقنعة التجزئة على كل منطقة اهتمام (RoI) بشكل متوازٍ مع فرع التصنيف وتحديد الموقع في نموذج Faster R-CNN.
كيف يعمل Mask R-CNN:
توفر تجزئة الكائنات الفردية إمكانيات اكتشاف وتجزئة تفصيلية للكائنات لمهام معقدة في العديد من الصناعات.
رغم أن تجزئة الكائنات الفردية مهمة في رؤية الحاسوب، إلا أنها تلعب دوراً كبيراً في أتمتة الذكاء الاصطناعي من خلال توفير فهم بصري مفصل يمكّن الأنظمة المؤتمتة من التفاعل بذكاء مع العالم المادي.
رغم أن الدردشة الآلية تعتمد أساساً على النص، فإن دمج تجزئة الكائنات الفردية يوسع قدراتها من خلال الواجهات البصرية.
تشهد تجزئة الكائنات الفردية تطوراً سريعاً بفضل التقدم في التعلم العميق وتقنيات الحوسبة.
تعزز تجزئة الكائنات الفردية قدرة أنظمة الذكاء الاصطناعي على التفاعل مع العالم، مما يقود التقدم في مجالات مثل التصوير الطبي والمركبات الذاتية القيادة والروبوتات. ومع تطور التقنية، ستصبح تجزئة الكائنات الفردية أكثر مركزية في حلول الذكاء الاصطناعي.
تعد تجزئة الكائنات الفردية مهمة أساسية في رؤية الحاسوب تشمل اكتشاف وتصنيف وتجزئة كل كائن فردي داخل الصورة. فهي تجمع بين اكتشاف الكائنات والتجزئة الدلالية لتوفير رؤى تفصيلية. من المساهمات البحثية المهمة:
تعلم التجزئة البانورامية من حدود الكائنات الفردية
قدم هذا البحث شبكة عصبية التفافية بالكامل تتعلم تجزئة الكائنات الفردية من خلال التجزئة الدلالية وحدود الكائنات (حدود الأشياء). تؤدي حدود الكائنات الفردية والتجزئة الدلالية إلى تجزئة ذات وعي بالحدود. ثم ينتج عن وضع العلامات على المكونات المتصلة تجزئة الكائنات الفردية. تم التقييم على مجموعة بيانات CityScapes مع دراسات متعددة.
تجميع تجزئة الكائنات الفردية والدلالية من أجل التجزئة البانورامية
يصف هذا البحث حلاً لمهمة تجزئة البانوراما في COCO 2019 من خلال إجراء التجزئة الفردية والدلالية بشكل منفصل ثم دمجهما. تم تحسين الأداء باستخدام نماذج Mask R-CNN المتخصصة لموازنة البيانات، ونموذج HTC لأفضل تجزئة فردية. عززت استراتيجيات التجميع النتائج، وحققت درجة PQ بلغت 47.1 على بيانات اختبار COCO البانورامية.
اقرأ المزيد
Insight Any Instance: تجزئة كائنات فردية قابلة للتحفيز لصور الاستشعار عن بعد
يتناول هذا البحث التحديات في تجزئة الكائنات الفردية في الاستشعار عن بعد (عدم التوازن بين المقدمة والخلفية، الكائنات الصغيرة) من خلال اقتراح نموذج تحفيز جديد. تساعد وحدات التحفيز المحلية والعالمية على نمذجة السياق، مما يجعل النماذج أكثر قابلية للتحفيز ويحسن أداء التجزئة.
اقرأ المزيد
تجزئة الكائنات الفردية هي تقنية في رؤية الحاسوب تقوم باكتشاف وتصنيف وتجزئة كل كائن فردي في الصورة على مستوى البكسل، مما يوفر معلومات أكثر تفصيلاً من اكتشاف الكائنات القياسي أو التجزئة الدلالية.
التجزئة الدلالية تقوم بتعيين تسمية فئة لكل بكسل لكنها لا تميز بين الكائنات المنفصلة من نفس الفئة. أما تجزئة الكائنات الفردية فتصنّف كل بكسل وتفرق أيضاً بين الكائنات الفردية المنفصلة من نفس الفئة.
تستخدم تجزئة الكائنات الفردية في التصوير الطبي (مثل اكتشاف الأورام)، القيادة الذاتية (التعرف على الكائنات وتتبعها)، الروبوتات (مناولة الكائنات)، صور الأقمار الصناعية (التخطيط الحضري)، التصنيع (مراقبة الجودة)، الواقع المعزز، والمراقبة بالفيديو.
تشمل النماذج الشائعة Mask R-CNN وYOLACT وSOLO وSOLOv2 وBlendMask، حيث يستخدم كل منها تقنيات التعلم العميق لتوليد أقنعة تجزئة دقيقة للكائنات الفردية.
من خلال توفير حدود دقيقة للكائنات، تتيح تجزئة الكائنات الفردية لأنظمة الذكاء الاصطناعي التفاعل بذكاء مع العالم المادي — مما يمكّن من تنفيذ مهام مثل الالتقاط الروبوتي، والملاحة في الزمن الحقيقي، والفحص الآلي، وتحسين قدرات الدردشة الآلية بفهم بصري.
اكتشف كيف يمكن لأدوات الذكاء الاصطناعي من FlowHunt مساعدتك على الاستفادة من تجزئة الكائنات الفردية لأتمتة متقدمة، واكتشاف تفصيلي للكائنات، واتخاذ قرارات أكثر ذكاءً.
التجزئة الدلالية هي تقنية في رؤية الحاسوب تقوم بتقسيم الصور إلى عدة مقاطع، مع إعطاء كل بكسل تسمية فئة تمثل كائنًا أو منطقة. تمكّن من فهم تفصيلي لتطبيقات مثل الق...
يحدد اكتشاف الشذوذ في الصور الأنماط التي تنحرف عن المألوف، وهو أمر بالغ الأهمية لتطبيقات مثل الفحص الصناعي والتصوير الطبي. تعرف على الأساليب غير الخاضعة للإشراف...
المُصنّف في الذكاء الاصطناعي هو خوارزمية تعلم آلي تقوم بإسناد تسميات الفئات إلى البيانات المدخلة، حيث تصنّف المعلومات في فئات محددة مسبقًا بناءً على أنماط مكتسب...