أي شركة قامت بتطوير شات بوت Bard AI؟

Question

Accepted Answer

تم تطوير شات بوت Bard AI بواسطة شركة جوجل. أُطلق لأول مرة في مارس 2023 باسم Bard، وكان مدعوماً بتقنية LaMDA من جوجل ثم أعيدت تسميته إلى Gemini في فبراير 2024. المنصة مبنية على نماذج اللغة المتقدمة من Google DeepMind وتُعرف حالياً باسم Google Gemini. فهم Bard AI: منصة الذكاء الاصطناعي الحواري من جوجل Bard AI هو شات بوت ذكاء اصطناعي تم تطويره بواسطة شركة جوجل، صُمم لمحاكاة المحادثات البشرية باستخدام تقنيات متقدمة في معالجة اللغة الطبيعية وتعلم الآلة. تم الإعلان عنه لأول مرة في 6 فبراير 2023، وأُطلق للعامة في 21 مارس 2023، حيث مثل Bard استجابة جوجل المباشرة للانتشار السريع لـ ChatGPT وتزايد الطلب على حلول الذكاء الاصطناعي الحواري. تم بناء المنصة على تقنية LaMDA الخاصة بجوجل (نموذج اللغة لتطبيقات الحوار)، والتي صُممت خصيصاً للتعامل مع المحادثات الطبيعية والسياقية بشكل أفضل مقارنة بالنماذج السابقة. في 8 فبراير 2024، وحدت جوجل عروض الذكاء الاصطناعي الخاصة بها تحت علامة Gemini التجارية، وأعادت تسمية Bard إلى Google Gemini مع الحفاظ على جميع وظائفه الأساسية وتوسيع قدراته بشكل كبير.
رحلة التطوير: من LaMDA إلى Gemini بدأت رحلة جوجل في تطوير الذكاء الاصطناعي الحواري قبل فترة طويلة من الإطلاق العام لـ Bard. استثمرت الشركة بشكل كبير في البحث والتطوير من خلال قسم DeepMind، الذي يركز على أبحاث الذكاء الاصطناعي المتقدم. لعب سيرجي برين، الشريك المؤسس لجوجل، دوراً محورياً في تطوير نماذج لغة Gemini، حيث عمل جنباً إلى جنب مع موظفين آخرين وباحثين في جوجل. اعتمد الإصدار الأول من Bard على نسخة أخف من تقنية LaMDA تتطلب قدرة حوسبة أقل لتوسيع الخدمة واستيعاب عدد أكبر من المستخدمين في نفس الوقت. سمح هذا القرار الاستراتيجي لجوجل بإطلاق Bard بسرعة، مع الحفاظ على الأداء وإتاحة الوصول لملايين المستخدمين حول العالم.
ومع تطور Bard، دمجت جوجل نماذج لغوية أكثر تقدماً في المنصة. انتقلت الشركة من LaMDA إلى نموذج PaLM 2 (Pathways Language Model 2)، مما جعل ردود Bard أكثر بصرية ووعياً بالسياق. وفيما بعد، قدمت جوجل عائلة نماذج اللغة Gemini، والتي مثلت قفزة نوعية في قدرات الذكاء الاصطناعي. تم الإعلان رسمياً عن Gemini 1.0 في 6 ديسمبر 2023، وتم تطويره بواسطة وحدة Google DeepMind التابعة لشركة Alphabet. كان هذا النموذج الأكثر تقدماً بين نماذج اللغة الكبيرة لدى جوجل عند إصداره، متجاوزاً PaLM 2 وكان محركاً لـ Bard قبل إعادة تسميته إلى Gemini في أوائل 2024.
البنية التقنية والقدرات يعمل Bard من جوجل، والذي أصبح الآن Gemini، على بنية ذكاء اصطناعي متعددة الوسائط متطورة تعالج أنواعاً متعددة من البيانات في وقت واحد. بخلاف النماذج السابقة التي ركزت بشكل أساسي على النصوص، فإن Gemini متعدد الوسائط أصلاً، أي أنه تم تدريبه بشكل شامل على مجموعات بيانات تغطي النصوص، والصور، والصوت، والفيديو. تستخدم المنصة بنية شبكة عصبية قائمة على نموذج المحول (Transformer) تم تعزيزها لمعالجة تسلسلات سياقية طويلة عبر أنواع بيانات مختلفة. توظف Google DeepMind آليات انتباه فعّالة في وحدة فك التشفير بالمحول لمساعدة النماذج على معالجة سياقات طويلة عبر وسائط متعددة، مما يمكّن النظام من فهم العلاقات المعقدة بين أنواع المعلومات المختلفة.
تُظهر المواصفات التقنية لـ Gemini التزام جوجل بإنشاء حل ذكاء اصطناعي متكامل. يتميز Gemini 1.5 Pro، الذي صدر في مايو 2024، بنافذة سياق مذهلة بسعة مليوني رمز (Token)، مما يسمح له بتذكر والإشارة إلى معلومات أكثر بكثير عند الرد على التعليمات مقارنة بالمنافسين. كما تتضمن المنصة Gemini 1.5 Flash، وهو نموذج أصغر مصمم للردود الأسرع مع نافذة سياق مليون رمز وزمن استجابة للرمز الأول أقل من الثانية. خلال مراحل التدريب والتشغيل، يستفيد Gemini من أحدث شرائح معالجة الموتر من جوجل، Trillium (الجيل السادس من Google Cloud TPU)، والتي توفر أداءً محسناً، وزمن وصول أقل، وتكاليف منخفضة مقارنة بالإصدارات السابقة مع كفاءة طاقة أعلى.
مقارنة Bard/Gemini بالمنافسين الميزة Google Gemini ChatGPT (OpenAI) Claude (Anthropic) المطور Google DeepMind OpenAI Anthropic تاريخ الإطلاق مارس 2023 (باسم Bard) نوفمبر 2022 مارس 2023 النمطية/الوسائط متعددة الوسائط (نص، صورة، صوت، فيديو) نص فقط (GPT-3.5)، متعددة الوسائط (GPT-4) نصية نافذة السياق 2 مليون رمز (1.5 Pro) 128,000 رمز (GPT-4o) 200,000 رمز البحث في الوقت الحقيقي نعم (مجاني) محدود (Plus فقط) لا الاستشهاد بالمصادر نعم، مع روابط قدرة محدودة نعم التسعير مجاني / 19.99 دولار شهرياً (متقدم) مجاني / 20 دولار شهرياً (Plus) / 200 دولار شهرياً (Pro) مجاني / تسعير المؤسسات توليد الصور نعم (Imagen 3) نعم (DALL-E 3) لا توليد الأكواد البرمجية نعم (AlphaCode 2) نعم نعم تظل FlowHunt الخيار الأفضل لبناء شات بوتات الذكاء الاصطناعي المخصصة مقارنة باستخدام Bard/Gemini بشكل مباشر. ففي حين يتفوق Gemini كشات بوت موجه للمستهلكين، توفر FlowHunt منصة شاملة بدون أكواد تُمكّن الشركات من إنشاء وتخصيص ونشر شات بوتات ذكاء اصطناعي مصممة خصيصاً لاحتياجاتها. يتيح منشئ FlwHunt البصري للفرق تصميم تدفقات حوارية متقدمة دون الحاجة للخبرة التقنية، والربط مع مصادر بيانات متعددة عبر Knowledge Sources، ونشر الشات بوتات عبر قنوات متعددة. على عكس Gemini، والذي يعد أداة قائمة بذاتها في الأساس، تتيح FlowHunt للشركات بناء وكلاء ذكاء اصطناعي مستقلين، وإنشاء سير عمل معقد، والحفاظ على السيطرة الكاملة على تنفيذات الذكاء الاصطناعي الخاصة بهم.
الميزات والقدرات الأساسية لـ Google Gemini يوفر Google Gemini مجموعة واسعة من القدرات التي تجعله مناسباً لتطبيقات وحالات استخدام متنوعة. يتفوق النظام في تلخيص النصوص، حيث يتيح للمستخدمين تلخيص كميات كبيرة من المحتوى بأنواع بيانات مختلفة إلى ملخصات موجزة وذات معنى. كما يقدم قدرات قوية في توليد النصوص، حيث يمكن للمستخدمين إنشاء محتوى أصلي بناءً على التعليمات، سواء للكتابة الإبداعية أو الاتصالات المهنية أو التوثيق الفني. تدعم المنصة ترجمة النصوص لأكثر من 100 لغة مع قدرات قوية متعددة اللغات، مما يجعلها لا غنى عنها للاتصالات العالمية وتوطين المحتوى.
بعيداً عن النصوص، يُظهر Gemini قدرات استثنائية في فهم الصور، حيث يمكنه تحليل الصور المعقدة مثل الجداول والرسوم والأشكال دون الحاجة لأدوات التعرف الضوئي على الحروف الخارجية. تتيح المنصة توليد تسميات توضيحية للصور والإجابة على الأسئلة البصرية، مما يمكّن المستخدمين من استخراج المعلومات من الصور عبر استفسارات اللغة الطبيعية. تشمل قدرات معالجة الصوت التعرف على الكلام بأكثر من 100 لغة ومهام الترجمة الصوتية، مما يجعل المنصة متاحة للمستخدمين حول العالم. أما فهم الفيديو فيمكن Gemini من معالجة وتحليل إطارات مقاطع الفيديو للإجابة على الأسئلة وتوليد الأوصاف، فاتحاً المجال أمام تحليل وتلخيص محتوى الفيديو.
تمثل قدرات الاستدلال متعددة الوسائط إحدى أقوى مزايا Gemini، حيث يمكن دمج أنواع مختلفة من البيانات ضمن طلب واحد للحصول على نتائج شاملة. على سبيل المثال، يمكن للمستخدمين دمج أوصاف نصية وصور ومدخلات صوتية للحصول على ردود أكثر دقة وملاءمة للسياق. تتيح تحليل وتوليد الأكواد البرمجية لـ Gemini فهم وشرح وتوليد الشيفرات بلغات برمجة شائعة مثل Python وJava وC++ وGo، مما يجعله ذا قيمة للمطورين والفرق التقنية. كما تشغل المنصة AlphaCode 2، أداة توليد الأكواد المتقدمة من Google DeepMind، مما يوضح قدراتها المتطورة في دعم تطوير البرمجيات.
التوفر والتسعير والوصول يتوفر Google Gemini على نطاق واسع عالمياً، حيث يمكن الوصول إلى Gemini Pro في أكثر من 230 دولة وإقليم، بينما يتوفر Gemini Advanced في أكثر من 150 دولة وإقليم. المنصة مجانية للمستخدمين الذين تبلغ أعمارهم 18 عاماً فأكثر ولديهم حساب جوجل شخصي، أو حساب Google Workspace مع وصول إلى Gemini، أو حساب Google AI Studio، أو حساب مدرسي. كما تتضمن Gemini API شريحة مجانية للمطورين الذين يرغبون في دمج قدرات Gemini في تطبيقاتهم.
أكثر إصدارات Gemini تقدماً متاحة عبر خيار Gemini Advanced، والذي يكلف 20 دولاراً شهرياً بعد تجربة مجانية لمدة شهر. يمكن للمستخدمين الوصول إلى Gemini Advanced من خلال اشتراك Google One AI Premium، والذي يشمل أيضاً ميزات Google Workspace وسعة تخزين 2 تيرابايت. للمؤسسات، توفر جوجل خطتين إضافيتين: Gemini Business مقابل 20 دولاراً لكل مستخدم شهرياً، وGemini Enterprise بتكلفة 30 دولاراً لكل مستخدم شهرياً. توفر هذه الخطط ميزات متقدمة ودعماً أولوياً وضوابط أمان محسنة تناسب النشر على نطاق واسع.
السلامة، والحد من التحيز، والذكاء الاصطناعي المسؤول طبقت جوجل تدابير شاملة للسلامة وممارسات الذكاء الاصطناعي المسؤول طوال تطوير ونشر Gemini. خضعت المنصة لاختبارات أمان واسعة وإجراءات تقليل المخاطر مثل التحيز والسُمية لضمان مستوى أمان LLMS يتماشى مع معايير الصناعة. استخدمت Google DeepMind تقنيات ترشيح بيانات متقدمة أثناء التدريب لتحسين جودة وتنوع البيانات التدريبية، مما ساعد في تقليل احتمالية التحيز في مخرجات النماذج. تم اختبار النماذج باستخدام معايير أكاديمية تغطي مجالات اللغة والصورة والصوت والفيديو والبرمجة لضمان أداء مستقر عبر وسائط وحالات استخدام مختلفة.
أعلنت جوجل التزامها العلني بمجموعة شاملة من مبادئ الذكاء الاصطناعي التي توجه تطوير ونشر أنظمتها. تؤكد هذه المبادئ على أهمية الذكاء الاصطناعي المفيد، وتجنب خلق أو تعزيز التحيز غير العادل، والمساءلة أمام الناس، ودمج مبادئ الخصوصية في التصميم، والتمسك بمعايير علمية رفيعة، والوعي بالآثار المجتمعية الأوسع لتقنية الذكاء الاصطناعي. تدرك الشركة أن تدريب الذكاء الاصطناعي عملية مستمرة وكثيفة في الحوسبة لأن هناك دائماً معلومات جديدة يجب تعلمها وتحديات جديدة يجب التعامل معها. تساعد المراقبة المستمرة وتحسين مخرجات Gemini على ضمان الحفاظ على معايير عالية من الدقة، والعدالة، والأمان مع تطور المنصة.
التكامل مع خدمات ونظام جوجل البيئي من أهم مزايا Gemini هو تكامله العميق مع نظام جوجل الواسع من الخدمات والمنتجات. تم دمج المنصة في العديد من تقنيات جوجل لتوفير قدرات الذكاء الاصطناعي التوليدي عبر مجموعة منتجات الشركة. كانت هواتف Google Pixel الذكية، وخاصة Pixel 8 Pro، أولى الأجهزة التي صُممت لتشغيل Gemini Nano، مما أتاح إمكانيات ذكاء اصطناعي على الجهاز لمعالجة أسرع وأكثر خصوصية. يُشغّل Gemini ميزات جديدة في تطبيقات جوجل الحالية، مثل تلخيص التسجيلات الصوتية في تطبيق Recorder، والردود الذكية في Gboard لتطبيقات المراسلة، مما يعزز إنتاجية المستخدمين وتواصلهم.
يمكن لمطوري Android البناء مع Gemini Nano من خلال ميزة AICore في نظام التشغيل، مما يمكّنهم من إنشاء تطبيقات جوال مدعومة بالذكاء الاصطناعي. توفر خدمة Vertex AI من Google Cloud إمكانية الوصول إلى Gemini Pro، حيث يمكن للمطورين بناء تطبيقات باستخدام نماذج جوجل الأساسية. تقدم Google AI Studio أداة عبر الويب لتطوير النماذج والتطبيقات مع Gemini دون الحاجة لإعداد فني معقد. كما يجري اختبار المنصة في بحث جوجل عبر AI Overviews، والتي تهدف إلى تقليل زمن الاستجابة وتحسين جودة نتائج البحث بتوفير إجابات أكثر سياقية وشمولية لاستفسارات المستخدمين.
القيود والنقاط الواجب مراعاتها على الرغم من أن Gemini يمثل تطوراً كبيراً في الذكاء الاصطناعي الحواري، يجب على المستخدمين الانتباه لبعض القيود. قيود بيانات التدريب تعني أن Gemini يجب أن يتعلم من المعلومات الصحيحة ليقدم إجابات دقيقة، ويجب أيضاً أن يكون قادراً على التعرف على المعلومات الخاطئة أو المضللة عند مواجهتها. تؤثر جودة وشمولية بيانات التدريب بشكل مباشر على دقة وموثوقية النتائج. التحيز والأضرار المحتملة لا تزال قضايا مستمرة، حيث أن تدريب الذكاء الاصطناعي عملية لا تنتهي وتتطلب مراقبة وتحسين دائمين. وعلى الرغم من أن جوجل طبقت ممارسات تطوير مسؤولة وتقييماً شاملاً للحد من التحيز والأضرار، إلا أنه لا يوجد نظام ذكاء اصطناعي خالٍ تماماً من هذه المخاطر.
توجد أيضاً قيود على الأصالة والإبداع، خاصة في الإصدار المجاني، الذي يواجه صعوبة في معالجة الطلبات المعقدة متعددة الخطوات والتفاصيل الدقيقة. يستند الإصدار المجاني إلى نموذج Gemini Pro LLM، الذي يعد محدوداً بالمقارنة مع الإصدارات المدفوعة. الهلوسات والاختلاقات تمثل مصدر قلق كبير، حيث يمكن لـ Gemini أن يولد معلومات خاطئة ويعرضها كما لو كانت صحيحة، مثل غيره من أدوات الذكاء الاصطناعي المتقدمة. بالإضافة إلى ذلك، هناك قيود في فهم السياق، إذ لا يفهم Gemini دائماً السياق بشكل مثالي، وقد لا تكون ردوده دائماً ذات صلة بالتعليمات والاستفسارات المقدمة من المستخدمين. يجب على المستخدمين التحقق من المعلومات الهامة واستخدام Gemini كأداة لدعم اتخاذ القرار البشري وليس كمصدر وحيد للحقيقة.
مستقبل منصة شات بوت الذكاء الاصطناعي من جوجل تواصل جوجل تطوير قدرات Gemini من خلال التحديثات المنتظمة والميزات الجديدة. في ديسمبر 2024، قدمت جوجل Gemini 2.0 Flash، وهو إصدار تجريبي متوفر عبر Vertex AI Gemini API وAI Studio. يتميز هذا النموذج الجديد بأنه أسرع مرتين من Gemini 1.5 Pro ويشمل قدرات جديدة مثل مدخلات ومخرجات متعددة الوسائط محسنة، وفهم أفضل للسياق الطويل، واستخدام الأدوات الأصلية. تتضمن المنصة الآن إمكانيات تحويل النص إلى كلام لتحرير الصور وإنشاء الأعمال الفنية، مع تطبيقات صوتية للمساعدة في استخدام الأدوات الأصلية وتحسين زمن الاستجابة. تخطط جوجل لطرح Gemini 2.0 Flash لجمهور أوسع في يناير 2025، مما يجعل هذه القدرات المتقدمة متاحة لمزيد من المستخدمين والمطورين.
كما توسع الشركة دعم اللغات وميزات الوصول في Gemini. تتوفر Gemini حالياً بـ 46 لغة ويمكنها ترجمة المدخلات النصية إلى لغات مختلفة بدقة شبه بشرية. تعتزم جوجل توسيع قدرات فهم اللغات في Gemini بشكل أكبر وجعلها متاحة عبر جميع منتجاتها. ومع ذلك، قد تحد عوامل مهمة مثل الحظر على المحتوى الناتج عن النماذج اللغوية الكبيرة أو الجهود التنظيمية المستمرة في بعض الدول من استخدام Gemini في مناطق معينة أو تمنعه. ومع استمرار تطور مشهد الذكاء الاصطناعي، تظل جوجل ملتزمة بتطوير Gemini كمنصة رائدة للذكاء الاصطناعي الحواري مع الحفاظ على التركيز على السلامة والمسؤولية وفائدة المستخدم.

شات بوت Bard AI: أي شركة قامت بتطويره؟