
كيف يتقن o1 Preview من OpenAI التعامل مع المهام الكتابية المعقدة
اكتشف كيف يتفوق o1 Preview من OpenAI على GPT-4 من خلال إتقانه للمهام الكتابية المعقدة عبر التخطيط الداخلي، والإبداع، والالتزام بالقيود، مما يفتح آفاقاً جديدة لل...

يستفيد OpenAI O1 من تعلم التعزيز والتفكير المتسلسل المدمج ليتفوق على GPT4o في مهام RAG المعقدة، رغم التكلفة الأعلى.
أطلقت OpenAI مؤخراً نموذجاً جديداً يسمى OpenAI O1 من سلسلة نماذج O1. التغيير المعماري الرئيسي في هذه النماذج هو القدرة على التفكير قبل الإجابة على استفسار المستخدم. في هذه المدونة، سنتعمق في التغييرات الأساسية في OpenAI O1، والنماذج الجديدة التي تعتمدها هذه السلسلة، وكيف يمكن لهذا النموذج أن يزيد دقة RAG بشكل كبير. سنقارن بين تدفق RAG بسيط باستخدام نموذج OpenAI GPT4o ونموذج OpenAI O1.
يعتمد نموذج O1 على خوارزميات تعلم التعزيز واسعة النطاق أثناء عملية تدريبه. يتيح ذلك للنموذج تطوير “سلسلة أفكار” قوية، مما يسمح له بالتفكير بشكل أعمق وأكثر استراتيجية في حل المشكلات. ومن خلال تحسين مسارات الاستدلال باستمرار عبر تعلم التعزيز، يعزز النموذج قدرته على تحليل المهام المعقدة وحلها بكفاءة عالية.

في السابق، كان التفكير المتسلسل آلية فعّالة في هندسة برمجة الإرشادات لجعل نموذج اللغة “يفكر” ذاتياً ويجيب على الأسئلة المعقدة عبر خطة خطوة بخطوة. مع نماذج O1، أصبحت هذه الخطوة مدمجة افتراضياً في النموذج أثناء وقت الاستدلال، مما يجعلها مفيدة في حل مشكلات الرياضيات والبرمجة.
تم تدريب O1 باستخدام تعلم التعزيز ليقوم بـ"التفكير" قبل الرد عبر سلسلة أفكار خاصة. كلما زاد وقت التفكير، زادت كفاءته في مهام الاستدلال. هذا يفتح بعداً جديداً للتوسّع. لم نعد مقيدين بالتدريب المسبق. يمكننا الآن توسيع حسابات الاستدلال أيضاً. pic.twitter.com/niqRO9hhg1
— Noam Brown (@polynoamial) 12 سبتمبر 2024
في تقييمات موسعة، أظهر نموذج O1 أداءً مذهلاً عبر معايير متعددة:
لاختبار دقة الأداء بين OpenAI O1 وGPT4o، أنشأنا تدفقين متطابقين مع اختلاف النموذج المستخدم فقط. سنقارن قدرة النماذج على الإجابة عن الأسئلة باستخدام مصدرين تمت فهرستهما حول التقرير الفني لـ OpenAI O1.
أولاً، سنبني تدفق RAG بسيط في FlowHunt. يتكوّن من إدخال محادثة، مسترجع مستندات (يسترجع الوثائق الملائمة)، إرشاد، مولد، وإخراج المحادثة. تتم إضافة مكون OpenAI LLM لتحديد النموذج (وإلا يُستخدم GPT4o افتراضياً).
إليكم استجابة GPT4o:

وهذه نتيجة OpenAI O1:

كما تلاحظ، استخلص OpenAI O1 المزيد من المزايا المعمارية من المقال نفسه—6 نقاط مقابل 4 فقط. بالإضافة إلى ذلك، يقوم O1 باستنتاجات منطقية من كل نقطة، مضيفاً رؤى أعمق حول فائدة التغيير المعماري.
من خلال تجاربنا، سيكلّف نموذج O1 أكثر مقابل دقة أعلى. يحتوي النموذج الجديد على 3 أنواع من الرموز: Prompt Token، Completion Token، وReason Token (نوع تم إضافته حديثاً)، مما يجعله نموذجاً أكثر تكلفة على الأرجح. في معظم الحالات، يقدم OpenAI O1 إجابات تبدو أكثر فائدة إذا كانت مستندة للحقيقة. ومع ذلك، هناك بعض الحالات التي يتفوق فيها GPT4o على OpenAI O1—فبعض المهام ببساطة لا تحتاج إلى استدلال.

ياشا مطور برمجيات موهوب متخصص في بايثون وجافا وتعلم الآلة. يكتب ياشا مقالات تقنية عن الذكاء الاصطناعي، وهندسة البرومبت، وتطوير روبوتات الدردشة.

جرّب FlowHunt للاستفادة من أحدث نماذج LLM مثل OpenAI O1 وGPT4o لتحقيق استدلال واسترجاع معزز فائق.

اكتشف كيف يتفوق o1 Preview من OpenAI على GPT-4 من خلال إتقانه للمهام الكتابية المعقدة عبر التخطيط الداخلي، والإبداع، والالتزام بالقيود، مما يفتح آفاقاً جديدة لل...

يمثل GPT-4.1 من OpenAI قفزة كبيرة في أداء الذكاء الاصطناعي. تحلل هذه المقالة نقاط قوته وحدوده عبر خمس مهام أساسية للذكاء الاصطناعي—توليد المحتوى، العمليات الحسا...

استكشف تاريخ الإصدار الرسمي لـ GPT-5 من OpenAI، وكيف يبني على نماذج o1 وGPT-4o، وماذا تعني الجيل القادم من نماذج الذكاء الاصطناعي للمطورين والشركات....
الموافقة على ملفات تعريف الارتباط
نستخدم ملفات تعريف الارتباط لتعزيز تجربة التصفح وتحليل حركة المرور لدينا. See our privacy policy.