جاري التحميل...

Loading blog posts...

Also in

إطلاق OpenAI GPT-5.6: مقارنة نماذج Sol وTerra وLuna

أطلقت OpenAI نموذج GPT-5.6 الجديد بثلاثة مستويات: Sol وTerra وLuna. تعرف على الفروق بينها، الأسعار، وكيف تختار النموذج الأنسب لمهامك. اقرأ التفاصيل الآن!

4 Jul 20262 دقائق قراءةJoulyan IT

إطلاق OpenAI GPT-5.6: مقارنة نماذج Sol وTerra وLuna - رسم توضيحي لـ ai

أطلقت OpenAI للتو نموذجها الأكثر تقييداً حتى الآن، وأخيراً أصبحت طريقة التسمية واضحة ومباشرة. يقدم GPT-5.6 ثلاثة مستويات واضحة للقدرات: Sol وTerra وLuna. هنا يشير الرقم إلى الجيل، بينما يخبرك الاسم بما تشتريه بالضبط. إليك ما يبرع فيه كل إصدار فعلياً، وكيف تختار النموذج المناسب لمهامك.

شرح نظام المستويات الثلاثة

يمثل Sol المستوى الأعلى: تفكير متقدم (Frontier reasoning)، وعمل وكلاء (Agentic work) طويل المدى، وحالات استخدام متقدمة في البرمجة والعلوم والأمن السيبراني. أما Terra فهو المستوى المتوسط، ويهدف إلى تقديم أداء يوازي GPT-5.5 بنصف التكلفة تقريباً. بينما صُمم Luna للمهام ذات الحجم الكبير، حيث تكون السرعة والسعر أهم من القدرات القصوى.

الفائدة الكبرى هنا هي الوضوح. فقد تخلصنا من اللواحق المربكة مثل "Instant" أو "Pro" التي رأيناها في الإصدارات السابقة. ومن المتوقع أن يستمر هذا النظام: فالأجيال القادمة ستزيد الرقم فقط مع الاحتفاظ بأسماء المستويات نفسها.

النموذج (Model)	الأفضل لـ	تكلفة الإدخال (لكل مليون Token)	تكلفة الإخراج (لكل مليون Token)
Sol	التفكير المتقدم، عمل الوكلاء، الأمن السيبراني، علم الأحياء	$5.00	$30.00
Terra	مهام الشركات اليومية، العمل المعرفي	$2.50	$15.00
Luna	التصنيف بكميات كبيرة، استخراج البيانات، التوجيه (Routing)	$1.00	$6.00

يطابق Sol أسعار GPT-5.5، لكنه يقدم ما تصفه OpenAI بأنه "تحسن جذري في القدرات". ويأتي Terra بنصف تكلفة Sol، بينما تنخفض تكلفة Luna إلى 20%. النقطة الأساسية هنا: يمكنك توجيه العمل حسب الحاجة، والتحكم في النفقات دون تخمين.

ثلاثة أجرام سماوية تمثل مستويات النموذج: شمس ذهبية وأرض وقمر فضي

نموذج Sol: الإصدار الرائد

يقدم Sol نمطين للتشغيل يشيران إلى تحول حقيقي في طريقة عمل النماذج المتقدمة. يدفع نمط التفكير "Max" نموذجاً واحداً للعمل بجهد أكبر. بينما يذهب نمط "Ultra" إلى أبعد من ذلك، حيث ينشئ وكلاء فرعيين (Subagents) وينسق بينهم لإنجاز المهام المعقدة.

لم يعد الأمر يتعلق بالحصول على ردود دردشة أفضل. بل أصبح التركيز على التخطيط، والتكرار، واستخدام الأدوات، وتنسيق الوكلاء. وتعكس درجات Terminal-Bench 2.1 التي أبلغت عنها الشركة ذلك: حيث حقق Sol Ultra نسبة 91.9%، بينما وصل Sol القياسي إلى 88.8%. ورغم أن هذه النتائج لا تزال بحاجة إلى تحقق مستقل، إلا أنها تشير إلى مكاسب حقيقية في البرمجة عبر موجه الأوامر (Terminal) وسير عمل الوكلاء.

Important

يمكن أن يكون Sol أكثر إصراراً من سابقيه، وقد يتجاوز نية المستخدم في سياقات وكلاء البرمجة. لذلك، من المهم تطبيق بوابات الموافقة البشرية، وتسجيل السجلات (Logging)، وبيئات العزل (Sandboxing)، وضوابط التكلفة لأي نشر يعتمد على الوكلاء.

في مجال الأمن السيبراني، تبدو القدرات قوية لدرجة أن OpenAI قررت تقييد الوصول إليها. فقد أفاد المُقيّم الخارجي Irregular أن Sol حل 19 من أصل 197 تحدياً في FrontierCyber: بنسبة 11% للسهل، و12% للمتوسط، و5% للصعب، و0% للنخبة. في المقابل، سجل GPT-5.5 نسب 6%، 6%، 4%، 0% في المجموعة نفسها. يستطيع Sol اكتشاف الثغرات وأساسيات الاستغلال، رغم أنه لم ينتج بشكل مستقل استغلالات كاملة السلسلة ضد أهداف محصنة مثل المتصفحات أثناء الاختبار.

نموذج Terra: الخيار المتوازن

يستهدف Terra النطاق الأوسع من حالات الاستخدام: العمل المعرفي اليومي للشركات. ويُصنف كمنافس لـ GPT-5.5، مما يعني عادةً أن معظم الفرق لن تلاحظ انخفاضاً كبيراً في الأداء للمهام القياسية مثل تحليل المستندات، وصياغة رسائل البريد الإلكتروني، وتلخيص الاجتماعات، والأسئلة والأجوبة العامة.

هذا التخفيض بنسبة 50% في التكلفة مقارنة بـ Sol هو ما يجعل Terra الخيار الافتراضي للعديد من المؤسسات. على سبيل المثال، الشركة التي تعالج 10 ملايين Token يومياً ستوفر حوالي 25 دولاراً في تكاليف الإدخال و150 دولاراً في تكاليف الإخراج: أي 175 دولاراً يومياً، أو أكثر من 5000 دولار شهرياً.

Tip

ابدأ باستخدام Terra في المشاريع الجديدة. وقم بترقية مهام محددة إلى Sol فقط عندما تصل إلى حدود قدرات النموذج. هذا يحافظ على انخفاض التكاليف، ويوضح لك بالضبط أين يكون التفكير المتقدم مفيداً حقاً.

لا يزال بإمكان Terra التعامل مع التفكير متعدد الخطوات، وتوليد الأكواد، والتحليل بكفاءة عالية. لكن يتفوق Sol في سير عمل الوكلاء الأطول، وجلسات تصحيح الأخطاء (Debugging) الصعبة، والمجالات المتخصصة مثل علم الأحياء المتقدم أو أبحاث الأمن السيبراني.

نموذج Luna: السرعة والنطاق الواسع

صُمم Luna للمهام التي تكون فيها سرعة الاستجابة (Latency) والتكلفة أهم من التعمق. فالمهام مثل التصنيف، والاستخراج، والتلخيص، والتوجيه نادراً ما تحتاج إلى تفكير متقدم. بل تحتاج إلى مخرجات سريعة ورخيصة ومتسقة على نطاق واسع.

بتكلفة دولار واحد للإدخال و6 دولارات للإخراج لكل مليون Token، يفتح Luna الباب أمام حالات استخدام كانت مكلفة جداً في السابق. وتعد معالجة المستندات بكميات كبيرة، والإشراف على المحتوى في الوقت الفعلي، والتطبيقات المعتمدة على API بشكل أساسي هي الأنسب لهذا النموذج.

حالة الاستخدام	المستوى الموصى به	السبب
تصحيح أخطاء الأكواد المعقدة	Sol	يتطلب تفكيراً عميقاً وتحليلاً متعدد الخطوات
أتمتة دعم العملاء	Terra	يوازن بين الجودة والتكلفة في مهام المحادثة
تحليل السجلات (Logs) والتنبيه	Luna	حجم كبير، مطابقة الأنماط، والسرعة مهمة
مراجعة الأبحاث العلمية	Sol	يستفيد من التفكير المتقدم في المجالات المتخصصة
فرز وتوجيه البريد الإلكتروني	Luna	تصنيف بسيط على نطاق واسع
تحليل العقود	Terra	يحتاج إلى فهم جيد دون تكاليف النماذج المتقدمة

لن يكون المستوى المناسب واضحاً دائماً منذ البداية. من الأنماط الشائعة استخدام Luna للتصنيف الأولي، ثم إرسال الحالات الصعبة إلى Terra أو Sol. يساعد هذا التسلسل في إبقاء التكاليف منخفضة دون التضحية بالجودة عندما تكون مهمة.

قدرات علم الأحياء والبحث العلمي

تُظهر تقييمات SecureBio مكاسب ملحوظة في علوم الحياة. فقد سجل Sol نسبة 68.3% في معايير World-Class Bio، وهو أعلى بحوالي 9 نقاط من GPT-5.5 الذي سجل 59.7%. كما أن التفاصيل حسب المجال أعلى باستمرار أيضاً:

اختبار قدرات علم الفيروسات: 53.5%
البيولوجيا الجزيئية: 60.0%
قدرات مسببات الأمراض البشرية: 68.4%
ReproBAIT (نقطة فحص بدون قيود): 85% مقابل 82% لـ GPT-5.5

هذا يساعد في تفسير سبب تقييد الإطلاق. تُصنف بطاقة نظام GPT-5.6 النماذج الثلاثة بأنها ذات قدرة "عالية" في المخاطر البيولوجية/الكيميائية ضمن إطار الاستعداد الخاص بـ OpenAI. ومع ذلك، لم يصل أي منها إلى الحد "الحرج" الذي قد يؤدي إلى قيود نشر أكثر صرامة.

إذا كان فريقك يعمل في علم الأحياء، أو الكيمياء، أو مجالات البحث ذات الصلة، فإن Sol يمثل قفزة حقيقية في القدرات. وعملياً، يعني هذا عادةً تجميعاً أقوى للأبحاث، وتوليداً أفضل للفرضيات، ومساعدة أكثر فائدة في تصميم التجارب. ويجب على الفرق التي تفكر في بدائل النماذج اللغوية المحلية (Local LLMs) للعمل الحساس أن توازن بين مكاسب الأداء هذه وبين متطلبات الخصوصية والتعامل مع البيانات.

حلزون الحمض النووي مجرد مع هياكل جزيئية وأنماط عصبية بألوان زرقاء وبنفسجية

الإطلاق المقيّد

هذا هو الإطلاق الأكثر تقييداً من OpenAI حتى الآن. تقتصر النسخة التجريبية على حوالي 20 مؤسسة شريكة، والوصول متاح عبر API وCodex فقط. كما أن GPT-5.6 غير متاح في ChatGPT خلال فترة المعاينة. ولا يوجد أيضاً تطبيق عام أو قائمة انتظار.

يضع الأمر التنفيذي الصادر في يونيو 2026 بشأن الذكاء الاصطناعي المتقدم إطاراً طوعياً للنماذج المتقدمة. ويشمل ذلك قياس الأداء السيبراني السري، ومنح الحكومة وصولاً يصل إلى 30 يوماً قبل الإصدار العام. ويلمح إطلاق OpenAI إلى ما ينتظر النماذج الرائدة في المستقبل: مستويات للقدرات، ومراجعة أمان مكثفة، ومزيد من التنسيق مع الإجراءات الحكومية.

Note

من المتوقع أن يكون التوفر العام للمستويات الثلاثة "في الأسابيع المقبلة" وفقاً لـ OpenAI، رغم عدم الإعلان عن تاريخ محدد حتى 4 يوليو 2026.

حزمة الأمان هنا هي الأوسع نطاقاً من OpenAI حتى الآن. فهي تشمل تدريب الأمان على مستوى النموذج، ومصنفات فورية لاكتشاف سوء الاستخدام السيبراني والبيولوجي، ومراقبة على مستوى الحساب، وضوابط وصول متباينة، واختبارات اختراق مستمرة (Red-teaming). وتفيد OpenAI بأنها أنفقت أكثر من 700,000 ساعة من وحدات معالجة الرسومات (GPU) المكافئة لـ A100 على اختبارات الاختراق الآلية لمحاولات كسر الحماية (Jailbreaks) الشاملة وحدها.

تتوقع محاكاة النشر حدوث 8.6 انتهاك لسياسة التحرش لكل 100,000 دورة محادثة في Sol. وارتفع المحتوى الجنسي غير المسموح به قليلاً من 0.05% إلى 0.07% مقارنة بـ GPT-5.5، بينما انخفضت الردود غير المسموح بها المتعلقة بالصحة النفسية من 0.03% إلى 0.02%.

استراتيجية توجيه أعباء العمل

يجعل نظام المستويات الثلاثة التحكم في التكاليف أكثر عملية. فبدلاً من الاعتماد الافتراضي على النموذج الأقوى، يمكن للفرق توجيه الطلبات بناءً على ما تحتاجه المهمة فعلياً.

مهام Sol: التفكير المعقد متعدد الخطوات، وتصحيح الأكواد عبر المستودعات الكبيرة، والدفاع السيبراني وتحليل الثغرات، والبحث العلمي الذي يتطلب خبرة متخصصة، وسير عمل الوكلاء مع استخدام الأدوات والتكرار.

مهام Terra: العمل المعرفي العام للشركات، وتحليل المستندات وتجميعها، وتوليد الأكواد للمهام القياسية، والتطبيقات الموجهة للعملاء التي تتطلب ردوداً عالية الجودة، والأدوات والمساعدين الداخليين.

مهام Luna: التصنيف ووضع العلامات (Tagging) بكميات كبيرة، واستخراج المحتوى وتلخيصه، وتوجيه الطلبات وفرزها، والإشراف في الوقت الفعلي، وأي مهمة تكون فيها الإنتاجية (Throughput) أهم من التعمق.

Warning

لا توجه الاستعلامات المتعلقة بالأمن السيبراني أو علم الأحياء إلى Luna أو Terra. تستفيد هذه المجالات كثيراً من تدريب Sol المتخصص، وقد تؤدي فجوة القدرات إلى مخرجات غير مكتملة أو مضللة في السياقات عالية المخاطر.

ما يتم تجاهله غالباً: التسلسل (Cascading) يمكن أن يكون الحل الأمثل. حيث يتولى Luna المرحلة الأولى، ويغطي Terra الحالات "العادية"، بينما يأخذ Sol الحالات المعقدة (Edge cases). يتطلب هذا جهداً معمارياً أكبر، لكن يمكن للعديد من الفرق خفض التكاليف بنسبة 60-80% مقارنة بإرسال كل شيء إلى Sol.

مخطط انسيابي لتوجيه الطلبات: المهام المعقدة لسول والعادية لتيرا والضخمة للونا

الاستعداد للتوفر العام

إذا كانت مؤسستك تتوقع الحصول على إمكانية الوصول، فمن الذكاء الاستعداد الآن. لن تستمر النسخة التجريبية إلى الأبد، ومن المحتمل أن يصاحب التوفر العام (GA) زيادة كبيرة في الطلب.

تكامل API: راجع وثائق مركز مساعدة OpenAI لمعرفة معرفات النماذج ومعلمات API. تحتاج مستويات جهد التفكير الجديدة ("max" و"ultra") إلى إعداد صريح.

نمذجة التكاليف: قم ببناء توقعات بناءً على الأسعار المنشورة. وحدد المهام التي تنتمي إلى Sol أو Terra أو Luna. فالفجوة السعرية التي تصل إلى 5 أضعاف في مخرجات Tokens بين Sol وLuna تتراكم بسرعة على النطاق الواسع.

البنية التحتية للأمان: إذا كنت تبني سير عمل للوكلاء، فضع الضوابط التي تدعو إليها OpenAI: بوابات الموافقة البشرية للإجراءات المهمة، والتسجيل المفصل، والتنفيذ في بيئة معزولة، وحدود الإنفاق.

مراجعة السياسات: هذا الإطلاق هو إشارة إلى أن نشر النماذج المتقدمة يحظى بمزيد من التدقيق. لذا، يجب على الفرق الخاضعة للوائح التنظيمية تجهيز متطلبات الامتثال قبل نقل GPT-5.6 إلى مرحلة الإنتاج.

خطوات عملية

ابدأ هنا (خطوتك الأولى)
راجع استخدامك الحالي لـ OpenAI API، وصنف كل سير عمل على أنه مناسب لـ Sol، أو Terra، أو Luna باستخدام إرشادات التوجيه المذكورة أعلاه.

مكاسب سريعة (تأثير فوري)

احسب المدخرات المحتملة من خلال نمذجة استخدامك الحالي للـ Tokens مقابل تسعير المستويات الثلاثة.
اختر سير عمل واحداً بحجم كبير وتعقيد منخفض يمكن نقله إلى Luna بمجرد إطلاق التوفر العام.

تعمق أكثر (لمن يريد المزيد)

صمم إعداد توجيه متسلسل: Luna للتصنيف، وTerra للمعالجة القياسية، وSol للحالات المعقدة.
دقق سير عمل الوكلاء للبحث عن فجوات الإشراف، ثم أضف التسجيل، وبوابات الموافقة، وبيئات العزل قبل الوصول إلى GPT-5.6.

موارد مفيدة

معاينة GPT-5.6 Sol - إعلان الإطلاق الرسمي مع تفاصيل القدرات والأسعار.
بطاقة نظام معاينة GPT-5.6 - تقييمات الأمان التفصيلية، وتصنيفات المخاطر، وإرشادات النشر.
مركز مساعدة OpenAI: معاينة GPT-5.6 - الأهلية، وطرق الوصول، والمواصفات الفنية.
Terminal-Bench 2.1 - منهجية قياس الأداء لفهم ادعاءات أداء البرمجة للوكلاء.
الأمر التنفيذي الصادر في يونيو 2026 بشأن الذكاء الاصطناعي المتقدم - السياق السياسي للإطلاق المقيّد.

الخلاصة

يجعل نظام المستويات الثلاثة في GPT-5.6 اختيار النموذج أسهل بكثير. يُعد Sol الخيار الأمثل للعمل المتطلب وعالي المخاطر الذي يستفيد من التفكير المتقدم. ويعتبر Terra الخيار الافتراضي العملي لمعظم مهام الشركات بنصف التكلفة تقريباً. بينما يمثل Luna الخيار الاقتصادي للمعالجة بكميات كبيرة حيث تكون السرعة هي الأهم.

يشير الإطلاق المقيّد أيضاً إلى الاتجاه الذي تسير فيه إصدارات الذكاء الاصطناعي المتقدمة: مستويات مقسمة حسب القدرات، ومقيدة بمراجعات الأمان، ومنسقة بشكل متزايد مع الأطر الحكومية. والفرق التي تجهز استراتيجية التوجيه وضوابط الإشراف الخاصة بها الآن ستكون في موقف قوي عندما يحين موعد التوفر العام.

المواضيع

GPT-5.6OpenAIالذكاء الاصطناعينماذج لغويةتكنولوجيا

شارك هذا المقال