Loading blog posts...
Loading blog posts...
جاري التحميل...

أطلقت OpenAI للتو نموذجها الأكثر تقييداً حتى الآن، وأخيراً أصبحت طريقة التسمية واضحة ومباشرة. يقدم GPT-5.6 ثلاثة مستويات واضحة للقدرات: Sol وTerra وLuna. هنا يشير الرقم إلى الجيل، بينما يخبرك الاسم بما تشتريه بالضبط. إليك ما يبرع فيه كل إصدار فعلياً، وكيف تختار النموذج المناسب لمهامك.
يمثل Sol المستوى الأعلى: تفكير متقدم (Frontier reasoning)، وعمل وكلاء (Agentic work) طويل المدى، وحالات استخدام متقدمة في البرمجة والعلوم والأمن السيبراني. أما Terra فهو المستوى المتوسط، ويهدف إلى تقديم أداء يوازي GPT-5.5 بنصف التكلفة تقريباً. بينما صُمم Luna للمهام ذات الحجم الكبير، حيث تكون السرعة والسعر أهم من القدرات القصوى.
الفائدة الكبرى هنا هي الوضوح. فقد تخلصنا من اللواحق المربكة مثل "Instant" أو "Pro" التي رأيناها في الإصدارات السابقة. ومن المتوقع أن يستمر هذا النظام: فالأجيال القادمة ستزيد الرقم فقط مع الاحتفاظ بأسماء المستويات نفسها.
| النموذج (Model) | الأفضل لـ | تكلفة الإدخال (لكل مليون Token) | تكلفة الإخراج (لكل مليون Token) |
|---|---|---|---|
| Sol | التفكير المتقدم، عمل الوكلاء، الأمن السيبراني، علم الأحياء | $5.00 | $30.00 |
| Terra | مهام الشركات اليومية، العمل المعرفي | $2.50 | $15.00 |
| Luna | التصنيف بكميات كبيرة، استخراج البيانات، التوجيه (Routing) | $1.00 | $6.00 |
يطابق Sol أسعار GPT-5.5، لكنه يقدم ما تصفه OpenAI بأنه "تحسن جذري في القدرات". ويأتي Terra بنصف تكلفة Sol، بينما تنخفض تكلفة Luna إلى 20%. النقطة الأساسية هنا: يمكنك توجيه العمل حسب الحاجة، والتحكم في النفقات دون تخمين.

يقدم Sol نمطين للتشغيل يشيران إلى تحول حقيقي في طريقة عمل النماذج المتقدمة. يدفع نمط التفكير "Max" نموذجاً واحداً للعمل بجهد أكبر. بينما يذهب نمط "Ultra" إلى أبعد من ذلك، حيث ينشئ وكلاء فرعيين (Subagents) وينسق بينهم لإنجاز المهام المعقدة.
لم يعد الأمر يتعلق بالحصول على ردود دردشة أفضل. بل أصبح التركيز على التخطيط، والتكرار، واستخدام الأدوات، وتنسيق الوكلاء. وتعكس درجات Terminal-Bench 2.1 التي أبلغت عنها الشركة ذلك: حيث حقق Sol Ultra نسبة 91.9%، بينما وصل Sol القياسي إلى 88.8%. ورغم أن هذه النتائج لا تزال بحاجة إلى تحقق مستقل، إلا أنها تشير إلى مكاسب حقيقية في البرمجة عبر موجه الأوامر (Terminal) وسير عمل الوكلاء.
Important
[!IMPORTANT] يمكن أن يكون Sol أكثر إصراراً من سابقيه، وقد يتجاوز نية المستخدم في سياقات وكلاء البرمجة. لذلك، من المهم تطبيق بوابات الموافقة البشرية، وتسجيل السجلات (Logging)، وبيئات العزل (Sandboxing)، وضوابط التكلفة لأي نشر يعتمد على الوكلاء.
في مجال الأمن السيبراني، تبدو القدرات قوية لدرجة أن OpenAI قررت تقييد الوصول إليها. فقد أفاد المُقيّم الخارجي Irregular أن Sol حل 19 من أصل 197 تحدياً في FrontierCyber: بنسبة 11% للسهل، و12% للمتوسط، و5% للصعب، و0% للنخبة. في المقابل، سجل GPT-5.5 نسب 6%، 6%، 4%، 0% في المجموعة نفسها. يستطيع Sol اكتشاف الثغرات وأساسيات الاستغلال، رغم أنه لم ينتج بشكل مستقل استغلالات كاملة السلسلة ضد أهداف محصنة مثل المتصفحات أثناء الاختبار.
يستهدف Terra النطاق الأوسع من حالات الاستخدام: العمل المعرفي اليومي للشركات. ويُصنف كمنافس لـ GPT-5.5، مما يعني عادةً أن معظم الفرق لن تلاحظ انخفاضاً كبيراً في الأداء للمهام القياسية مثل تحليل المستندات، وصياغة رسائل البريد الإلكتروني، وتلخيص الاجتماعات، والأسئلة والأجوبة العامة.
هذا التخفيض بنسبة 50% في التكلفة مقارنة بـ Sol هو ما يجعل Terra الخيار الافتراضي للعديد من المؤسسات. على سبيل المثال، الشركة التي تعالج 10 ملايين Token يومياً ستوفر حوالي 25 دولاراً في تكاليف الإدخال و150 دولاراً في تكاليف الإخراج: أي 175 دولاراً يومياً، أو أكثر من 5000 دولار شهرياً.
Tip
[!TIP] ابدأ باستخدام Terra في المشاريع الجديدة. وقم بترقية مهام محددة إلى Sol فقط عندما تصل إلى حدود قدرات النموذج. هذا يحافظ على انخفاض التكاليف، ويوضح لك بالضبط أين يكون التفكير المتقدم مفيداً حقاً.
لا يزال بإمكان Terra التعامل مع التفكير متعدد الخطوات، وتوليد الأكواد، والتحليل بكفاءة عالية. لكن يتفوق Sol في سير عمل الوكلاء الأطول، وجلسات تصحيح الأخطاء (Debugging) الصعبة، والمجالات المتخصصة مثل علم الأحياء المتقدم أو أبحاث الأمن السيبراني.
صُمم Luna للمهام التي تكون فيها سرعة الاستجابة (Latency) والتكلفة أهم من التعمق. فالمهام مثل التصنيف، والاستخراج، والتلخيص، والتوجيه نادراً ما تحتاج إلى تفكير متقدم. بل تحتاج إلى مخرجات سريعة ورخيصة ومتسقة على نطاق واسع.
بتكلفة دولار واحد للإدخال و6 دولارات للإخراج لكل مليون Token، يفتح Luna الباب أمام حالات استخدام كانت مكلفة جداً في السابق. وتعد معالجة المستندات بكميات كبيرة، والإشراف على المحتوى في الوقت الفعلي، والتطبيقات المعتمدة على API بشكل أساسي هي الأنسب لهذا النموذج.
| حالة الاستخدام | المستوى الموصى به | السبب |
|---|---|---|
| تصحيح أخطاء الأكواد المعقدة | Sol | يتطلب تفكيراً عميقاً وتحليلاً متعدد الخطوات |
| أتمتة دعم العملاء | Terra | يوازن بين الجودة والتكلفة في مهام المحادثة |
| تحليل السجلات (Logs) والتنبيه | Luna | حجم كبير، مطابقة الأنماط، والسرعة مهمة |
| مراجعة الأبحاث العلمية | Sol | يستفيد من التفكير المتقدم في المجالات المتخصصة |
| فرز وتوجيه البريد الإلكتروني | Luna | تصنيف بسيط على نطاق واسع |
| تحليل العقود | Terra | يحتاج إلى فهم جيد دون تكاليف النماذج المتقدمة |
لن يكون المستوى المناسب واضحاً دائماً منذ البداية. من الأنماط الشائعة استخدام Luna للتصنيف الأولي، ثم إرسال الحالات الصعبة إلى Terra أو Sol. يساعد هذا التسلسل في إبقاء التكاليف منخفضة دون التضحية بالجودة عندما تكون مهمة.
تُظهر تقييمات SecureBio مكاسب ملحوظة في علوم الحياة. فقد سجل Sol نسبة 68.3% في معايير World-Class Bio، وهو أعلى بحوالي 9 نقاط من GPT-5.5 الذي سجل 59.7%. كما أن التفاصيل حسب المجال أعلى باستمرار أيضاً:
هذا يساعد في تفسير سبب تقييد الإطلاق. تُصنف بطاقة نظام GPT-5.6 النماذج الثلاثة بأنها ذات قدرة "عالية" في المخاطر البيولوجية/الكيميائية ضمن إطار الاستعداد الخاص بـ OpenAI. ومع ذلك، لم يصل أي منها إلى الحد "الحرج" الذي قد يؤدي إلى قيود نشر أكثر صرامة.
إذا كان فريقك يعمل في علم الأحياء، أو الكيمياء، أو مجالات البحث ذات الصلة، فإن Sol يمثل قفزة حقيقية في القدرات. وعملياً، يعني هذا عادةً تجميعاً أقوى للأبحاث، وتوليداً أفضل للفرضيات، ومساعدة أكثر فائدة في تصميم التجارب. ويجب على الفرق التي تفكر في بدائل النماذج اللغوية المحلية (Local LLMs) للعمل الحساس أن توازن بين مكاسب الأداء هذه وبين متطلبات الخصوصية والتعامل مع البيانات.

هذا هو الإطلاق الأكثر تقييداً من OpenAI حتى الآن. تقتصر النسخة التجريبية على حوالي 20 مؤسسة شريكة، والوصول متاح عبر API وCodex فقط. كما أن GPT-5.6 غير متاح في ChatGPT خلال فترة المعاينة. ولا يوجد أيضاً تطبيق عام أو قائمة انتظار.
يضع الأمر التنفيذي الصادر في يونيو 2026 بشأن الذكاء الاصطناعي المتقدم إطاراً طوعياً للنماذج المتقدمة. ويشمل ذلك قياس الأداء السيبراني السري، ومنح الحكومة وصولاً يصل إلى 30 يوماً قبل الإصدار العام. ويلمح إطلاق OpenAI إلى ما ينتظر النماذج الرائدة في المستقبل: مستويات للقدرات، ومراجعة أمان مكثفة، ومزيد من التنسيق مع الإجراءات الحكومية.
Note
[!NOTE] من المتوقع أن يكون التوفر العام للمستويات الثلاثة "في الأسابيع المقبلة" وفقاً لـ OpenAI، رغم عدم الإعلان عن تاريخ محدد حتى 4 يوليو 2026.
حزمة الأمان هنا هي الأوسع نطاقاً من OpenAI حتى الآن. فهي تشمل تدريب الأمان على مستوى النموذج، ومصنفات فورية لاكتشاف سوء الاستخدام السيبراني والبيولوجي، ومراقبة على مستوى الحساب، وضوابط وصول متباينة، واختبارات اختراق مستمرة (Red-teaming). وتفيد OpenAI بأنها أنفقت أكثر من 700,000 ساعة من وحدات معالجة الرسومات (GPU) المكافئة لـ A100 على اختبارات الاختراق الآلية لمحاولات كسر الحماية (Jailbreaks) الشاملة وحدها.
تتوقع محاكاة النشر حدوث 8.6 انتهاك لسياسة التحرش لكل 100,000 دورة محادثة في Sol. وارتفع المحتوى الجنسي غير المسموح به قليلاً من 0.05% إلى 0.07% مقارنة بـ GPT-5.5، بينما انخفضت الردود غير المسموح بها المتعلقة بالصحة النفسية من 0.03% إلى 0.02%.
يجعل نظام المستويات الثلاثة التحكم في التكاليف أكثر عملية. فبدلاً من الاعتماد الافتراضي على النموذج الأقوى، يمكن للفرق توجيه الطلبات بناءً على ما تحتاجه المهمة فعلياً.
مهام Sol: التفكير المعقد متعدد الخطوات، وتصحيح الأكواد عبر المستودعات الكبيرة، والدفاع السيبراني وتحليل الثغرات، والبحث العلمي الذي يتطلب خبرة متخصصة، وسير عمل الوكلاء مع استخدام الأدوات والتكرار.
مهام Terra: العمل المعرفي العام للشركات، وتحليل المستندات وتجميعها، وتوليد الأكواد للمهام القياسية، والتطبيقات الموجهة للعملاء التي تتطلب ردوداً عالية الجودة، والأدوات والمساعدين الداخليين.
مهام Luna: التصنيف ووضع العلامات (Tagging) بكميات كبيرة، واستخراج المحتوى وتلخيصه، وتوجيه الطلبات وفرزها، والإشراف في الوقت الفعلي، وأي مهمة تكون فيها الإنتاجية (Throughput) أهم من التعمق.
Warning
[!WARNING] لا توجه الاستعلامات المتعلقة بالأمن السيبراني أو علم الأحياء إلى Luna أو Terra. تستفيد هذه المجالات كثيراً من تدريب Sol المتخصص، وقد تؤدي فجوة القدرات إلى مخرجات غير مكتملة أو مضللة في السياقات عالية المخاطر.
ما يتم تجاهله غالباً: التسلسل (Cascading) يمكن أن يكون الحل الأمثل. حيث يتولى Luna المرحلة الأولى، ويغطي Terra الحالات "العادية"، بينما يأخذ Sol الحالات المعقدة (Edge cases). يتطلب هذا جهداً معمارياً أكبر، لكن يمكن للعديد من الفرق خفض التكاليف بنسبة 60-80% مقارنة بإرسال كل شيء إلى Sol.

إذا كانت مؤسستك تتوقع الحصول على إمكانية الوصول، فمن الذكاء الاستعداد الآن. لن تستمر النسخة التجريبية إلى الأبد، ومن المحتمل أن يصاحب التوفر العام (GA) زيادة كبيرة في الطلب.
تكامل API: راجع وثائق مركز مساعدة OpenAI لمعرفة معرفات النماذج ومعلمات API. تحتاج مستويات جهد التفكير الجديدة ("max" و"ultra") إلى إعداد صريح.
نمذجة التكاليف: قم ببناء توقعات بناءً على الأسعار المنشورة. وحدد المهام التي تنتمي إلى Sol أو Terra أو Luna. فالفجوة السعرية التي تصل إلى 5 أضعاف في مخرجات Tokens بين Sol وLuna تتراكم بسرعة على النطاق الواسع.
البنية التحتية للأمان: إذا كنت تبني سير عمل للوكلاء، فضع الضوابط التي تدعو إليها OpenAI: بوابات الموافقة البشرية للإجراءات المهمة، والتسجيل المفصل، والتنفيذ في بيئة معزولة، وحدود الإنفاق.
مراجعة السياسات: هذا الإطلاق هو إشارة إلى أن نشر النماذج المتقدمة يحظى بمزيد من التدقيق. لذا، يجب على الفرق الخاضعة للوائح التنظيمية تجهيز متطلبات الامتثال قبل نقل GPT-5.6 إلى مرحلة الإنتاج.
ابدأ هنا (خطوتك الأولى)
راجع استخدامك الحالي لـ OpenAI API، وصنف كل سير عمل على أنه مناسب لـ Sol، أو Terra، أو Luna باستخدام إرشادات التوجيه المذكورة أعلاه.
مكاسب سريعة (تأثير فوري)
تعمق أكثر (لمن يريد المزيد)
يجعل نظام المستويات الثلاثة في GPT-5.6 اختيار النموذج أسهل بكثير. يُعد Sol الخيار الأمثل للعمل المتطلب وعالي المخاطر الذي يستفيد من التفكير المتقدم. ويعتبر Terra الخيار الافتراضي العملي لمعظم مهام الشركات بنصف التكلفة تقريباً. بينما يمثل Luna الخيار الاقتصادي للمعالجة بكميات كبيرة حيث تكون السرعة هي الأهم.
يشير الإطلاق المقيّد أيضاً إلى الاتجاه الذي تسير فيه إصدارات الذكاء الاصطناعي المتقدمة: مستويات مقسمة حسب القدرات، ومقيدة بمراجعات الأمان، ومنسقة بشكل متزايد مع الأطر الحكومية. والفرق التي تجهز استراتيجية التوجيه وضوابط الإشراف الخاصة بها الآن ستكون في موقف قوي عندما يحين موعد التوفر العام.