Loading blog posts...
Loading blog posts...
جاري التحميل...

يُعد Claude Mythos Preview أول إصدار رئيسي لنموذج لغوي ضخم (LLM) منذ سنوات يغير فعلياً من التخطيط الأمني التشغيلي، ولا يقتصر فقط على تحسين جودة المحادثة (بناءً على ما رأيته). تركز الكثير من المقالات على ميزة "الاستنتاج الأقوى"، لكن التحول العملي أبسط بكثير: يُعامل Mythos الآن كموظف مبتدئ ومهار يمكنه التخطيط، وكتابة الأكواد، وتنفيذ المهام المتكررة، ومواصلة العمل على المهام الطويلة.
يمكنك نسخ مسارات العمل (Workflows) هذه لتحويل Mythos إلى محرك للفرز الأمني، وأداة لإعادة صياغة الأكواد (Refactoring)، ومساعد للاستجابة للحوادث، دون الحاجة إلى تخمين كيفية تنظيم العمل.
استخدم هذه الموجهات (Prompt) كما هي للحصول على تقرير فرز دقيق يمكن لفريق الهندسة العمل بناءً عليه فعلياً.
Prompt: Repo vulnerability triage with patch plan
textYou are a security engineer. Goal: triage and remediate a suspected vulnerability. Inputs: - Repo context: [PASTE README OR ARCHITECTURE NOTES] - Affected component: [FILE PATHS OR MODULE NAMES] - Finding: [PASTE SCANNER OUTPUT, BUG REPORT, OR STACK TRACE] - Constraints: must keep backward compatibility, minimal diff preferred. Tasks: 1) Identify the most likely root cause and the vulnerable data flow (sources, transforms, sinks). 2) Provide a risk rating with rationale (impact, likelihood, preconditions). 3) Propose a patch plan with 2 options: - Option A: minimal change hotfix - Option B: safer refactor that reduces future risk 4) For each option, list exact files to change, functions to edit, and new tests to add. 5) Provide a verification checklist that a reviewer can run in CI. Rules: - If information is missing, ask up to 5 targeted questions first. - Do not propose exploit steps or offensive payloads. Keep it defensive. Output format: - Summary - Root cause - Patch plan A - Patch plan B - Tests - Verification checklist
ينجح هذا الأسلوب لأنه يجبر النموذج على التفكير طويل المدى (تخطيط متعدد الخطوات يشمل الأكواد، والاختبارات، والتكامل المستمر CI). كما أنه يمنع المشكلة الشائعة المتمثلة في تقديم الكثير من "النصائح" التي لا تتحول أبداً إلى تغييرات يمكن دمجها (Mergeable change). إن تقييد النموذج بـ "الملفات، والدوال، والاختبارات" هو ما يحوله من مجرد معلق إلى منفذ حقيقي.
إذا تخليت عن هذه القيود، تميل النماذج عادةً إلى إجراء عمليات إعادة كتابة شاملة. ولنكن واقعيين: هذا يخلق صعوبات في المراجعة وتأخيرات، وهي الطريقة التي تموت بها الإصلاحات الأمنية بهدوء في قائمة المهام المتراكمة (Backlog).

إذا كنت بحاجة إلى تعريف موجز لأصحاب المصلحة: يُعد Claude Mythos Preview النموذج العام الأكثر تقدماً من Anthropic. ويُصنف كمستوى قدرات يتجاوز Claude Opus 4.6، مع تميز واضح في أمن الحواسيب كنتيجة جانبية لتحسين التخطيط وتنفيذ الأكواد.
إليك ما حدث: أكدت Anthropic وجود النموذج بعد تسريب حدث في مارس 2026 لحوالي 3000 ملف داخلي من قاعدة بيانات غير مهيأة بشكل صحيح. وقد نُسب الفضل في الإبلاغ المسؤول إلى Roy Paz و Alexandre Pauwels. وأوضحت الشركة أن التدريب قد اكتمل وأن تجارب الشركاء جارية. المصدر: تقرير Fortune.
طريقة الإصدار مهمة بقدر أهمية النموذج نفسه. يتم توزيع Mythos ضمن مشروع Glasswing، والذي يُوصف بأنه تحالف يضم أكثر من 40 (وأحياناً أكثر من 45) مؤسسة تقنية وأمنية كبرى للتقييم واختبارات الاختراق (Red-teaming)، بدلاً من الإطلاق العام الفوري. المصدر: بطاقة نظام Anthropic (PDF) و إعلان المعاينة على Google Cloud Vertex AI.
هذا التقييد هو إشارة واضحة جداً للقادة الأمنيين: تتعامل Anthropic مع Mythos كأداة مزدوجة الاستخدام (Dual-use) بشكل افتراضي. ويجب على فرق العمل أن تفعل الشيء نفسه عند استخدامه داخلياً، حتى لو كان استخدامهم دفاعياً بالكامل.
Important
[!IMPORTANT] تعامل مع صلاحيات الوصول إلى Mythos وكأنها بيانات اعتماد لبيئة الإنتاج (Production credentials): استخدم مبدأ الصلاحيات الأقل، وقوائم السماح لكل مشروع، وتسجيل السجلات (Logging)، والمخرجات القابلة للمراجعة. لم يعد التفكير بأنه "مجرد LLM" نموذجاً آمناً عندما يكون النظام قادراً على التخطيط والتكرار عبر خطوات متعددة.
قبل بناء وكلاء (Agents) يستخدمون الأدوات، قم بإجراء تقييم "الوكيل الورقي": يجب على النموذج أن يقترح الخطوات، ونقاط التوقف، والمخرجات (Artifacts) التي سينتجها.
Prompt: Paper-agent evaluation for a security task
textYou are not allowed to run tools. You must act like a planning agent. Goal: [SECURITY GOAL, e.g., "reduce SSRF risk in our URL fetch service"] Context: - System overview: [PASTE] - Known issues: [PASTE] - Constraints: [PASTE] Output: 1) A step-by-step plan with checkpoints every 30-60 minutes of work. 2) For each checkpoint: expected artifacts (PR diff, test cases, dashboards, runbooks). 3) A list of decisions that require human approval. 4) A rollback plan and blast-radius analysis. 5) A final "definition of done" checklist.
يكشف هذا ما إذا كان Mythos قادراً على التخطيط طويل المدى دون الانحراف عن الهدف. النماذج التي تبدو ذكية فقط تميل إلى تخطي المخرجات، وتخطي خطط التراجع (Rollback)، وتخطي نقاط الموافقة البشرية (وبعد ذلك يدفع الجميع الثمن).
إذا كانت الخطة جيدة، يمكنك تحويلها إلى وكيل حقيقي لاحقاً. أما إذا كانت الخطة غامضة، فلن ينقذها منح النموذج صلاحية الوصول إلى الأدوات. الوصول إلى الأدوات سيجعل الخطط الغامضة تفشل بشكل أسرع ببساطة.

تشير التقارير باستمرار إلى أن أداء Mythos في الأمن السيبراني ينبع من قدرات عامة أقوى: فهم الأنظمة المعقدة، وإجراء تحليلات متعددة الخطوات، وكتابة الأكواد وتنفيذها، والتكرار عبر التصحيح الذاتي. المصادر: Fortune و بطاقة نظام Anthropic (PDF).
هذا مهم جداً لأن العمل الأمني في معظمه هو عمل "ترابطي": تتبع تدفق البيانات عبر الطبقات، والتوفيق بين السجلات المتضاربة، وربط الإعدادات بسلوك النظام أثناء التشغيل (Runtime)، وكتابة إصلاحات آمنة لا تعطل بيئة الإنتاج. إن النموذج الذي يمكنه الحفاظ على تسلسل الأفكار عبر عشرات الخطوات يغير ثلاثة مسارات عمل فوراً:
كما أنه يرفع من سقف القدرات الهجومية. إن تردد Anthropic في إطلاق النموذج للجمهور بشكل واسع هو إشارة إلى أن نفس "المهارات الترابطية" يمكن أن تسرع من اكتشاف الثغرات وتطوير الاستغلالات إذا أُسيء استخدامها. لذلك، يجب أن تكون الضوابط الداخلية واضحة وصريحة، وليست ضمنية.
Warning
[!WARNING] لا تطلب من Mythos "إثبات" وجود ثغرة باستخدام حمولات خبيثة (Payloads) أو خطوات استغلال. حتى لو كان هدفك دفاعياً، فقد ينتهي بك الأمر بتوليد محتوى ينتهك السياسات، أو يزيد من المخاطر الداخلية، أو يصبح خطراً عند نسخه ولصقه.
أسرع طريقة للحصول على قيمة حقيقية هي تقييد المخرجات في أجزاء جاهزة لطلبات السحب (PR-ready): تغييرات برمجية صغيرة، واختبارات واضحة، وقائمة تحقق للمراجعة.
Prompt: Secure refactor into a minimal PR
textYou are a senior backend engineer. Produce a minimal, reviewable PR plan. Goal: [E.g., "Remove unsafe deserialization from /api/import"] Repo constraints: - Language/framework: [E.g., "Node.js + Express"] - Test framework: [E.g., "Jest"] - CI: [E.g., "GitHub Actions"] - Coding standards: [PASTE LINT RULES OR STYLE NOTES] Input code: [PASTE RELEVANT FILES OR SNIPPETS] Output: - A minimal diff strategy (avoid rewrites) - Exact code edits (show before/after snippets) - 3-5 tests: include one regression test for the vulnerability - A migration note if behavior changes - A reviewer checklist Rules: - Prefer allowlists over denylists - Prefer typed parsing and schema validation - No exploit payloads
يجبر هذا الموجه النموذج على اتخاذ خيارات آمنة بطبيعتها (مثل قوائم السماح، والتحقق من المخطط) مع الحفاظ على صغر حجم التغييرات البرمجية. تُعد التغييرات الصغيرة أداة تحكم أمنية لأن المراجعين يمكنهم فهمها فعلياً. إذا تركت النموذج يعيد كتابة وحدات كاملة، فأنت تستبدل خطراً (ثغرة معروفة) بخطر آخر (تغييرات منطقية غير معروفة).
ونعم، هكذا تتحول "الإصلاحات الأمنية" إلى أسباب لوقوع الحوادث.
ابدأ بنمط تكامل خاضع للرقابة: حساب خدمة واحد، ومشروع واحد، ومسار تسجيل واحد (Logging sink)، وقائمة سماح واحدة لحالات الاستخدام.
bash## 1) Authenticate for Google Cloud gcloud auth login gcloud config set project [GCP_PROJECT_ID] # 2) Confirm Vertex AI is enabled gcloud services enable aiplatform.googleapis.com # 3) Create a dedicated service account for Mythos calls gcloud iam service-accounts create mythos-runner \ --description="Calls Claude Mythos Preview via Vertex AI" \ --display-name="mythos-runner" # 4) Grant only what is needed (start tight, expand later) gcloud projects add-iam-policy-binding [GCP_PROJECT_ID] \ --member="serviceAccount:mythos-runner@[GCP_PROJECT_ID].iam.gserviceaccount.com" \ --role="roles/aiplatform.user"
يضع هذا أساساً يجعل الوصول إلى Mythos قابلاً للتدقيق ومنفصلاً عن حسابات المستخدمين البشرية. إن أكثر أخطاء الحوكمة شيوعاً التي رأيتها هو استدعاء النماذج المتقدمة من أجهزة المطورين باستخدام بيانات اعتماد شخصية، مما يجعل التحقيق في الحوادث فوضوياً لاحقاً.
يؤكد إعلان Google توفر Mythos Preview كمعاينة خاصة مقيدة على Vertex AI (بتاريخ 7 أبريل 2026): Claude Mythos Preview على Vertex AI. إذا كنت تقيم الوصول أيضاً عبر Amazon Bedrock، فحافظ على نفس مستوى الضوابط: أدوار IAM منفصلة، وقوائم سماح واضحة للنماذج، وتسجيل مركزي للسجلات.
الهدف هو جعل الإجابة على سؤال "من طلب ماذا؟" ممكنة في دقائق، وليس في أيام.
النمط الموثوق هو سلسلة من 3 مراحل حيث لا يحصل Mythos أبداً على أسرار خام (Raw secrets) ولا ينفذ التغييرات مباشرة دون بوابة موافقة.
pythonfrom dataclasses import dataclass from typing import Literal Severity = Literal["low", "medium", "high", "critical"] @dataclass class Finding: title: str summary: str severity: Severity affected_components: list[str] recommended_actions: list[str] def redact(text: str) -> str: # Replace obvious secret patterns before sending to any LLM. # Extend this with your org's detectors (API keys, JWTs, private keys). text = text.replace("-----BEGIN PRIVATE KEY-----", "[REDACTED_PRIVATE_KEY]") return text def gate_actions(finding: Finding) -> bool: # Human approval gate: require review for high/critical. return finding["severity"] in ("low", "medium")
السطر الأهم ليس التشفير (Redaction) بحد ذاته. بل حقيقة أن التشفير موجود كمرحلة إلزامية في مسار العمل. الفرق التي تتخطى هذه الخطوة ينتهي بها الأمر دائماً تقريباً بلصق بيانات الحوادث التي تحتوي على رموز (Tokens)، أو أسماء مضيفين داخلية، أو معرفات عملاء داخل الموجهات (عادةً عن طريق الخطأ، وليس بسوء نية).
لاحظ أيضاً بوابة الموافقة. حتى لو كان بإمكان Mythos اقتراح إصلاح، فإن تغييرات بيئة الإنتاج لا تزال بحاجة إلى حدود يتحكم فيها الإنسان. هذه هي أبسط طريقة للحصول على سرعة الوكيل الذكي دون تحمل مخاطره.
لمزيد من المعلومات حول بناء مسارات عمل مستقلة بأمان، راجع دليلنا حول الذكاء الاصطناعي الوكيلي في 2026: زملاء العمل المستقلون من الذكاء الاصطناعي.

| مجال القدرات | ما تفعله الفرق اليوم | ما يتيحه Mythos Preview | المخاطر التشغيلية إذا لم تتم إدارتها |
|---|---|---|---|
| التخطيط طويل المدى | تقسيم العمل إلى العديد من التذاكر التي يديرها البشر | تسليمات أقل، وخطط شاملة أوضح مع مخرجات | يمكن للخطط التي يقودها النموذج تجاوز معايير المراجعة |
| تنفيذ الأكواد الآمنة | استخدام نماذج LLM للمقتطفات والشروحات | تغييرات بحجم طلبات السحب (PR) مع اختبارات وخطوات تحقق | التغييرات الكبيرة يمكن أن تخفي تراجعات منطقية (Logic regressions) |
| الفرز الأمني | يربط المحللون بين الماسحات الضوئية والسجلات والأكواد يدوياً | تحليل أسرع للأسباب الجذرية عبر الوحدات | يمكن أن تتسرب البيانات الحساسة إلى الموجهات |
| الأتمتة الدفاعية | نصوص برمجية (Scripts) يكتبها البشر، وتكرار بطيء | مسودات أدوات وخطط استجابة (Playbooks) تكرارية | يمكن للأتمتة أن تضاعف الأخطاء |
| التعرض للاستخدام المزدوج | نماذج عامة ذات وصول واسع | وصول مقيد عبر التحالفات والبوابات السحابية | إساءة الاستخدام الداخلي ومخاطر نسخ ولصق الموجهات |
لهذا السبب لا يُعد Mythos "مجرد ترقية أخرى لنموذج". إنه يغير مقدار العمل الذي يمكن تفويضه مقابل كل وحدة من الإشراف.

انحراف الموجه (Prompt drift) هو المشكلة الأولى. تتسبب المهام الطويلة في قيام النموذج بـ "التحسين" بهدوء لصالح السرد بدلاً من المخرجات (ولن تلاحظ ذلك إلا بعد قضاء 20 دقيقة في قراءة قصة).
Prompt: Anti-drift output contract
textYou must produce only these artifacts, in this order: 1) File change list (paths only) 2) Patch plan (bullets, max 12) 3) Test plan (bullets, max 10) 4) Verification checklist (checkboxes) If you cannot complete an artifact, write "BLOCKED: [reason]" and ask 1 question. Do not add any other text.
ينجح هذا الأسلوب لأنه يحول المخرجات إلى عقد ملزم. ويصبح الانحراف واضحاً في اللحظة التي يختفي فيها أي مُخرج.
المشكلة الثانية هي الثقة الزائفة في الادعاءات الأمنية. يمكن أن تبدو النماذج واثقة بشأن فئة ثغرة معينة حتى عندما يكون مسار الكود خاطئاً. الحل الفعال عملياً هو طلب "دليل تتبع": يجب على النموذج أن يستشهد بتبرير على مستوى السطر من الكود المقدم ويحدد نقطة النهاية (Sink) بدقة. وإذا لم يتمكن من ذلك، فعليه طلب الملف المفقود.
المشكلة الثالثة هي "حمى إعادة الكتابة". يمكن أن تغري قدرات البرمجة في Mythos الفرق بقبول عمليات إعادة صياغة كبيرة. حافظ على قاعدة صارمة: يجب أن تكون طلبات السحب (PRs) الأمنية صغيرة ما لم تكن هناك خطة انتقال وتراجع مكتوبة. هذه القاعدة مملة، لكنها تمنع الفئة الأكثر تكلفة من أخطاء الإصلاح.
يُعد مشروع Glasswing (الذي يضم أكثر من 40 مؤسسة) اعترافاً فعلياً بأن التقييم يجب أن يشمل اختبارات اختراق حقيقية (Adversarial testing)، وليس فقط درجات التقييم المعيارية (Benchmark scores). المصادر: إعلان Google Cloud و بطاقة نظام Anthropic (PDF).
يمكن للشركات محاكاة هذا النهج من خلال إنشاء "Glasswing مصغر" داخلياً:
إذا كان التقييم يقتصر على "هل يجيب على الأسئلة بشكل جيد؟"، فستفقد المؤسسة القيمة الحقيقية والمخاطر الحقيقية.
هناك نقطة سياقية أخرى مهمة: تشير التغطيات إلى أن Anthropic اكتشفت مجموعة مدعومة من الحكومة الصينية تستخدم Claude Code لاستهداف حوالي 30 مؤسسة، وهذا جزء من سبب التعامل مع قدرات Mythos السيبرانية بحساسية غير عادية. المصدر: Fortune.
قللت Stripe من وقت حل الحوادث بنسبة 42% من خلال توحيد خطط الاستجابة (Runbooks) وأتمتة خطوات الفرز في الاستجابة الأولى. هذا الرقم مأخوذ من النقاشات الهندسية المنشورة لشركة Stripe ومحادثات أدوات الحوادث، وهو المعيار الذي تستخدمه العديد من الفرق لتبرير ميزانيات الأتمتة.
زادت Netflix من وتيرة النشر (Deployment) بمقدار الضعف بعد التركيز على المسارات الممهدة، والاختبارات الآلية، وعمليات التراجع الأكثر أماناً، وهو نفس الأساس الهندسي الذي يحتاجه Mythos ليكون مفيداً دون أن يكون خطيراً.
حسّنت Spotify متوسط وقت التعافي بنسبة 30% بعد الاستثمار في قابلية المراقبة (Observability) ومسارات عمل المناوبة (On-call)، وهو الشرط الأساسي ليكون أي فرز يقوده النموذج جديراً بالثقة.
هذه ليست "نتائج Mythos". بل هي الأساسيات التشغيلية التي تحدد ما إذا كان Mythos سيصبح قوة مضاعفة للإنتاجية أم مجرد مصدر آخر للإزعاج.
جهّز هذه الأمور، وعادةً ما ستتقدم تجارب Mythos بسرعة:
إذا تخطيت هذه الخطوات، فستتحول التجربة إلى بيئة تجريبية (Demo) لن تترجم أبداً إلى قيمة حقيقية في بيئة الإنتاج.
للحصول على عقلية مقارنة النماذج عبر مختلف المزودين، راجع نظرتنا العامة حول Google Gemini 3.1 Pro في 2026: الميزات وطريقة الاستخدام.
ابدأ من هنا (خطوتك الأولى)
قم بإجراء تقييم "الوكيل الورقي" لـ Mythos لمدة ساعتين على تذكرة أمنية مغلقة، وقم بتقييمه بناءً على جودة المخرجات (الملفات، الاختبارات، التحقق).
مكاسب سريعة (تأثير فوري)
تعمق أكثر (لمن يريد المزيد)
يتم وضع Claude Mythos Preview كمستوى جديد من الاستنتاج الوكيلي (Agentic reasoning) بالإضافة إلى تنفيذ برمجي عالي المستوى، مع أداء قوي بشكل استثنائي في الأمن السيبراني ينبع من القدرات الأساسية، وليس من مجموعة ميزات ضيقة.
إن الإصدار الخاضع للرقابة من خلال مشروع Glasswing والمعاينات السحابية المقيدة هو أوضح إشارة على أن الشركات يجب أن تتعامل معه كأداة مزدوجة الاستخدام وتديره كمشغل داخلي قوي. وتحصل الفرق على أفضل النتائج من خلال إجبار النموذج على تقديم مخرجات جاهزة لطلبات السحب (PR-ready): تغييرات طفيفة، واختبارات واضحة، وقوائم تحقق للمراجعة.
أسرع مسار آمن (في معظم المؤسسات) هو التكامل المقيد مع التشفير، والتسجيل، وحدود الموافقة البشرية، يليه برنامج تجريبي يُقيّم بناءً على نتائج قابلة للقياس مثل وقت الفرز ومعدل قبول الإصلاحات.
هل تحتاج إلى مساعدة في تنفيذ برنامج تجريبي مُدار لـ Mythos، وعقود الموجهات، ومسارات الأتمتة الدفاعية؟ يمكن لشركة Joulyan IT Solutions دعم تكامل الذكاء الاصطناعي وأتمتة مسارات العمل باستخدام ضوابط متوافقة مع متطلبات التدقيق.