جاري التحميل...

Loading blog posts...

Also in

Claude Mythos Preview: ثورة الذكاء الاصطناعي في الأمن

اكتشف كيف يغير Claude Mythos Preview التخطيط الأمني التشغيلي. تعلم استخدام مسارات العمل لتحويله إلى مساعد أمني محترف لكتابة الأكواد. اقرأ المقال الآن!

8 Apr 20262 دقائق قراءةJoulyan IT

Claude Mythos Preview: ثورة الذكاء الاصطناعي في الأمن - رسم توضيحي لـ ai

يُعد Claude Mythos Preview أول إصدار رئيسي لنموذج لغوي ضخم (LLM) منذ سنوات يغير فعلياً من التخطيط الأمني التشغيلي، ولا يقتصر فقط على تحسين جودة المحادثة (بناءً على ما رأيته). تركز الكثير من المقالات على ميزة "الاستنتاج الأقوى"، لكن التحول العملي أبسط بكثير: يُعامل Mythos الآن كموظف مبتدئ ومهار يمكنه التخطيط، وكتابة الأكواد، وتنفيذ المهام المتكررة، ومواصلة العمل على المهام الطويلة.

يمكنك نسخ مسارات العمل (Workflows) هذه لتحويل Mythos إلى محرك للفرز الأمني، وأداة لإعادة صياغة الأكواد (Refactoring)، ومساعد للاستجابة للحوادث، دون الحاجة إلى تخمين كيفية تنظيم العمل.

ابدأ بمسار عمل حقيقي في Mythos: فرز الثغرات الأمنية لإنشاء خطة إصلاح

استخدم هذه الموجهات (Prompt) كما هي للحصول على تقرير فرز دقيق يمكن لفريق الهندسة العمل بناءً عليه فعلياً.

Prompt: Repo vulnerability triage with patch plan

text
You are a security engineer. Goal: triage and remediate a suspected vulnerability. Inputs:
- Repo context: [PASTE README OR ARCHITECTURE NOTES]
- Affected component: [FILE PATHS OR MODULE NAMES]
- Finding: [PASTE SCANNER OUTPUT, BUG REPORT, OR STACK TRACE]
- Constraints: must keep backward compatibility, minimal diff preferred. Tasks:
1) Identify the most likely root cause and the vulnerable data flow (sources, transforms, sinks).
2) Provide a risk rating with rationale (impact, likelihood, preconditions).
3) Propose a patch plan with 2 options: - Option A: minimal change hotfix - Option B: safer refactor that reduces future risk
4) For each option, list exact files to change, functions to edit, and new tests to add.
5) Provide a verification checklist that a reviewer can run in CI. Rules:
- If information is missing, ask up to 5 targeted questions first.
- Do not propose exploit steps or offensive payloads. Keep it defensive.
Output format:
- Summary
- Root cause
- Patch plan A
- Patch plan B
- Tests
- Verification checklist

ينجح هذا الأسلوب لأنه يجبر النموذج على التفكير طويل المدى (تخطيط متعدد الخطوات يشمل الأكواد، والاختبارات، والتكامل المستمر CI). كما أنه يمنع المشكلة الشائعة المتمثلة في تقديم الكثير من "النصائح" التي لا تتحول أبداً إلى تغييرات يمكن دمجها (Mergeable change). إن تقييد النموذج بـ "الملفات، والدوال، والاختبارات" هو ما يحوله من مجرد معلق إلى منفذ حقيقي.

إذا تخليت عن هذه القيود، تميل النماذج عادةً إلى إجراء عمليات إعادة كتابة شاملة. ولنكن واقعيين: هذا يخلق صعوبات في المراجعة وتأخيرات، وهي الطريقة التي تموت بها الإصلاحات الأمنية بهدوء في قائمة المهام المتراكمة (Backlog).

مخطط تدفّق عمودي من مدخلات المستودع إلى تتبّع التدفق وتقييم المخاطر ثم خطتي إصلاح واختبارات وقائمة CI

ما هو Claude Mythos Preview، ولماذا يختلف إصداره؟

إذا كنت بحاجة إلى تعريف موجز لأصحاب المصلحة: يُعد Claude Mythos Preview النموذج العام الأكثر تقدماً من Anthropic. ويُصنف كمستوى قدرات يتجاوز Claude Opus 4.6، مع تميز واضح في أمن الحواسيب كنتيجة جانبية لتحسين التخطيط وتنفيذ الأكواد.

إليك ما حدث: أكدت Anthropic وجود النموذج بعد تسريب حدث في مارس 2026 لحوالي 3000 ملف داخلي من قاعدة بيانات غير مهيأة بشكل صحيح. وقد نُسب الفضل في الإبلاغ المسؤول إلى Roy Paz و Alexandre Pauwels. وأوضحت الشركة أن التدريب قد اكتمل وأن تجارب الشركاء جارية. المصدر: تقرير Fortune.

طريقة الإصدار مهمة بقدر أهمية النموذج نفسه. يتم توزيع Mythos ضمن مشروع Glasswing، والذي يُوصف بأنه تحالف يضم أكثر من 40 (وأحياناً أكثر من 45) مؤسسة تقنية وأمنية كبرى للتقييم واختبارات الاختراق (Red-teaming)، بدلاً من الإطلاق العام الفوري. المصدر: بطاقة نظام Anthropic (PDF) و إعلان المعاينة على Google Cloud Vertex AI.

هذا التقييد هو إشارة واضحة جداً للقادة الأمنيين: تتعامل Anthropic مع Mythos كأداة مزدوجة الاستخدام (Dual-use) بشكل افتراضي. ويجب على فرق العمل أن تفعل الشيء نفسه عند استخدامه داخلياً، حتى لو كان استخدامهم دفاعياً بالكامل.

Important

تعامل مع صلاحيات الوصول إلى Mythos وكأنها بيانات اعتماد لبيئة الإنتاج (Production credentials): استخدم مبدأ الصلاحيات الأقل، وقوائم السماح لكل مشروع، وتسجيل السجلات (Logging)، والمخرجات القابلة للمراجعة. لم يعد التفكير بأنه "مجرد LLM" نموذجاً آمناً عندما يكون النظام قادراً على التخطيط والتكرار عبر خطوات متعددة.

طريقة عملية لاختبار "قدرات الوكيل الذكي" دون بناء وكيل

قبل بناء وكلاء (Agents) يستخدمون الأدوات، قم بإجراء تقييم "الوكيل الورقي": يجب على النموذج أن يقترح الخطوات، ونقاط التوقف، والمخرجات (Artifacts) التي سينتجها.

Prompt: Paper-agent evaluation for a security task

text
You are not allowed to run tools. You must act like a planning agent. Goal: [SECURITY GOAL, e.g., "reduce SSRF risk in our URL fetch service"] Context:
- System overview: [PASTE]
- Known issues: [PASTE]
- Constraints: [PASTE] Output:
1) A step-by-step plan with checkpoints every 30-60 minutes of work.
2) For each checkpoint: expected artifacts (PR diff, test cases, dashboards, runbooks).
3) A list of decisions that require human approval.
4) A rollback plan and blast-radius analysis.
5) A final "definition of done" checklist.

يكشف هذا ما إذا كان Mythos قادراً على التخطيط طويل المدى دون الانحراف عن الهدف. النماذج التي تبدو ذكية فقط تميل إلى تخطي المخرجات، وتخطي خطط التراجع (Rollback)، وتخطي نقاط الموافقة البشرية (وبعد ذلك يدفع الجميع الثمن).

إذا كانت الخطة جيدة، يمكنك تحويلها إلى وكيل حقيقي لاحقاً. أما إذا كانت الخطة غامضة، فلن ينقذها منح النموذج صلاحية الوصول إلى الأدوات. الوصول إلى الأدوات سيجعل الخطط الغامضة تفشل بشكل أسرع ببساطة.

مخطط على مكتب مع أيقونات نقاط التحقق والملفات وختم الموافقة وخطة التراجع وصندوق أدوات مقفل

الميزة الأمنية في Mythos: لماذا تتفوق "المهارات الأساسية الأفضل" على "الميزات الأمنية"؟

تشير التقارير باستمرار إلى أن أداء Mythos في الأمن السيبراني ينبع من قدرات عامة أقوى: فهم الأنظمة المعقدة، وإجراء تحليلات متعددة الخطوات، وكتابة الأكواد وتنفيذها، والتكرار عبر التصحيح الذاتي. المصادر: Fortune و بطاقة نظام Anthropic (PDF).

هذا مهم جداً لأن العمل الأمني في معظمه هو عمل "ترابطي": تتبع تدفق البيانات عبر الطبقات، والتوفيق بين السجلات المتضاربة، وربط الإعدادات بسلوك النظام أثناء التشغيل (Runtime)، وكتابة إصلاحات آمنة لا تعطل بيئة الإنتاج. إن النموذج الذي يمكنه الحفاظ على تسلسل الأفكار عبر عشرات الخطوات يغير ثلاثة مسارات عمل فوراً:

يصبح فرز الثغرات أسرع لأن النموذج يمكنه الحفاظ على السياق عبر الوحدات المختلفة (Modules).
تصبح إعادة صياغة الأكواد الآمنة أقل تكلفة لأن النموذج يمكنه اقتراح تغييرات طفيفة (Minimal diffs) بالإضافة إلى الاختبارات.
تصبح الأتمتة الدفاعية واقعية لأن النموذج يمكنه كتابة أكواد تعمل فعلياً.

كما أنه يرفع من سقف القدرات الهجومية. إن تردد Anthropic في إطلاق النموذج للجمهور بشكل واسع هو إشارة إلى أن نفس "المهارات الترابطية" يمكن أن تسرع من اكتشاف الثغرات وتطوير الاستغلالات إذا أُسيء استخدامها. لذلك، يجب أن تكون الضوابط الداخلية واضحة وصريحة، وليست ضمنية.

Warning

لا تطلب من Mythos "إثبات" وجود ثغرة باستخدام حمولات خبيثة (Payloads) أو خطوات استغلال. حتى لو كان هدفك دفاعياً، فقد ينتهي بك الأمر بتوليد محتوى ينتهك السياسات، أو يزيد من المخاطر الداخلية، أو يصبح خطراً عند نسخه ولصقه.

أنماط آمنة قابلة للنسخ: اجعل Mythos ينتج تغييرات يمكنك دمجها

أسرع طريقة للحصول على قيمة حقيقية هي تقييد المخرجات في أجزاء جاهزة لطلبات السحب (PR-ready): تغييرات برمجية صغيرة، واختبارات واضحة، وقائمة تحقق للمراجعة.

Prompt: Secure refactor into a minimal PR

text
You are a senior backend engineer. Produce a minimal, reviewable PR plan. Goal: [E.g., "Remove unsafe deserialization from /api/import"] Repo constraints:
- Language/framework: [E.g., "Node.js + Express"]
- Test framework: [E.g., "Jest"]
- CI: [E.g., "GitHub Actions"]
- Coding standards: [PASTE LINT RULES OR STYLE NOTES] Input code:
[PASTE RELEVANT FILES OR SNIPPETS] Output:
- A minimal diff strategy (avoid rewrites)
- Exact code edits (show before/after snippets)
- 3-5 tests: include one regression test for the vulnerability
- A migration note if behavior changes
- A reviewer checklist
Rules:
- Prefer allowlists over denylists
- Prefer typed parsing and schema validation
- No exploit payloads

يجبر هذا الموجه النموذج على اتخاذ خيارات آمنة بطبيعتها (مثل قوائم السماح، والتحقق من المخطط) مع الحفاظ على صغر حجم التغييرات البرمجية. تُعد التغييرات الصغيرة أداة تحكم أمنية لأن المراجعين يمكنهم فهمها فعلياً. إذا تركت النموذج يعيد كتابة وحدات كاملة، فأنت تستبدل خطراً (ثغرة معروفة) بخطر آخر (تغييرات منطقية غير معروفة).

ونعم، هكذا تتحول "الإصلاحات الأمنية" إلى أسباب لوقوع الحوادث.

كيفية تشغيل Mythos Preview على Vertex AI (معاينة خاصة) مع الحفاظ على إمكانية إدارته

ابدأ بنمط تكامل خاضع للرقابة: حساب خدمة واحد، ومشروع واحد، ومسار تسجيل واحد (Logging sink)، وقائمة سماح واحدة لحالات الاستخدام.

bash
## 1) Authenticate for Google Cloud
gcloud auth login
gcloud config set project [GCP_PROJECT_ID]

# 2) Confirm Vertex AI is enabled
gcloud services enable aiplatform.googleapis.com

# 3) Create a dedicated service account for Mythos calls
gcloud iam service-accounts create mythos-runner \
  --description="Calls Claude Mythos Preview via Vertex AI" \
  --display-name="mythos-runner"

# 4) Grant only what is needed (start tight, expand later)
gcloud projects add-iam-policy-binding [GCP_PROJECT_ID] \
  --member="serviceAccount:mythos-runner@[GCP_PROJECT_ID].iam.gserviceaccount.com" \
  --role="roles/aiplatform.user"

يضع هذا أساساً يجعل الوصول إلى Mythos قابلاً للتدقيق ومنفصلاً عن حسابات المستخدمين البشرية. إن أكثر أخطاء الحوكمة شيوعاً التي رأيتها هو استدعاء النماذج المتقدمة من أجهزة المطورين باستخدام بيانات اعتماد شخصية، مما يجعل التحقيق في الحوادث فوضوياً لاحقاً.

يؤكد إعلان Google توفر Mythos Preview كمعاينة خاصة مقيدة على Vertex AI (بتاريخ 7 أبريل 2026): Claude Mythos Preview على Vertex AI. إذا كنت تقيم الوصول أيضاً عبر Amazon Bedrock، فحافظ على نفس مستوى الضوابط: أدوار IAM منفصلة، وقوائم سماح واضحة للنماذج، وتسجيل مركزي للسجلات.

الهدف هو جعل الإجابة على سؤال "من طلب ماذا؟" ممكنة في دقائق، وليس في أيام.

بناء مسار آمن لـ "المساعد الأمني": لخص، صنف، ثم نفذ

النمط الموثوق هو سلسلة من 3 مراحل حيث لا يحصل Mythos أبداً على أسرار خام (Raw secrets) ولا ينفذ التغييرات مباشرة دون بوابة موافقة.

python
from dataclasses import dataclass
from typing import Literal

Severity = Literal["low", "medium", "high", "critical"]

@dataclass
class Finding:
    title: str
    summary: str
    severity: Severity
    affected_components: list[str]
    recommended_actions: list[str]

def redact(text: str) -> str:
    # Replace obvious secret patterns before sending to any LLM.
    # Extend this with your org's detectors (API keys, JWTs, private keys).
    text = text.replace("-----BEGIN PRIVATE KEY-----", "[REDACTED_PRIVATE_KEY]")
    return text

def gate_actions(finding: Finding) -> bool:
    # Human approval gate: require review for high/critical.
    return finding["severity"] in ("low", "medium")

السطر الأهم ليس التشفير (Redaction) بحد ذاته. بل حقيقة أن التشفير موجود كمرحلة إلزامية في مسار العمل. الفرق التي تتخطى هذه الخطوة ينتهي بها الأمر دائماً تقريباً بلصق بيانات الحوادث التي تحتوي على رموز (Tokens)، أو أسماء مضيفين داخلية، أو معرفات عملاء داخل الموجهات (عادةً عن طريق الخطأ، وليس بسوء نية).

لاحظ أيضاً بوابة الموافقة. حتى لو كان بإمكان Mythos اقتراح إصلاح، فإن تغييرات بيئة الإنتاج لا تزال بحاجة إلى حدود يتحكم فيها الإنسان. هذه هي أبسط طريقة للحصول على سرعة الوكيل الذكي دون تحمل مخاطره.

لمزيد من المعلومات حول بناء مسارات عمل مستقلة بأمان، راجع دليلنا حول الذكاء الاصطناعي الوكيلي في 2026: زملاء العمل المستقلون من الذكاء الاصطناعي.

مخطط بثلاث مراحل: تنقيح الأسرار ثم تصنيف عبر النموذج ثم بوابة موافقة بشرية، مع سجل مركزي جانبي

جدول مقارنة: أين يغير Mythos القرارات مقارنة بالنماذج المتقدمة التقليدية

مجال القدرات	ما تفعله الفرق اليوم	ما يتيحه Mythos Preview	المخاطر التشغيلية إذا لم تتم إدارتها
التخطيط طويل المدى	تقسيم العمل إلى العديد من التذاكر التي يديرها البشر	تسليمات أقل، وخطط شاملة أوضح مع مخرجات	يمكن للخطط التي يقودها النموذج تجاوز معايير المراجعة
تنفيذ الأكواد الآمنة	استخدام نماذج LLM للمقتطفات والشروحات	تغييرات بحجم طلبات السحب (PR) مع اختبارات وخطوات تحقق	التغييرات الكبيرة يمكن أن تخفي تراجعات منطقية (Logic regressions)
الفرز الأمني	يربط المحللون بين الماسحات الضوئية والسجلات والأكواد يدوياً	تحليل أسرع للأسباب الجذرية عبر الوحدات	يمكن أن تتسرب البيانات الحساسة إلى الموجهات
الأتمتة الدفاعية	نصوص برمجية (Scripts) يكتبها البشر، وتكرار بطيء	مسودات أدوات وخطط استجابة (Playbooks) تكرارية	يمكن للأتمتة أن تضاعف الأخطاء
التعرض للاستخدام المزدوج	نماذج عامة ذات وصول واسع	وصول مقيد عبر التحالفات والبوابات السحابية	إساءة الاستخدام الداخلي ومخاطر نسخ ولصق الموجهات

لهذا السبب لا يُعد Mythos "مجرد ترقية أخرى لنموذج". إنه يغير مقدار العمل الذي يمكن تفويضه مقابل كل وحدة من الإشراف.

شبكة مقارنة بعمودين تُظهر اليوم مقابل ما يتيحه Mythos عبر التخطيط والترميز والتحليل والأتمتة ومخاطر الوصول

المشاكل الشائعة التي تواجهها الفرق في تجارب Mythos (والحلول الفعالة)

انحراف الموجه (Prompt drift) هو المشكلة الأولى. تتسبب المهام الطويلة في قيام النموذج بـ "التحسين" بهدوء لصالح السرد بدلاً من المخرجات (ولن تلاحظ ذلك إلا بعد قضاء 20 دقيقة في قراءة قصة).

Prompt: Anti-drift output contract

text
You must produce only these artifacts, in this order:
1) File change list (paths only)
2) Patch plan (bullets, max 12)
3) Test plan (bullets, max 10)
4) Verification checklist (checkboxes)

If you cannot complete an artifact, write "BLOCKED: [reason]" and ask 1 question.
Do not add any other text.

ينجح هذا الأسلوب لأنه يحول المخرجات إلى عقد ملزم. ويصبح الانحراف واضحاً في اللحظة التي يختفي فيها أي مُخرج.

المشكلة الثانية هي الثقة الزائفة في الادعاءات الأمنية. يمكن أن تبدو النماذج واثقة بشأن فئة ثغرة معينة حتى عندما يكون مسار الكود خاطئاً. الحل الفعال عملياً هو طلب "دليل تتبع": يجب على النموذج أن يستشهد بتبرير على مستوى السطر من الكود المقدم ويحدد نقطة النهاية (Sink) بدقة. وإذا لم يتمكن من ذلك، فعليه طلب الملف المفقود.

المشكلة الثالثة هي "حمى إعادة الكتابة". يمكن أن تغري قدرات البرمجة في Mythos الفرق بقبول عمليات إعادة صياغة كبيرة. حافظ على قاعدة صارمة: يجب أن تكون طلبات السحب (PRs) الأمنية صغيرة ما لم تكن هناك خطة انتقال وتراجع مكتوبة. هذه القاعدة مملة، لكنها تمنع الفئة الأكثر تكلفة من أخطاء الإصلاح.

ما يعنيه "مشروع Glasswing" لتبني الشركات للنموذج

يُعد مشروع Glasswing (الذي يضم أكثر من 40 مؤسسة) اعترافاً فعلياً بأن التقييم يجب أن يشمل اختبارات اختراق حقيقية (Adversarial testing)، وليس فقط درجات التقييم المعيارية (Benchmark scores). المصادر: إعلان Google Cloud و بطاقة نظام Anthropic (PDF).

يمكن للشركات محاكاة هذا النهج من خلال إنشاء "Glasswing مصغر" داخلياً:

فريق أحمر (Red team) يحاول استخراج مخرجات تنتهك السياسات وسلوكيات تسريب البيانات.
فريق أزرق (Blue team) يقيس وقت الفرز وجودة الإصلاحات بناءً على مشكلات تاريخية حقيقية.
فريق منصة يفرض التسجيل، والتشفير، وحدود الوصول.

إذا كان التقييم يقتصر على "هل يجيب على الأسئلة بشكل جيد؟"، فستفقد المؤسسة القيمة الحقيقية والمخاطر الحقيقية.

هناك نقطة سياقية أخرى مهمة: تشير التغطيات إلى أن Anthropic اكتشفت مجموعة مدعومة من الحكومة الصينية تستخدم Claude Code لاستهداف حوالي 30 مؤسسة، وهذا جزء من سبب التعامل مع قدرات Mythos السيبرانية بحساسية غير عادية. المصدر: Fortune.

نقاط بيانات من دراسات الحالة: كيف يبدو "الوكيل الذكي + البرمجة" عملياً

قللت Stripe من وقت حل الحوادث بنسبة 42% من خلال توحيد خطط الاستجابة (Runbooks) وأتمتة خطوات الفرز في الاستجابة الأولى. هذا الرقم مأخوذ من النقاشات الهندسية المنشورة لشركة Stripe ومحادثات أدوات الحوادث، وهو المعيار الذي تستخدمه العديد من الفرق لتبرير ميزانيات الأتمتة.

زادت Netflix من وتيرة النشر (Deployment) بمقدار الضعف بعد التركيز على المسارات الممهدة، والاختبارات الآلية، وعمليات التراجع الأكثر أماناً، وهو نفس الأساس الهندسي الذي يحتاجه Mythos ليكون مفيداً دون أن يكون خطيراً.

حسّنت Spotify متوسط وقت التعافي بنسبة 30% بعد الاستثمار في قابلية المراقبة (Observability) ومسارات عمل المناوبة (On-call)، وهو الشرط الأساسي ليكون أي فرز يقوده النموذج جديراً بالثقة.

هذه ليست "نتائج Mythos". بل هي الأساسيات التشغيلية التي تحدد ما إذا كان Mythos سيصبح قوة مضاعفة للإنتاجية أم مجرد مصدر آخر للإزعاج.

المتطلبات الأساسية: ما يجب تجهيزه قبل منح Mythos صلاحية الوصول إلى الأنظمة الحقيقية

جهّز هذه الأمور، وعادةً ما ستتقدم تجارب Mythos بسرعة:

جزء ممثل ومنقح من قاعدة الأكواد للتقييم.
سجل للحوادث السابقة وتذاكر الثغرات مع إصلاحاتها النهائية.
سياسة تسجيل للموجهات والمخرجات، مع قواعد للاحتفاظ بها.
استراتيجية تشفير للأسرار وبيانات العملاء.
عملية موافقة بشرية لأي تغيير قد يمس بيئة الإنتاج.

إذا تخطيت هذه الخطوات، فستتحول التجربة إلى بيئة تجريبية (Demo) لن تترجم أبداً إلى قيمة حقيقية في بيئة الإنتاج.

للحصول على عقلية مقارنة النماذج عبر مختلف المزودين، راجع نظرتنا العامة حول Google Gemini 3.1 Pro في 2026: الميزات وطريقة الاستخدام.

خطوات عملية

ابدأ من هنا (خطوتك الأولى)

قم بإجراء تقييم "الوكيل الورقي" لـ Mythos لمدة ساعتين على تذكرة أمنية مغلقة، وقم بتقييمه بناءً على جودة المخرجات (الملفات، الاختبارات، التحقق).

مكاسب سريعة (تأثير فوري)

أنشئ فلتر تشفير يستبدل المفاتيح الخاصة، والرموز، ومعرفات العملاء قبل إرسال الموجهات، ثم افرضه في خدمة الاستدعاء هذا الأسبوع.
وحّد قالب موجه فرز واحد لنتائج الماسحات الضوئية واطلب مخرجات تتضمن "ملفات + اختبارات + قائمة تحقق" في كل عملية تشغيل.

تعمق أكثر (لمن يريد المزيد)

قم بإعداد تكامل مقيد لـ Mythos باستخدام حساب خدمة مخصص، وتسجيل مركزي، وقوائم سماح لكل مشروع، ثم قم بتشغيل برنامج تجريبي لمدة أسبوعين مع فرق الأمن والمنصة.
ابنِ تقييم فريق أحمر داخلي "Glasswing مصغر": 20 اختباراً لموجهات هجومية بالإضافة إلى إعادة إنتاج 10 ثغرات تاريخية، وتتبعها في بطاقة أداء مشتركة.

موارد مفيدة

Claude Mythos Preview على Vertex AI | مدونة Google Cloud - الإعلان الرسمي وتفاصيل المعاينة.
بطاقة نظام Claude Mythos Preview (PDF) | Anthropic - نتائج السلامة، والتخفيف من المخاطر، وإطار التقييم.
Claude Mythos Preview | red.anthropic.com - صفحة المعاينة الرسمية من Anthropic.
Fortune: Anthropic تؤكد اختبار Mythos بعد التسريب - تقرير حول التسريب، والتأكيد، ومخاوف الاستخدام المزدوج.

أهم النقاط

يتم وضع Claude Mythos Preview كمستوى جديد من الاستنتاج الوكيلي (Agentic reasoning) بالإضافة إلى تنفيذ برمجي عالي المستوى، مع أداء قوي بشكل استثنائي في الأمن السيبراني ينبع من القدرات الأساسية، وليس من مجموعة ميزات ضيقة.

إن الإصدار الخاضع للرقابة من خلال مشروع Glasswing والمعاينات السحابية المقيدة هو أوضح إشارة على أن الشركات يجب أن تتعامل معه كأداة مزدوجة الاستخدام وتديره كمشغل داخلي قوي. وتحصل الفرق على أفضل النتائج من خلال إجبار النموذج على تقديم مخرجات جاهزة لطلبات السحب (PR-ready): تغييرات طفيفة، واختبارات واضحة، وقوائم تحقق للمراجعة.

أسرع مسار آمن (في معظم المؤسسات) هو التكامل المقيد مع التشفير، والتسجيل، وحدود الموافقة البشرية، يليه برنامج تجريبي يُقيّم بناءً على نتائج قابلة للقياس مثل وقت الفرز ومعدل قبول الإصلاحات.

هل تحتاج إلى مساعدة في تنفيذ برنامج تجريبي مُدار لـ Mythos، وعقود الموجهات، ومسارات الأتمتة الدفاعية؟ يمكن لشركة Joulyan IT Solutions دعم تكامل الذكاء الاصطناعي وأتمتة مسارات العمل باستخدام ضوابط متوافقة مع متطلبات التدقيق.

المواضيع

Claude Mythosالذكاء الاصطناعيالأمن السيبرانيأتمتة المهامنماذج لغوية

شارك هذا المقال

Claude Mythos Preview: ثورة الذكاء الاصطناعي في الأمن

8 Apr 20262 دقائق قراءةJoulyan IT

ابدأ بمسار عمل حقيقي في Mythos: فرز الثغرات الأمنية لإنشاء خطة إصلاح

استخدم هذه الموجهات (Prompt) كما هي للحصول على تقرير فرز دقيق يمكن لفريق الهندسة العمل بناءً عليه فعلياً.

Prompt: Repo vulnerability triage with patch plan

text
You are a security engineer. Goal: triage and remediate a suspected vulnerability. Inputs:
- Repo context: [PASTE README OR ARCHITECTURE NOTES]
- Affected component: [FILE PATHS OR MODULE NAMES]
- Finding: [PASTE SCANNER OUTPUT, BUG REPORT, OR STACK TRACE]
- Constraints: must keep backward compatibility, minimal diff preferred. Tasks:
1) Identify the most likely root cause and the vulnerable data flow (sources, transforms, sinks).
2) Provide a risk rating with rationale (impact, likelihood, preconditions).
3) Propose a patch plan with 2 options: - Option A: minimal change hotfix - Option B: safer refactor that reduces future risk
4) For each option, list exact files to change, functions to edit, and new tests to add.
5) Provide a verification checklist that a reviewer can run in CI. Rules:
- If information is missing, ask up to 5 targeted questions first.
- Do not propose exploit steps or offensive payloads. Keep it defensive.
Output format:
- Summary
- Root cause
- Patch plan A
- Patch plan B
- Tests
- Verification checklist

مخطط تدفّق عمودي من مدخلات المستودع إلى تتبّع التدفق وتقييم المخاطر ثم خطتي إصلاح واختبارات وقائمة CI

ما هو Claude Mythos Preview، ولماذا يختلف إصداره؟

Important

طريقة عملية لاختبار "قدرات الوكيل الذكي" دون بناء وكيل

Prompt: Paper-agent evaluation for a security task

text
You are not allowed to run tools. You must act like a planning agent. Goal: [SECURITY GOAL, e.g., "reduce SSRF risk in our URL fetch service"] Context:
- System overview: [PASTE]
- Known issues: [PASTE]
- Constraints: [PASTE] Output:
1) A step-by-step plan with checkpoints every 30-60 minutes of work.
2) For each checkpoint: expected artifacts (PR diff, test cases, dashboards, runbooks).
3) A list of decisions that require human approval.
4) A rollback plan and blast-radius analysis.
5) A final "definition of done" checklist.

مخطط على مكتب مع أيقونات نقاط التحقق والملفات وختم الموافقة وخطة التراجع وصندوق أدوات مقفل

الميزة الأمنية في Mythos: لماذا تتفوق "المهارات الأساسية الأفضل" على "الميزات الأمنية"؟

يصبح فرز الثغرات أسرع لأن النموذج يمكنه الحفاظ على السياق عبر الوحدات المختلفة (Modules).
تصبح إعادة صياغة الأكواد الآمنة أقل تكلفة لأن النموذج يمكنه اقتراح تغييرات طفيفة (Minimal diffs) بالإضافة إلى الاختبارات.
تصبح الأتمتة الدفاعية واقعية لأن النموذج يمكنه كتابة أكواد تعمل فعلياً.

Warning

أنماط آمنة قابلة للنسخ: اجعل Mythos ينتج تغييرات يمكنك دمجها

Prompt: Secure refactor into a minimal PR

text
You are a senior backend engineer. Produce a minimal, reviewable PR plan. Goal: [E.g., "Remove unsafe deserialization from /api/import"] Repo constraints:
- Language/framework: [E.g., "Node.js + Express"]
- Test framework: [E.g., "Jest"]
- CI: [E.g., "GitHub Actions"]
- Coding standards: [PASTE LINT RULES OR STYLE NOTES] Input code:
[PASTE RELEVANT FILES OR SNIPPETS] Output:
- A minimal diff strategy (avoid rewrites)
- Exact code edits (show before/after snippets)
- 3-5 tests: include one regression test for the vulnerability
- A migration note if behavior changes
- A reviewer checklist
Rules:
- Prefer allowlists over denylists
- Prefer typed parsing and schema validation
- No exploit payloads

ونعم، هكذا تتحول "الإصلاحات الأمنية" إلى أسباب لوقوع الحوادث.

كيفية تشغيل Mythos Preview على Vertex AI (معاينة خاصة) مع الحفاظ على إمكانية إدارته

bash
## 1) Authenticate for Google Cloud
gcloud auth login
gcloud config set project [GCP_PROJECT_ID]

# 2) Confirm Vertex AI is enabled
gcloud services enable aiplatform.googleapis.com

# 3) Create a dedicated service account for Mythos calls
gcloud iam service-accounts create mythos-runner \
  --description="Calls Claude Mythos Preview via Vertex AI" \
  --display-name="mythos-runner"

# 4) Grant only what is needed (start tight, expand later)
gcloud projects add-iam-policy-binding [GCP_PROJECT_ID] \
  --member="serviceAccount:mythos-runner@[GCP_PROJECT_ID].iam.gserviceaccount.com" \
  --role="roles/aiplatform.user"

الهدف هو جعل الإجابة على سؤال "من طلب ماذا؟" ممكنة في دقائق، وليس في أيام.

بناء مسار آمن لـ "المساعد الأمني": لخص، صنف، ثم نفذ

python
from dataclasses import dataclass
from typing import Literal

Severity = Literal["low", "medium", "high", "critical"]

@dataclass
class Finding:
    title: str
    summary: str
    severity: Severity
    affected_components: list[str]
    recommended_actions: list[str]

def redact(text: str) -> str:
    # Replace obvious secret patterns before sending to any LLM.
    # Extend this with your org's detectors (API keys, JWTs, private keys).
    text = text.replace("-----BEGIN PRIVATE KEY-----", "[REDACTED_PRIVATE_KEY]")
    return text

def gate_actions(finding: Finding) -> bool:
    # Human approval gate: require review for high/critical.
    return finding["severity"] in ("low", "medium")

مخطط بثلاث مراحل: تنقيح الأسرار ثم تصنيف عبر النموذج ثم بوابة موافقة بشرية، مع سجل مركزي جانبي

جدول مقارنة: أين يغير Mythos القرارات مقارنة بالنماذج المتقدمة التقليدية

مجال القدرات	ما تفعله الفرق اليوم	ما يتيحه Mythos Preview	المخاطر التشغيلية إذا لم تتم إدارتها
التخطيط طويل المدى	تقسيم العمل إلى العديد من التذاكر التي يديرها البشر	تسليمات أقل، وخطط شاملة أوضح مع مخرجات	يمكن للخطط التي يقودها النموذج تجاوز معايير المراجعة
تنفيذ الأكواد الآمنة	استخدام نماذج LLM للمقتطفات والشروحات	تغييرات بحجم طلبات السحب (PR) مع اختبارات وخطوات تحقق	التغييرات الكبيرة يمكن أن تخفي تراجعات منطقية (Logic regressions)
الفرز الأمني	يربط المحللون بين الماسحات الضوئية والسجلات والأكواد يدوياً	تحليل أسرع للأسباب الجذرية عبر الوحدات	يمكن أن تتسرب البيانات الحساسة إلى الموجهات
الأتمتة الدفاعية	نصوص برمجية (Scripts) يكتبها البشر، وتكرار بطيء	مسودات أدوات وخطط استجابة (Playbooks) تكرارية	يمكن للأتمتة أن تضاعف الأخطاء
التعرض للاستخدام المزدوج	نماذج عامة ذات وصول واسع	وصول مقيد عبر التحالفات والبوابات السحابية	إساءة الاستخدام الداخلي ومخاطر نسخ ولصق الموجهات

شبكة مقارنة بعمودين تُظهر اليوم مقابل ما يتيحه Mythos عبر التخطيط والترميز والتحليل والأتمتة ومخاطر الوصول

المشاكل الشائعة التي تواجهها الفرق في تجارب Mythos (والحلول الفعالة)

Prompt: Anti-drift output contract

text
You must produce only these artifacts, in this order:
1) File change list (paths only)
2) Patch plan (bullets, max 12)
3) Test plan (bullets, max 10)
4) Verification checklist (checkboxes)

If you cannot complete an artifact, write "BLOCKED: [reason]" and ask 1 question.
Do not add any other text.

ينجح هذا الأسلوب لأنه يحول المخرجات إلى عقد ملزم. ويصبح الانحراف واضحاً في اللحظة التي يختفي فيها أي مُخرج.

ما يعنيه "مشروع Glasswing" لتبني الشركات للنموذج

يمكن للشركات محاكاة هذا النهج من خلال إنشاء "Glasswing مصغر" داخلياً:

فريق أحمر (Red team) يحاول استخراج مخرجات تنتهك السياسات وسلوكيات تسريب البيانات.
فريق أزرق (Blue team) يقيس وقت الفرز وجودة الإصلاحات بناءً على مشكلات تاريخية حقيقية.
فريق منصة يفرض التسجيل، والتشفير، وحدود الوصول.

إذا كان التقييم يقتصر على "هل يجيب على الأسئلة بشكل جيد؟"، فستفقد المؤسسة القيمة الحقيقية والمخاطر الحقيقية.

نقاط بيانات من دراسات الحالة: كيف يبدو "الوكيل الذكي + البرمجة" عملياً

المتطلبات الأساسية: ما يجب تجهيزه قبل منح Mythos صلاحية الوصول إلى الأنظمة الحقيقية

جهّز هذه الأمور، وعادةً ما ستتقدم تجارب Mythos بسرعة:

جزء ممثل ومنقح من قاعدة الأكواد للتقييم.
سجل للحوادث السابقة وتذاكر الثغرات مع إصلاحاتها النهائية.
سياسة تسجيل للموجهات والمخرجات، مع قواعد للاحتفاظ بها.
استراتيجية تشفير للأسرار وبيانات العملاء.
عملية موافقة بشرية لأي تغيير قد يمس بيئة الإنتاج.

إذا تخطيت هذه الخطوات، فستتحول التجربة إلى بيئة تجريبية (Demo) لن تترجم أبداً إلى قيمة حقيقية في بيئة الإنتاج.

خطوات عملية

ابدأ من هنا (خطوتك الأولى)

مكاسب سريعة (تأثير فوري)

أنشئ فلتر تشفير يستبدل المفاتيح الخاصة، والرموز، ومعرفات العملاء قبل إرسال الموجهات، ثم افرضه في خدمة الاستدعاء هذا الأسبوع.
وحّد قالب موجه فرز واحد لنتائج الماسحات الضوئية واطلب مخرجات تتضمن "ملفات + اختبارات + قائمة تحقق" في كل عملية تشغيل.

تعمق أكثر (لمن يريد المزيد)

قم بإعداد تكامل مقيد لـ Mythos باستخدام حساب خدمة مخصص، وتسجيل مركزي، وقوائم سماح لكل مشروع، ثم قم بتشغيل برنامج تجريبي لمدة أسبوعين مع فرق الأمن والمنصة.
ابنِ تقييم فريق أحمر داخلي "Glasswing مصغر": 20 اختباراً لموجهات هجومية بالإضافة إلى إعادة إنتاج 10 ثغرات تاريخية، وتتبعها في بطاقة أداء مشتركة.

موارد مفيدة

Claude Mythos Preview على Vertex AI | مدونة Google Cloud - الإعلان الرسمي وتفاصيل المعاينة.
بطاقة نظام Claude Mythos Preview (PDF) | Anthropic - نتائج السلامة، والتخفيف من المخاطر، وإطار التقييم.
Claude Mythos Preview | red.anthropic.com - صفحة المعاينة الرسمية من Anthropic.
Fortune: Anthropic تؤكد اختبار Mythos بعد التسريب - تقرير حول التسريب، والتأكيد، ومخاوف الاستخدام المزدوج.

أهم النقاط

المواضيع

Claude Mythosالذكاء الاصطناعيالأمن السيبرانيأتمتة المهامنماذج لغوية

Claude Mythos Preview: ثورة الذكاء الاصطناعي في الأمن

ابدأ بمسار عمل حقيقي في Mythos: فرز الثغرات الأمنية لإنشاء خطة إصلاح

ما هو Claude Mythos Preview، ولماذا يختلف إصداره؟

طريقة عملية لاختبار "قدرات الوكيل الذكي" دون بناء وكيل

الميزة الأمنية في Mythos: لماذا تتفوق "المهارات الأساسية الأفضل" على "الميزات الأمنية"؟

أنماط آمنة قابلة للنسخ: اجعل Mythos ينتج تغييرات يمكنك دمجها

كيفية تشغيل Mythos Preview على Vertex AI (معاينة خاصة) مع الحفاظ على إمكانية إدارته

بناء مسار آمن لـ "المساعد الأمني": لخص، صنف، ثم نفذ

جدول مقارنة: أين يغير Mythos القرارات مقارنة بالنماذج المتقدمة التقليدية

المشاكل الشائعة التي تواجهها الفرق في تجارب Mythos (والحلول الفعالة)

ما يعنيه "مشروع Glasswing" لتبني الشركات للنموذج

نقاط بيانات من دراسات الحالة: كيف يبدو "الوكيل الذكي + البرمجة" عملياً

المتطلبات الأساسية: ما يجب تجهيزه قبل منح Mythos صلاحية الوصول إلى الأنظمة الحقيقية

خطوات عملية

موارد مفيدة

أهم النقاط

المواضيع

شارك هذا المقال

مقالات ذات صلة

حقيقة تفوق اليابان على Claude Mythos في الذكاء الاصطناعي

إطلاق OpenAI GPT-5.6: مقارنة نماذج Sol وTerra وLuna

صعود Agentic AI في 2026: لماذا يتفوق على روبوتات الدردشة؟

Claude Mythos Preview: ثورة الذكاء الاصطناعي في الأمن

ابدأ بمسار عمل حقيقي في Mythos: فرز الثغرات الأمنية لإنشاء خطة إصلاح

ما هو Claude Mythos Preview، ولماذا يختلف إصداره؟

طريقة عملية لاختبار "قدرات الوكيل الذكي" دون بناء وكيل

الميزة الأمنية في Mythos: لماذا تتفوق "المهارات الأساسية الأفضل" على "الميزات الأمنية"؟

أنماط آمنة قابلة للنسخ: اجعل Mythos ينتج تغييرات يمكنك دمجها

كيفية تشغيل Mythos Preview على Vertex AI (معاينة خاصة) مع الحفاظ على إمكانية إدارته

بناء مسار آمن لـ "المساعد الأمني": لخص، صنف، ثم نفذ

جدول مقارنة: أين يغير Mythos القرارات مقارنة بالنماذج المتقدمة التقليدية

المشاكل الشائعة التي تواجهها الفرق في تجارب Mythos (والحلول الفعالة)

ما يعنيه "مشروع Glasswing" لتبني الشركات للنموذج

نقاط بيانات من دراسات الحالة: كيف يبدو "الوكيل الذكي + البرمجة" عملياً

المتطلبات الأساسية: ما يجب تجهيزه قبل منح Mythos صلاحية الوصول إلى الأنظمة الحقيقية

خطوات عملية

موارد مفيدة

أهم النقاط

المواضيع

شارك هذا المقال

مقالات ذات صلة

حقيقة تفوق اليابان على Claude Mythos في الذكاء الاصطناعي

إطلاق OpenAI GPT-5.6: مقارنة نماذج Sol وTerra وLuna

صعود Agentic AI في 2026: لماذا يتفوق على روبوتات الدردشة؟