نموذج GLM 4.7: هل نقترب من جيل يفهم احتياجات المستخدمين

د. مصطفى جودت صالح

شهد عام 2025 تسارعًا غير مسبوق في ثورة النماذج اللغوية الكبيرة، حيث انتقلت هذه النماذج من كونها أدوات مساعدة للإجابة وتوليد النصوص إلى أنظمة معرفية تشاركية قادرة على التحليل، والاستدلال، ودعم اتخاذ القرار. لم يعد التميز قائمًا على حجم النموذج فقط، بل على جودة الفهم السياقي، وإدارة السياقات الطويلة، والقدرة على الدمج بين النص، والبيانات، والبرمجة، والتفاعل متعدد الوسائط. في هذا العام، أصبح الذكاء الاصطناعي شريكًا فعليًا في مجالات مثل تطوير البرمجيات، البحث العلمي، التعليم، وصناعة المحتوى، مع تركيز متزايد على التخصيص، والموثوقية، وتقليل “الهلوسة” لصالح استجابات مبنية على منطق واضح وسلاسل استدلال يمكن تتبعها.

أما في 2026، فتتجه النماذج اللغوية نحو مرحلة أكثر نضجًا، حيث يُتوقع أن تتحول من أنظمة عامة إلى نماذج متخصصة ومتكيفة مع السياق المؤسسي. سيزداد الاعتماد على نماذج هجينة تجمع بين المعرفة العامة وقواعد بيانات خاصة، مع قدرة أعلى على التعلم أثناء الاستخدام (In-context Learning) دون إعادة تدريب كامل. كما ستبرز اتجاهات مثل وكلاء الذكاء الاصطناعي (AI Agents)، والنماذج القادرة على التخطيط متعدد الخطوات، والتكامل العميق مع سير العمل اليومي، لا سيما في التعليم الذكي، وإدارة المعرفة، والابتكار المؤسسي. وبذلك، لن يكون التطور القادم في “ذكاء الإجابة”، بل في ذكاء الفعل واتخاذ القرار.

وفي هذا الصدد، لم يعد السباق في عالم النماذج اللغوية يدور حول من يكتب أسرع أو أطول، بل حول من يفهم أعمق. فمع التشبع المتزايد بالنماذج اللغوية “الجاهزة”، بدأ يظهر سؤال جوهري:
هل هذه النماذج تفكر فعلًا، أم أنها فقط تعيد تركيب اللغة بذكاء؟ وللإجابة على هذا السؤال نستعض نموذج GLM 4.7 .

GLM 4.7

ولعل مما يلفت الانتباه ظهور نموذج جديد يحمل اسم GLM 4.7، وهو إصدار يقدّم نفسه كخطوة نحو نماذج أكثر نضجًا معرفيًا، وأقل اعتمادًا على الإجابات النمطية. حيث يُعد GLM‑4.7 أحدث نموذج رئيسي من شركة Zhipu AI، وقد جاء ليقدّم قفزة نوعية في قدرات البرمجة، التفكير العميق، وتنفيذ المهام متعددة الخطوات. يتميز النموذج بآلية جديدة تُسمّى Preserved Thinking، وهي تقنية تسمح للنموذج بالحفاظ على سلاسل التفكير والمنطق عبر جلسات العمل الطويلة، مما يقلل من فقدان السياق ويعزز أداء الوكلاء الذكيين في المهام المعقدة. كما يقدّم النموذج تحسينات كبيرة في الاستدلال الرياضي والمنطقي، محققًا نتائج متقدمة في اختبارات مثل AIME وHLE مقارنة بالإصدارات السابقة.

من ناحية القدرات التقنية، يأتي GLM‑4.7 بسياق طويل يصل إلى 200 ألف رمز، مع دعم إخراج يصل إلى 128 ألف رمز، مما يجعله مناسبًا لتحليل المستندات الكبيرة، تطوير التطبيقات، وبناء حلول تعتمد على تعدد الأدوات والتكاملات البرمجية. كما يعزز النموذج قدراته في البرمجة متعددة اللغات، ويحقق أداءً قويًا على معايير SWE‑Bench وTerminal Bench، متفوقًا بوضوح على الإصدار GLM‑4.6 ومقتربًا من نماذج رائدة مثل GPT‑5.1 وClaude Sonnet 4.5.

إضافة إلى ذلك، يركز GLM‑4.7 على دعم الوكلاء البرمجيين (Agentic Coding)، حيث لا يكتفي بتوليد كود منفصل، بل يقوم بفهم المتطلبات، تقسيم الحلول، وبناء أطر عمل كاملة قابلة للتنفيذ تشمل الواجهة الأمامية والخلفية والأجهزة الطرفية عند الحاجة. كما يقدم تحسينات ملحوظة في إنشاء واجهات الويب، الجماليات البصرية، والتكامل بين الرؤية واللغة، مما يجعله خيارًا قويًا للمطورين، الباحثين، والمؤسسات التي تحتاج إلى نموذج مفتوح الوزن عالي الكفاءة.

GLM 4.7
مقارنة شاملة لأداء عدد من النماذج اللغوية الكبيرة في ثمانية معايير قياس رئيسية تغطي مجالات الاستدلال، والبرمجة، والعمل الوكيلي (Agentic)، واستخدام الأدوات، GLM 4.7
https://ollama.com/library/glm-4.7

يوضح الإنفوجرافك السابق مقارنة شاملة لأداء عدد من النماذج اللغوية الكبيرة في ثمانية معايير قياس رئيسية تغطي مجالات الاستدلال، والبرمجة، والعمل الوكيلي (Agentic)، واستخدام الأدوات، وذلك تحت طول سياق يصل إلى 128 ألف رمز. تظهر المقارنة تفوق GLM-4.7 بوضوح على الإصدار السابق GLM-4.6 وعلى نماذج منافسة مثل DeepSeek-V3.2 وClaude Sonnet 4.5 وGPT-5.1 (High)، خاصة في اختبارات التفكير الرياضي والمنطقي مثل AIME 25 و GPQA-Diamond، ما يعكس تحسنًا ملحوظًا في قدرات الاستدلال العميق وفهم المسائل المعقدة.

في جانب البرمجة والعمل التطبيقي، يحقق GLM-4.7 نتائج قوية في معايير مثل LiveCodeBench v6 و SWE-bench Verified و Terminal Bench 2.0، متقدمًا على معظم النماذج الأخرى، لا سيما في المهام التي تتطلب تنفيذًا فعليًا للأوامر والتفاعل مع بيئات الطرفية. هذا يشير إلى نضج النموذج في سيناريوهات “البرمجة الوكيلية” التي تتجاوز مجرد توليد الشيفرة إلى التخطيط والتنفيذ والتصحيح، وهو مجال بالغ الأهمية لتطوير أدوات المطورين والمساعدين الأذكياء.

أما في اختبارات استخدام الأدوات والتصفح وإدارة السياق مثل τ²-Bench و BrowseComp و HLE، فيبرز GLM-4.7 كأحد أفضل النماذج أداءً، خصوصًا عند تفعيل أدوات المساعدة وإدارة السياق الطويل. تعكس هذه النتائج قدرة النموذج على العمل بكفاءة في مهام واقعية متعددة الخطوات، مثل البحث، واتخاذ القرار، وربط المعلومات عبر سياقات طويلة، مما يجعله مناسبًا لتطبيقات متقدمة في التعليم الرقمي، والبحث، وبناء الأنظمة الذكية المعتمدة على الذكاء الاصطناعي.

عن د مصطفى جودت

أستاذ تكنولوجيا التعليم المشارك بجامعة الملك سعود ، وجامعة حلوان مدير تطوير المحتوى الرقمي بجامعة الملك سعود
error: Content is protected !!