مرجعة : د. مصطفى جودت صالح
يهدف المقال الحالي لعمل مراجعة أكاديمية للورقة البحثية “Prompt Engineering” للمؤلفة Lee Boonstra والتي صدرت في شكل كتاب بنفس الاسم من Google. ويهدف هذا العمل إلى تقديم دليل شامل حول هندسة الأوامر Prompt Engineering للمساعدة في توجيه نماذج اللغة الكبيرة (LLMs) لإنتاج مخرجات دقيقة وفعالة. ورغم تعدد كتب هندسة الأوامر إلا أن قيمة العمل الحقيقية أن ناشره هو شركة جوجل Google والتي راعت فيه أن تبنى تلك الأوامر على نماذجها اللغوية المدعومة.
أكد العمل في مقدمته على أن كتابة الأوامر أو المطالبات للأنظمة اللغوية يمكن أن تكون معقدة، وأن العديد من العوامل تؤثر على فعاليتها، بما في ذلك النموذج المستخدم، بيانات التدريب، إعدادات النموذج، اختيار الكلمات، الأسلوب، النبرة، البنية، والسياق. لذلك استهدف العمل توفير أفضل النصائح والممارسات التي من شأنها أن يصبح المستخدم خبيرًا في كتابة الأوامر.
أهم الموضوعات الواردة بالعمل
يبدأ العمل باستعراض عددا من التقنيات المتقدمة (Advanced Techniques) في صياغة الأوامر، وتتضمن عدد من التقنيات مثل:
- الأوامر بالخطوة الخلفية (Step-back Prompting): التي تشجع النموذج على التفكير في سؤال عام ذي صلة قبل الإجابة على مهمة محددة، مما يساعد على تفعيل المعرفة الخلفية وعمليات التفكير.
- سلسلة الأفكار (Chain of Thought – CoT): تعمل على تحسين قدرات استنتاج نماذج اللغة الكبيرة عن طريق إنشاء خطوات استدلالية وسيطة.
- الاتساق الذاتي (Self-consistency): تجمع بين أخذ العينات والتصويت الأغلبي لتوليد مسارات استدلال متنوعة واختيار الإجابة الأكثر اتساقًا.
- شجرة الأفكار (Tree of Thoughts – ToT): تعمم مفهوم سلسلة الأفكار عن طريق السماح لنماذج اللغة الكبيرة باستكشاف مسارات استدلال مختلفة ومتعددة في وقت واحد.
- الاستدلال والتصرف (ReAct – Reason & Act): تُمكّن نماذج اللغة الكبيرة من حل المهام المعقدة باستخدام الاستدلال اللغوي الطبيعي جنبًا إلى جنب مع الأدوات الخارجية مثل البحث أو مفسر الشفرة.
يتعرض العمل بعد ذلك لموضوع هندسة الأوامر التلقائية (Automatic Prompt Engineering – APE): حيث يقدم طريقة لأتمتة عملية كتابة الأوامر، حيث يتم توجيه النموذج لإنشاء أوامر أخرى، ثم يتم تقييمها.
الجزء الثالث من العمل يتناولجانب تطبيقي هو أوامر التعليمات البرمجية (Code Prompting) حيث يوضح كيف يمكن استخدام Gemini لمساعدتك في كتابة التعليمات البرمجية وتفسيرها وترجمتها وتصحيحها ومراجعتها.
ينتقل العمل بعد ذلك لاستعراض أفضل الممارسات (Best Practices): والذي يقدم خلالها مجموعة من النصائح العملية لتحسين فعالية الأوامر، مثل توفير الأمثلة ، والتصميم البسيط والواضح ، والتحديد الدقيق للمخرجات ، واستخدام التعليمات بدلاً من القيود ، والتحكم في الحد الأقصى لطول الرمز المميز (max token length) ، واستخدام المتغيرات في الأوامر ، والتجريب على تنسيقات الإدخال وأنماط الكتابة ، وخلط الفئات في مهام التصنيف ذات اللقطات القليلة ، والتكيف مع تحديثات النموذج ، والتجريب على تنسيقات الإخراج ، واستخدام أدوات إصلاح JSON ، والعمل مع المخططات (Schemas) ، والتجريب مع مهندسي الأوامر الآخرين ، وتوثيق محاولات الأوامر المختلفة.
جوانب القوة والضعف في العمل
جوانب القوة:
- الشمولية والوضوح: تقدم الورقة نظرة عامة شاملة على هندسة الأوامر، بدءًا من المفاهيم الأساسية وصولًا إلى التقنيات المتقدمة وأفضل الممارسات. الشرح واضح ومباشر، مما يجعله متاحًا لجمهور واسع، بما في ذلك غير المتخصصين في علم البيانات أو هندسة التعلم الآلي.
- الأمثلة العملية: توفر الورقة عديد من الأمثلة العملية المدعومة بجداول توضح الأوامر والمخرجات المتوقعة. وهذا يعزز الفهم ويساعد القراء على تطبيق المفاهيم.
- التغطية الواسعة للتقنيات: تغطي الورقة مجموعة واسعة من تقنيات كتابة الأوامر، من الأساسية (zero-shot, few-shot) إلى المتقدمة (CoT, Self-consistency, ToT, ReAct)، مما يوفر للقارئ مجموعة أدوات متنوعة لتحسين تفاعلاته مع نماذج اللغة الكبيرة.
- التركيز على التطبيق العملي: تتجاوز الورقة النظرية وتقدم نصائح عملية حول كيفية ضبط إعدادات النموذج (مثل درجة الحرارة وTop-K وTop-P) لتحقيق النتائج المرجوة. كما تركز على أهمية توثيق محاولات الأوامر.
- التعامل مع التحديات: تتطرق الورقة إلى التحديات الشائعة مثل “خطأ حلقة التكرار” (repetition loop bug) وكيفية التغلب عليها ، بالإضافة إلى معالجة مشكلات الدقة في المهام الرياضية باستخدام CoT.
- أهمية توثيق الأوامر: تشدد الورقة على أهمية توثيق محاولات الأوامر المختلفة. وتقدم نموذجًا مقترحًا لتوثيق الأوامر، مما يشجع على الممارسة الجيدة ويساعد في تتبع التغييرات وتحسين الأداء بمرور الوقت.
جوانب الضعف:
- الاعتماد الكبير على منتجات Google: على الرغم من أن الورقة ممتازة، إلا أنها تركز بشكل كبير على نماذج Google Gemini ومنصة Vertex AI. بينما تذكر نماذج أخرى مثل GPT وClaude وGemma وLLaMA، إلا أن الأمثلة والتطبيقات العملية تتمحور حول بيئة Google. قد يحد هذا من قابليتها للتطبيق المباشر للمستخدمين الذين يعملون بشكل أساسي مع منصات أو نماذج أخرى.
- العمق في بعض التقنيات المتقدمة: بعض التقنيات المتقدمة مثل Tree of Thoughts وReAct يتم تقديمها بشكل موجز نسبيًا. على الرغم من أنها شرحها كان يتطلب مزيدا من التفاصيل ، لذلك فأن توفير المزيد من العمق في الأمثلة والشرح داخل الورقة نفسها بدلا من ذكر روابط خارجية لمن يرغب في التوسع في تصوري سيكون مفيدًا للقارئ الذي يسعى إلى فهم شامل دون الحاجة إلى الرجوع لمصادر متعددة.
- إمكانية التكرار: هناك بعض التكرار في سياق العمل، خاصة فيما يتعلق بفوائد استخدام تنسيق JSON للمخرجات ، والتي تظهر في أقسام مختلفة من الورقة.
كلمة أخيرة
صدر العمل في الأساس كورقة بيضاء ثم تبنة شركة Google نشره ، ويعد موردًا قيمًا لكل من المبتدئين والخبراء في مجال هندسة الأوامر. يقدم إرشادات واضحة وأمثلة عملية ومجموعة شاملة من التقنيات لتحسين التفاعل مع نماذج اللغة الكبيرة. وعلى الرغم من تركيزها على منتجات Google وبعض الاختصار في شرح التقنيات المتقدمة، إلا أنه يعد وثيقة أساسية لأي شخص يسعى لإتقان فن وعلم صياغة الأوامر الفعالة.
بوابة تكنولوجيا التعليم أول بوابة عربية تهتم بتكنولوجيا التعليم والتعليم الإلكتروني منذ عام 2003

