فهم عملية اتخاذ بعض القرارات العشوائية في تصميم أجهزة البرامج التي تحاكي عملية صنع القرار لدى الإنسان

نواجه في جميع جوانب حياتنا اليومية المختلفة مسألة (الاستكشاف والاستغلال)، فعندما تقوم باختيار فيلم لمشاهدته من بين مجموعة من الأفلام التي تُعرض عليك فإنك تبدأ باستكشاف والبحث عن الفيلم الذي قد يثير اهتمامك أو يمكن أن تقوم باختيار فيلم قد سبق أن شاهدته من قبل وتود مشاهدته مرة أخرى لإنك متأكد من أنه من الأفلام المفضلة لديك. ومثال آخر في السياق نفسه اختيار مطعمك المفضل على أن تختار تجربة مطعم جديد قد يكون أفضل وقد لا يكون.

هناك طريقتان لاتخاذ القرار، الأولى عندما تبدأ بتحديد الفوائد والإيجابيات لقرار قد اتخذته من قبل، كما هو في المثال السابق اختيار المطعم الذي سبق لك أن جربته لعلمك بجودته. أما الطريقة الثانية فهي اختيار أمر جديد مع توفر بعض المعلومات التي قد لا تكون دقيقة حوله كالذهاب إلى مطعم جديد لم يسبق لك الذهاب إليه، مع اكتفائك بالآراء التي كُتبت حوله. ويُطلق على الطريقة الأولى في صنع القرار (الاستكشاف الموجه)، في حين يمثل (الاستكشاف العشوائي) الطريقة الثانية.

 

الاختيار العشوائي

تمت دراسة الاستكشاف العشوائي في سلوكيات الإنسان بشكل غير مفصل كما هو الحال في الاستكشاف الموجه، إلا أنه وفي دراسة حديثة أجراها الدكتور سامويل فنغ، الأستاذ المساعد في الرياضيات في جامعة خليفة وبالتعاون مع الدكتور روبرت ويلسون، مدير  مختبر علم الأعصاب لتعزيز التعلم وصنع القرار في جامعة أريزونا الأمريكية، يسعى الباحثون إلى دراسة ديناميكيات الاستكشاف العشوائي عند الإنسان وتفسير الطريقة التي يقوم بها الفرد بصنع القرار ات التي قد تبدو عشوائية في بعض الأحيان والأسباب المؤدية لذلك.

ونُشرت دراسة الباحثين مؤخرًا في المجلة العلمية المرموقة "نيتشرز سينتيفك ريبورتس" التي أثبتت فعاليتها في مجال تعزيز التعلم من خلال نماذج تعلم الآلة والأنظمة الذكية المتطور.

وتعتبر الموازنة بين استكشاف الخيارات الجديدة والاستفادة من الخيارات المتاحة عاملًا رئيسًا في عملية اتخاذ القرارات، حيث يساهم فهم الأمور التي تتحكم بالاختيار العشوائي لصنع القرار في العديد من جوانب الحياة. وسلط الدكتور سامويل وزملاؤه الضوء على اللغز الذي يتمثل في طريقة تصميم أجهزة وخوارزميات تحاكي عملية اتخاذ القرار  في ظل التحدي الكامن في منهجية الاستكشاف والاستغلال.

وفي هذا الإطار، قال الباحثون: "عند اختيار المواد الجامعية، هل ستختارون مادة الرياضيات لعلمكم أنكم ستنجحون بها أم ستقومون باستكشاف مادة التصوير التي ليس لديكم عنها أدنى فكرة؟ يعد اختيار مادة الرياضيات، أي استغلالها والاستفادة منها، الطريقة الأفضل من اختيار مادة التصوير  للحصول على درجات أعلى، نظرًا لعدم المعرفة المسبقة بالصعوبات التي قد تواجهك في مادة التصوير".

وتحظى الموازنة بين الاستكشاف والاستغلال بتاريخ كبير في البحوث الحاسوبية والبحوث المتعلقة بعلم الأعصاب، حيث أنها تتطلب الاختيار ما بين خيار مألوف وخيار  غير مألوف ونتائجه غير  واضحة. ويساهم مبدأ الاستغلال في زيادة حجم الفوائد الناجمة عن القرار المتخذ على المدى القريب، في حين أن النتائج والمعلومات التي يتم الحصول عليها من عملية الاستكشاف قد تساهم في مضاعفة حجم الفوائد على المدى البعيد.

وفي سياق عملية الاستكشاف واتخاذ القرارات الجديدة التي لا تُعرف عواقبها المحتملة، تتطلب المحافظة على فعالية الأداء في صنع القرار الموازنة بين الاستكشاف والاستغلال، الأمر الذي يستدعي محاكاة جميع النتائج الممكنة والذي يأتي خارج نطاق أداء العقل البشري.

نمذجة عملية صنع القرار

استخدم الدكتور سامويل والفريق البحثي نماذج رياضية لحل المشكلة، حيث قاموا بتطوير  نموذج (الاستكشاف والاستغلال) للكشف عن طريقة للتحكم بالاختيار العشوائي في ضوء افتراض أن الاختيار بين الاستغلال والاستكشاف سيتحقق من خلال تجميع الأدلة بمرور الوقت. من جهة أخرى، يمكن التحكم بالمتغيرات السلوكية عند عملية الاختيار من خلال ثلاثة معايير مختلفة والتي لا تستطيع البيانات المتوفرة في الوقت الحالي تمييز  أيهما السبب وراء اختيار قرار معين، بل تقوم تلك المعايير  بإظهار  كيفية تأثر قرارات الاستكشاف والاستغلال بآلية نسبة "الإشارة إلى الضجيج" في الدماغ.

الضجيج

يمر الدماغ بمرحلة من الضجيج عندما يقوم الإنسان بعملية اتخاذ القرار، ويرجع سبب ذلك إلى اعتبار أن الإنسان يقوم بصنع قرارات غير دقيقة لتأثرها بعوامل ثانوية كمزاج الفرد والجوع وحالة الطقس. وتوجد قرارات خالية من الضجيج نظرًا لأنها تُبنى على قواعد ثابتة تحد من إمكانية تغييرها، في حين هناك قرارات قابلة للتغيير.

ويتميز  منهج الاستكشاف بنوعيه بخاصية رئيسة تكمن في خضوعه للتحكم المعرفي، فعند الاختيار واتخاذ القرار  يسعى الأفراد للبحث عن المزيد من المعلومات وهو ما يسمى بالاستكشاف الموجه أو يقومون بإظهار تقلبات في سلوكياتهم والمعروف بالاستكشاف العشوائي. أما طريقة قيام الدماغ بعملية التحكم بالاستكشاف الموجه والعشوائي فهي غير معروفة حتى الآن، لكن تركز آلية نسبة الإشارة إلى الضجيج التي استعانت بها هذه الدراسة على الطريقة التي يقوم بها الدماغ في معالجة أشكال هذه القرارات.

وأضاف الباحثون: "نهدف من هذه الدراسة إلى تصميم الأجهزة والبرمجيات القادرة على تعزيز عمليات التعلم واتخاذ القرارات تمامًا كالإنسان والاستفادة منها في التطبيقات التجارية والصناعية المتعلقة بتعلم الآلة وألعاب الكمبيوتر والروبوتات والإعلانات والكيمياء الحاسوبية".

يذكر أن الاستنتاجات التي توصل إليها الباحثون أثبتت نجاحها في برمجة الأجهزة التي تحاكي عملية صنع القرار عند الإنسان.