وفقاً لدراسة جديدة، أتقن عميل ذكاء اصطناعي يُدعى سيسيرو لعبة الدبلوماسية على الإنترنت؛ حيث لعب هذا الوكيل 40 مباراة سريعة في دوري دبلوماسي عبر الإنترنت وسجل ضعف متوسط اللاعبين البشريين.

أتقن وكيل الذكاء الاصطناعي (AI) المسمى سيسيرو لعبة الدبلوماسية على الإنترنت. جاء ذلك وفقاً لدراسة جديدة أجراها فريق Meta Fundamental AI Research Diplomacy Team (FAIR) ونشرت في مجلة العلوم "Science".

لقد نجح الذكاء الاصطناعي بالفعل في لعب ألعاب تنافسية مثل الشطرنج التي يمكن تعلمها باستخدام التدريب على اللعب الذاتي فقط. ومع ذلك، فإن ألعاب مثل الدبلوماسية، التي تتطلب التفاوض بلغة طبيعية، والتعاون، والمنافسة بين لاعبين متعددين، كانت صعبة.

مستقبل واعد

الوكيل الجديد الذي طورته FAIR ليس فقط قادراً على تقليد اللغة الطبيعية، ولكن الأهم من ذلك أنه يحلل أيضاً بعض أهداف ومعتقدات ونوايا شركائه البشر في اللعبة. يقول الباحثون إنه يستخدم تلك المعلومات لمعرفة خطة عمل تراعي المصالح المتوافقة والمتضاربة، ولإيصال تلك الخطة بلغة طبيعية.

لعب سيسيرو دون الكشف عن هويته ضد البشر في 40 مباراة سريعة في دوري دبلوماسي عبر الإنترنت، وسجل أكثر من ضعف متوسط درجات اللاعبين البشريين وكان ضمن أفضل 10% من المشاركين الذين لعبوا أكثر من لعبة واحدة. سيسيرو "مر" كلاعب بشري ضد 82 لاعباً فريداً، ولم ير الباحثون أي رسائل داخل اللعبة تشير إلى أن اللاعبين البشريين يعتقدون أنهم يلعبون مع وكيل الذكاء الاصطناعي.

ابتكر المهندسون الميكانيكيون بجامعة كاليفورنيا، لوس أنجلوس فئة جديدة من المواد التي يمكنها تعلم السلوكيات بمرور الوقت وتطوير "ذاكرة عضلية" خاصة بها، مما يسمح بالتكيف في الوقت الفعلي مع القوى الخارجية المتغيرة، تماماً مثل عازف البيانو الذي يتعلم العزف على آلته الموسيقية دون النظر إلى المفاتيح أو لاعب كرة السلة الذي يقضي ساعات لا تحصى في رمي تسديدة قفز سهلة على ما يبدو.

تتكون المادة من نظام هيكلي مع حزم قابلة للضبط تسمح لها بتغيير شكلها وسلوكياتها استجابة للظروف الديناميكية. تم مؤخراً نشر نتائج الدراسة، التي سيكون لها آثار في بناء المباني وتطوير الطائرات وتقنيات التصوير وغيرها، في مجلة Science Robotics.

يبلغ حجم النظام المسمىMNN الذي طوره العلماء حجم فرن الميكروويف تقريباً، وهو حجر الأساس في الشبكة العصبية الميكانيكية التي سيزود بها الجيل القادم من الذكاء الاصطناعي، هذه الشبكة العصبية الميكانيكية قادرة على أن تتعلم كيفية ضبط صلابتها استجابة للقوى المطبقة. ويخطط الباحثون لتبسيط تصميم MNN بحيث يمكن تصنيع الآلاف من الشبكات على نطاق صغير داخل شبكات ثلاثية الأبعاد لتطبيقات المواد العملية.

قال جوناثان هوبكنز أستاذ الهندسة الميكانيكية والفضائية من كلية سامويلي للهندسة بجامعة كاليفورنيا والذي قاد البحث: يقدم هذا البحث ويوضح مادة ذكاء اصطناعي يمكنها تعلم إظهار السلوكيات والخصائص المرغوبة عند التعرض المتزايد للظروف المحيطة. وسوف تستخدم نفس المبادئ الأساسية المستخدمة في التعلم الآلي لمنح هذه المادة خصائصها الذكية والتكيفية.

عند استخدام هذه المادة في أجنحة الطائرات، على سبيل المثال، قد تتعلم كيفية تحويل شكل الأجنحة اعتماداً على أنماط الرياح أثناء الرحلة من أجل تحسين كفاءة الطائرة وقدرتها على المناورة. قد تقوم هذه المادة أيضاً بضبط الصلابة الذاتية في مناطق معينة من هيكل المبنى لزيادة الاستقرار العام أثناء الزلزال أو غيره من الكوارث الطبيعية أو التي من صنع الإنسان.

ابتكر الباحثون معادلات ميكانيكية لمكونات الشبكة العصبية الاصطناعية (ANN) في نظام مترابط باستخدام وتعديل المفاهيم من الشبكات العصبية الحالية، وهي الخوارزميات التي تقود التعلم الآلي. يتكون إنشاء الفري، الشبكة العصبية الميكانيكية (MNN)، من حزم قابلة للضبط بشكل فردي مرتبة في نمط شبكي مثلث. تم تجهيز كل حزمة بملف صوتي ومقاييس إجهاد وثنيات تسمح لها بتغيير الطول والتكيف مع محيطها المتغير في الوقت الفعلي والتفاعل مع الحزم الأخرى في النظام.

يبدأ الملف الصوتي، الذي اشتق اسمه من استخدامه الأصلي في مكبرات الصوت لتحويل المجالات المغناطيسية إلى حركة ميكانيكية، ضغطاً أو تمدداً دقيقاً استجابةً للقوى الجديدة الموضوعة على الحزمة. مقياس الإجهاد مسؤول عن جمع البيانات من حركة الحزمة المستخدمة في الخوارزمية للتحكم في سلوك التعلم. تعمل الانثناءات بشكل أساسي كمفاصل مرنة بين الحزم المتحركة لتوصيل النظام.

تقوم خوارزمية التحسين بعد ذلك بتنظيم النظام بأكمله عن طريق أخذ البيانات من كل من مقاييس الإجهاد وتحديد مجموعة من قيم الصلابة للتحكم في كيفية تكيف الشبكة مع القوى المطبقة.

من أجل التحقق من صحة نظام مراقبة مقياس الضغط، استخدم فريق البحث أيضاً كاميرات مدربة على عقد الإخراج للنظام.

أظهرت النماذج الأولية للنظام تأخراً بين مدخلات القوة المطبقة ومخرجات استجابة MNN ، ما أثر على الأداء العام للنظام. اختبر الفريق تكرارات متعددة لمقاييس الإجهاد والانثناءات في الحزم بالإضافة إلى أنماط وسماكات شعرية مختلفة قبل تحقيق التصميم المنشور الذي تمكن من التغلب على التأخير وتوزيع القوة المطبقة بدقة في جميع الاتجاهات.

"إن تحديد أسباب فشل "الشبكات" في التعلم مهم لفهم كيفية تصميم شبكات MNN التي تتعلم بنجاح"، شارك الباحثون كيف حلوا المشكلة من خلال التجربة والخطأ على مدى السنوات الخمس الماضية.

حالياً، يبلغ حجم النظام حجم فرن الميكروويف تقريباً، لكن يخطط الباحثون لتبسيط تصميم MNN بحيث يمكن تصنيع الآلاف من الشبكات على نطاق صغير داخل شبكات ثلاثية الأبعاد لتطبيقات المواد العملية. بصرف النظر عن استخدام المواد في المركبات ومواد البناء، يقترح الباحثون أنه يمكن أيضاً دمج MNNs في درع لتحريف موجات الصدمات، أو في تقنيات التصوير الصوتي لتسخير الموجات الصوتية.

----

ترجمة عن موقع: Sci Tech Daily