تخيل أن تقول لسيارتك ببساطة "أنا في عجلة من أمري"، وستأخذك تلقائياً إلى الطريق الأكثر كفاءة للوصول إلى المكان الذي ترغب فيه.

وجد مهندسو جامعة بيردو أن السيارة ذاتية القيادة يمكنها القيام بذلك بمساعدة ChatGPT أو روبوتات الدردشة الأخرى التي أصبحت ممكنة من خلال خوارزميات ذكاء اصطناعي تسمى نماذج اللغة الكبرى.

قد تكون هذه الدراسة، من بين التجارب الأولى التي تختبر مدى قدرة السيارة ذاتية القيادة الحقيقية على استخدام نماذج اللغة الكبرى لتفسير الأوامر من الركاب والقيادة وفقاً لذلك.

يعتقد زيران وانغ، الأستاذ المساعد في كلية لايلز للهندسة المدنية والبناء في بيردو والذي قاد الدراسة، أنه لكي تصبح المركبات ذاتية القيادة بالكامل يوماً ما، ستحتاج إلى فهم كل ما تؤمر به، حتى عندما يكون الأمر ضمنياً. على سبيل المثال، يعرف سائق التاكسي ما تحتاجه عندما تقول إنك في عجلة من أمرك دون الحاجة إلى تحديد الطريق الذي يجب أن يسلكه لتجنب الازدحام المروري.

ورغم أن السيارات ذاتية القيادة اليوم تأتي بميزات تسمح لك بالتواصل معها، إلا أنها تحتاج إلى أن تكون أكثر وضوحاً مما قد يكون ضرورياً إذا كنت تتحدث إلى إنسان. وفي المقابل، تستطيع نماذج اللغة الكبرى تفسير وإعطاء ردود بطريقة أكثر شبهاً بالإنسان لأنها مدربة على استخلاص العلاقات من كميات هائلة من البيانات النصية والاستمرار في التعلم بمرور الوقت.

قال وانغ: "تتميز الأنظمة التقليدية في مركباتنا بتصميم واجهة مستخدم حيث يتعين عليك الضغط على الأزرار لنقل ما تريد، أو نظام التعرف على الصوت الذي يتطلب منك أن تكون واضحاً للغاية عندما تتحدث حتى تتمكن مركبتك من فهمك. لكن قوة نماذج اللغة الكبرى تكمن في أنها تستطيع فهم جميع أنواع الأشياء التي تقولها بشكل أكثر طبيعية. لا أعتقد أن أي نظام آخر موجود يمكنه القيام بذلك".

نوع جديد من الدراسة

في هذه الدراسة، لم تقدم نماذج اللغة الكبرى بقيادة سيارة ذاتية القيادة. بل كانت تساعدها في القيادة باستخدام ميزاتها الحالية. ووجد وانغ وطلابه من خلال دمج هذه النماذج أن السيارة ذاتية القيادة لا تستطيع فهم راكبها بشكل أفضل فحسب، بل يمكنها أيضاً تخصيص قيادتها لإرضاء الراكب.

قبل بدء تجاربهم، درب الباحثون ChatGPT باستخدام مطالبات تتراوح من أوامر أكثر مباشرة (على سبيل المثال، "الرجاء القيادة بشكل أسرع") إلى أوامر غير مباشرة بشكل أكبر (على سبيل المثال، "أشعر بدوار الحركة قليلاً الآن"). وبينما تعلم ChatGPT كيفية الاستجابة لهذه الأوامر، أعطى الباحثون نماذج اللغة الكبرى الخاصة به عددا من المعلمات لمتابعتها، مما يتطلب من البرنامج مراعاة قواعد المرور وظروف الطريق والطقس والمعلومات الأخرى التي تكتشف بواسطة أجهزة استشعار السيارة، مثل الكاميرات وكشف الضوء والمدى.

ثم جعل الباحثون هذه النماذج اللغوية الكبرى متاحة عبر السحابة لمركبة تجريبية ذات مستوى استقلالية من المستوى الرابع كما حددته شركة SAE International. المستوى الرابع يبعد مستوى واحداً عن ما تعتبره الصناعة مركبة ذاتية القيادة بالكامل.

عندما اكتشف نظام التعرف على الكلام في المركبة أمراً من أحد الركاب أثناء التجارب، استنتجت نماذج اللغة الكبيرة في السحابة الأمر بالمعلمات التي حددها الباحثون. ثم قامت هذه النماذج بإنشاء تعليمات لنظام القيادة بالأسلاك في المركبة - والذي يتصل بالخانق والفرامل والتروس والتوجيه - فيما يتعلق بكيفية القيادة وفقاً لهذا الأمر.

بالنسبة إلى بعض التجارب، اختبر فريق وانغ أيضاً وحدة ذاكرة قاموا بتثبيتها في النظام وقد سمحت لنماذج اللغة الكبرى بتخزين البيانات حول تفضيلات الراكب التاريخية ومعرفة كيفية وضعها في الاعتبار عند الاستجابة للأمر.

أجرى الباحثون معظم التجارب في أرض مخصصة للاختبارات في ولاية إنديانا، كانت في السابق مدرجاً لمطار. سمحت لهم هذه البيئة باختبار استجابات المركبة لأوامر الركاب بأمان أثناء القيادة بسرعات الطرق السريعة على المدرج والتعامل مع التقاطعات ذات الاتجاهين. كما قاموا باختبار مدى جودة ركن السيارة وفقاً لأوامر الركاب في ساحة انتظار السيارات في ملعب روس-أدي بجامعة بيرديو.

استخدم المشاركون في الدراسة كلاً من الأوامر التي تعلمتها نماذج اللغة الكبرى والأوامر الجديدة أثناء ركوب السيارة. واستناداً إلى استجابات السيارات للاستطلاع بعد رحلاتهم، أعرب المشاركون عن معدل أقل من عدم الارتياح بشأن القرارات التي اتخذتها السيارة ذاتية القيادة مقارنة بالبيانات حول كيفية ميل الأشخاص إلى الشعور عند ركوب سيارة ذاتية القيادة من المستوى الرابع بدون مساعدة من نماذج اللغة الكبرى.

كما قارن الفريق أداء السيارة ذاتية القيادة بالقيم الأساسية التي أنشئت من البيانات حول ما يعتبره الناس في المتوسط رحلة آمنة ومريحة، مثل مقدار الوقت الذي تسمح به السيارة للتفاعل لتجنب الاصطدام الخلفي ومدى تسارع السيارة وتباطؤها. ووجد الباحثون أن السيارة ذاتية القيادة في هذه الدراسة تفوقت على جميع القيم الأساسية أثناء استخدام نماذج اللغة الكبرى للقيادة، حتى عند الاستجابة للأوامر التي لم تتعلمها النماذج بالفعل.

الاتجاهات المستقبلية

قال وانغ إن نماذج اللغة الكبيرة في هذه الدراسة استغرقت في المتوسط 1.6 ثانية لمعالجة أمر الراكب، وهو ما يعتبر مقبولاً في السيناريوهات غير الحرجة للوقت ولكن يجب تحسينه في المواقف التي تحتاج فيها المركبات ذاتية القيادة إلى الاستجابة بشكل أسرع. هذه مشكلة تؤثر على نماذج اللغة الكبرى بشكل عام وتجري معالجتها من قبل الصناعة وكذلك من قبل الباحثين الجامعيين.

رغم أنها ليست محور هذه الدراسة، فمن المعروف أن نماذج اللغة الكبرى مثل ChatGPT معرضة لـ "الهلوسة"، ما يعني أنها يمكن أن تسيء تفسير شيء تعلمته وتستجيب بطريقة خاطئة. أجريت دراسة وانغ في إعداد بآلية أمان تسمح للمشاركين بالركوب بأمان في حال أساءت نماذج اللغة الكبرى فهم الأوامر. تحسنت النماذج في فهمها طوال رحلة المشارك، لكن الهلوسة تظل مشكلة يجب معالجتها قبل أن يفكر مصنعو المركبات في تنفيذ نماذج اللغة الكبرى في المركبات ذاتية القيادة.

سيحتاج مصنعو المركبات أيضاً إلى إجراء المزيد من الاختبارات باستخدام نماذج اللغة الكبيرة بالإضافة إلى الدراسات التي أجراها باحثون جامعيون. وقال وانغ إن الموافقة التنظيمية ستكون مطلوبة أيضاً لدمج هذه النماذج مع أدوات التحكم في المركبات ذاتية القيادة حتى تتمكن من قيادة السيارة بالفعل.

وفي الوقت نفسه، يواصل وانغ وطلابه إجراء التجارب التي قد تساعد الصناعة في استكشاف إضافة نماذج لغوية كبرى إلى المركبات ذاتية القيادة.

ومنذ اختبار دراستهم لـ ChatGPT، قام الباحثون بتقييم روبوتات الدردشة العامة والخاصة الأخرى القائمة على نماذج لغوية كبرى، مثل سلسلة Gemini من Google وMeta من مساعدي Llama AI. وحتى الآن، وجدوا أن ChatGPT يحقق أفضل أداء في المؤشرات لرحلة آمنة وفعالة من حيث الوقت في مركبة ذاتية القيادة.

والخطوة التالية الأخرى هي معرفة ما إذا كان من الممكن أن تتحدث نماذج اللغة الكبرى لكل مركبة ذاتية القيادة مع بعضها بعضاً، مثل مساعدة المركبات ذاتية القيادة في تحديد أي منها يجب أن يذهب أولاً عند التوقف بأربعة اتجاهات. كما يبدأ مختبر وانغ مشروعاً لدراسة استخدام نماذج الرؤية الكبيرة لمساعدة المركبات ذاتية القيادة في الطقس الشتوي القاسي الشائع في جميع أنحاء الغرب الأوسط. هذه النماذج تشبه نماذج اللغة الكبرى ولكنها مدربة على الصور بدلاً من النصوص. سوف ينفذ هذا المشروع بدعم من مركز النقل المتصل والآلي (CCAT)، والذي يمول من قبل مكتب البحث والتطوير والتكنولوجيا التابع لوزارة النقل الأمريكية من خلال برنامج مراكز النقل الجامعية. تعد جامعة بيرديو واحدة من شركاء مركز النقل المتصل والآلي.

----

عن موقع: Science Daily.com