تقنية الذكاء الاصطناعي التوليدي

كثر في هذه الأيام الحديث عن الذكاء الاصطناعي الإبداعي. فهنا لوحة رسمها ذكاء اصطناعي تتفوق على فنانين مبدعين، وهنا ذكاء اصطناعي يفوز مطوره بجائزة نوبل في الكيمياء وآخر في الفيزياء، وهناك تطبيق ChatGPT الذي أصبح مالئ الدنيا وشاغل الناس. لنلقِ نظرة عن كثب على الذكاء الاصطناعي التوليدي.

ها هو لاعب كرة قدم متعرق يسكب مشروبه مباشرة في فمه، لتندمج الزجاجة بعد لحظات مع أنفه. افتتح هذا الفيديو الغريب إعلاناً عن مشروب الطاقة Super Bowl في عام 2024. لم يكن الفيديو حقيقياً. فقد أنشأته الشركة المصنعة لهذا المشروب الرياضي باستخدام الذكاء الاصطناعي التوليدي.

الذكاء الاصطناعي، أو AI، هو أي تقنية يمكنها أداء المهام التي تتطلب عادةً دماغاً بشرياً. تندرج المهام التي تنطوي على إنشاء شيء ما - مثل مقطع فيديو أو صورة أو مقال أو أغنية - ضمن فئة خاصة: الذكاء الاصطناعي التوليدي. كان إعلان Super Bowl يسخر من المحتوى المبكر الذي صنعه الذكاء الاصطناعي، والذي كان يميل إلى الظهور بشكل غريب. حيث قال الإعلان، "لا يوجد بديل للحقيقي".

ومع ذلك، ينتشر المحتوى الذي يجري إنشاؤه بواسطة الذكاء الاصطناعي على نطاق واسع. كما أنه أصبح أكثر واقعية. في بعض الأحيان يبدو حقيقياً إلى درجة أنه يمكن الخلط بينه وبين الواقع.

يستخدم الناس الذكاء الاصطناعي التوليدي لصياغة ميمات مضحكة على وسائل التواصل الاجتماعي وللمساعدة في أداء الواجبات المنزلية. كما يستخدمونه لكتابة أكواد الكمبيوتر وإنشاء الاختبارات وشرح الكتب وتلخيص الأبحاث العلمية وحتى للمساعدة في تحديد الأدوية الجديدة المحتملة.

ومع ذلك، فقد أثار الذكاء الاصطناعي التوليدي الكثير من الجدل.

فهو يخطئ أحياناً في بعض الحقائق. وينتج أحياناً محتوى متحيزاً. ويستخدمه بعض الناس للغش أو نشر معلومات مضللة. بالإضافة إلى ذلك، يشعر العديد من الفنانين والمبدعين بالانزعاج، ويشتكون من أن هذه التقنية الجديدة تستغل أعمالهم أو تقلل من قيمتها وأهميتها.

الحديقة البوتية المنوعة

لاستخدام الذكاء الاصطناعي التوليدي، يطرح شخص ما أولاً مسألة. قد تكون عبارة عن سؤال يريد الإجابة عليه. أو قد يصف صورة أو مقطع فيديو أو أغنية يريد إنشاءها. ثم يقدم هذه المسألة إلى أنموذج الذكاء الاصطناعي، وهو نوع من خوارزميات الكمبيوتر الذكية.

يجيب الأنموذج على السؤال أو ينشئ أي شيء يطلبه الشخص. قد يستغرق هذا بضع ثوانٍ فقط.

في السنوات الأخيرة، طورت الشركات عدداً كبيراً من الأدوات التي يمكن للأشخاص استخدامها للتفاعل مع نماذج الذكاء الاصطناعي التوليدي. تسمى هذه أحياناً البوتات.

يمكن لبوتات Midjourney وStable Diffusion إنشاء صور فنية أو واقعية للغاية. كما تقوم Sora وRunway بإنشاء مقاطع فيديو. وتقوم MuseNet وAudiocraft بتأليف الموسيقى. وتقوم بوتات الدردشة مثل ChatGPT وClaude بإنشاء المقالات ورسائل البريد الإلكتروني والقصص وأكواد الكمبيوتر والمزيد. بنيت بعض هذه البوتات استناداً إلى نماذج أساسية أولية، مثل GPT-4 أو BERT. ويمكنها الاستجابة وإنشاء مزيج من أنواع مختلفة من المحتوى.

كان الذكاء الاصطناعي التوليدي موجوداً بطريقة ما منذ عام 1961 على الأقل. وذلك عندما طور العلماء بوت الدردشة المسمى ELIZA والذي يمكنه تبادل الرسائل مع الأشخاص. وقد جعل أنموذج الذكاء الاصطناعي البسيط هذا الأمر ممكناً. كان يتبع قواعد للاختيار من قائمة من الاستجابات المكتوبة مسبقاً. أصبحت بوتات اليوم أكثر تعقيداً بكثير.

من التدريب إلى التحدث

على عكس ELIZA، لا تتبع نماذج الذكاء الاصطناعي التوليدي الحديثة قواعد مبرمجة مسبقاً. بدلاً من ذلك، تتعلم من الأمثلة أثناء عملية تسمى التدريب. (هذا صحيح بالنسبة إلى معظم أنواع الذكاء الاصطناعي الشائعة اليوم، وليس فقط الذكاء الاصطناعي التوليدي).

بشكل عام، كلما زاد عدد الأمثلة التي يتدرب عليها أنموذج الذكاء الاصطناعي، كان ذلك أفضل. يعد تجميع مجموعات ضخمة من البيانات للتدريب جزءاً مهماً من تطوير الذكاء الاصطناعي. لتدريب سيارة ذاتية القيادة، على سبيل المثال، يحتاج المطورون إلى الكثير من بيانات القيادة.

إن أكثر نماذج الذكاء الاصطناعي التوليدية شيوعاً اليوم يجري تدريبها على مجموعات بيانات ضخمة بشكل مذهل. على سبيل المثال، قام المطورون بتدريب بوتات توليد الصور Stable Diffusion و Midjourney على نفس مجموعة البيانات، التي تضم أكثر من 2.3 مليار صورة مع تعليقات توضيحية. مجموعة بيانات تدريب ChatGPT ليست عامة. ولكن من المحتمل أنها تحتوي على ما مجموعه حوالي 300 مليار كلمة. وقد جاءت هذه الكلمات بشكل أساسي من الكتب ومواقع الويب وغيرها من المحتوى عبر الإنترنت.

أثناء التدريب، تعتمد معظم نماذج الذكاء الاصطناعي اليوم على تقنية تسمى التعلم العميق. وهي طريقة للتنقل عبر كومة بيانات الأمثلة المقدمة بحثاً عن الأنماط. تبني هذه العملية بشكل أساسي سلسلة من الخرائط. حيث توضع الأشياء التي تظهر غالباً معاً في البيانات بالقرب من بعضها بعضا في هذه الخرائط.

وإليك كيفية عمل نموذج الذكاء الاصطناعي الذي يحلل الصور. إنه يبني خريطة منخفضة المستوى للغاية تجمع وحدات البكسل الفردية. تجمع الخرائط المختلفة أنماط وحدات البكسل. ثم تتبع الخرائط عالية المستوى أنماط الصور.

وبالمثل، فإن الأنموذج الذي يتعامل مع الموسيقى سيرسم خريطة لكل شيء بدءاً من النوتات الفردية وصولاً إلى نوع الأغنية.

يتبع أنموذج الذكاء الاصطناعي التوليدي هذه الخرائط لبناء شيء ما.

عندما تطرح سؤالاً على ChatGPT، فإنه يجد أقرب تطابقات لكلماتك في خرائطه، ثم يبحث بالقرب منها. ومن ذلك، يتنبأ بالكلمة أو العبارة التي من المرجح أن تأتي بعد ذلك. ثم يكرر العملية مراراً وتكراراً للعثور على خيارات جيدة للكلمة أو العبارة التالية، وكل كلمة أو عبارة بعدها. ولبناء صورة، يتنبأ Midjourney باللون الأكثر احتمالية للبكسل التالي أو مجموعة البكسل التالية، مرة بعد أخرى.

تنطوي هذه التنبؤات على درجة معينة من الصدفة. لذا يتبع النموذج مساراً مختلفاً قليلاً عبر خريطته في كل مرة. وهذا يعني أن نفس المطالبة ستعطي نتائج مختلفة قليلاً في كل مرة.

الضبط الدقيق للسلامة

لا يفهم أنموذج الذكاء الاصطناعي التوليدي الكلمات أو الصور أو الأصوات التي ينشئها حقاً. وبدون بعض التدريب الإضافي، يمكنه بسهولة إخراج محتوى مسيء أو غير صحيح أو ضار. ويعمل مطورو الذكاء الاصطناعي على منع ذلك. تسمى هذه العملية بالضبط الدقيق.

الطريقة الأكثر شيوعاً لضبط أنموذج الذكاء الاصطناعي التوليدي هي استخدام ملاحظات الأشخاص. في هذه العملية، ينظر الأشخاص إلى استجابات الذكاء الاصطناعي لمطالبة ما ويختارون تلك التي يفضلونها. بشكل أساسي تجعل هذه العملية مسارات معينة عبر خريطة الأنموذج أسهل بكثير للمتابعة. لكن في الوقت نفسه، تصبح المسارات الأخرى أكثر غدراً.

بمجرد تدريب الأنموذج بالكامل، قد يضيف المطورون أيضاً قواعد أو مرشحات للتحقق من مطالبات الأشخاص. يمكن أن يمنع هذا الأنموذج من الإجابة على مطالبات غير آمنة أو إشكالية معينة.

ومع ذلك، فإن فرض الكثير من القيود على البوت يمكن أن يقلل من فائدته وإبداعه. لذلك يحاول المطورون الوصول إلى درجة مقبولة من التوازن. يجب أن يكون الأشخاص الذين يستخدمون الذكاء الاصطناعي التوليدي على دراية بعيوبه وكذلك بالآفاق التي يفتحها.

وأخيراً نقدم تعريفاً لـ: البوت (اختصار لروبوت الويب) وهو برنامج كمبيوتر مصمم ليبدو وكأن أفعاله تأتي من إنسان. والهدف هو جعله يتفاعل مع الناس أو يقوم بمهام آلية مثل البحث عن المعلومات عبر الإنترنت ومشاركتها من خلال حسابات وسائل التواصل الاجتماعي.

الميمز: أي فكرة أو عبارة أو صورة أو جانب من جوانب الثقافة ينتشر من شخص إلى آخر - غالباً بشكل فيروسي - وعادةً عبر المحادثة أو وسائل التواصل الاجتماعي.

----

تقنية الذكاء الاصطناعي التوليدي

الحديقة البوتية المنوعة

من التدريب إلى التحدث

الضبط الدقيق للسلامة

بقلم: كاثرين هاليك

عن موقع: SN Explores