من Gmail إلى Office 365، أصبح الذكاء الاصطناعي على وشك الاندماج بعمق في التطبيقات التي نستخدمها كل يوم. إليك الطريقة. إنها آلة مجهزة لتحقيق الكمال؟ يقدم كل من Microsoft Copilot و Google Bard و Adobe ميزات ذكاء اصطناعي رائدة وغير مسبوقة.

كان الإصدار مفتوح المصدر لـ Stable Diffusion والذي لا يزال أحد أكثر مولدات الصور إثارة للإعجاب، بداية النهاية لأنموذج الوصول المغلق الذي سيطر على عالم الذكاء الاصطناعي حتى ذلك الحين. لقد وصل عندما كان منشئ الصور Dall-E 2 لا يزال مقصوراً على حفنة من الأشخاص الذين يتم فحصهم بعناية بواسطة OpenAI، وقدم اقتراحاً بديلاً: إنشاء صورة قوية لأي شخص يريد ذلك.

دفع ذلك إلى نقطة التحول التالية: إطلاق ChatGPT ، فجاء موديل T للذكاء الاصطناعي. كان الوصول إليه مفتوحاً كما أنه كان سهل الاستخدام وقادر بقوة، وقد استحوذ مظهره على الخيال ودفع التكنولوجيا إلى ذروة دورة الضجيج.

الآن، بعد بضعة أشهر فقط، نشهد وصول خدمة ثالثة، حيث تتحول أنظمة الذكاء الاصطناعي من كونها خدمة قائمة بذاتها إلى شيء متكامل بعمق مع الأدوات والتطبيقات التي نستخدمها بالفعل للعمل والعيش.

مساعد الطيار وغوغل

أعلنت غوغل يوم الثلاثاء الماضي عن مجموعة كبيرة من أدوات الذكاء الاصطناعي لمجموعة إنتاجيتها. في النهاية، سيتمكن المستخدمون من استخدام أنموذج اللغة الكبير للشركة (LLM) لإنشاء نص مباشرةً في Gmail أو محرر مستندات غوغل، أي سيتمكن المستخدم من إنشاء الصور والصوت والفيديو في الشرائح، وطرح أسئلة لغة طبيعية معقدة لمعالجة البيانات في جداول بيانات غوغل.

كانت الشركة مراوغة بشأن موعد طرح هذه الميزات، قائلة فقط إنها تخطط لتقديمها إلى "مختبرين موثوقين على أساس متجدد على مدار العام، قبل إتاحتها للجمهور". في أسلوب غوغل الحقيقي، بدت الشركة أكثر اهتماماً بالتباهي بقدرتها التي لا يمكن إنكارها من اهتمامها بمشاريع التسويق.

لكن لا نستبعد التجسس الخفيف للشركات على أنه دافع في تسريع الإطلاق. فبعد يومين فقط، أصبح الدافع للإعلان عن الميزات واضحاً عندما عقدت مايكروسوفت حدث إطلاق لميزة Copilot الجديدة الخاصة بها لمايكروسوفت 365 (لا تزال تعرف باسم MS Office، وهي علامة تجارية تم تقاعدها تقنياً بداية هذا العام).

سيجلس التطبيق الجديد Copilot، المدعوم من GPT-4 من شركة OpenAI للذكاء الاصطناعي، جنباً إلى جنب مع تطبيقات مايكروسوفت 365 تماماً مثل مساعد الطيار، وسوف يظهر في الشريط الجانبي كروبوت محادثة يسمح لمستخدمي Office باستدعائه لإنشاء نص في المستندات، وإنشاء عروض PowerPoint التقديمية استناداً إلى مستندات Word، أو حتى المساعدة في استخدام ميزات مثل PivotTables في Excel.

إن الميزات التي أظهرتها مايكروسوفت رائعة للغاية. يمكنك الانضمام إلى محادثة فيديو Teams وليس فقط أن تطلب ملخصاً موجزاً لما تمت مناقشته حتى الآن، ولكن أيضاً الحصول على فكرة عن كيفية تلقي الأعضاء الآخرين للمكالمة اقتراحاً معيناً. لا يستطيع مساعد الطيار فقط صياغة رسالة بريد إلكتروني تدعو الأشخاص إلى حفلة عيد ميلاد، بل يمكن أن يتضمن أيضاً طلباً لهم للرد بحكايات لاستخدامها في خطاب ما، ثم سحب أفضل ثلاث قصص تلقائياً من تلك الردود وتحريرها لتعديل طولها ثم رميها مباشرة من رسائلهم إلى ملاحظاتك للمحادثة نفسها.

تقول مايكروسوفت أن Copilot ليس مجرد نسخة من GPT-4 عالقة بشكل محرج في Office. بل هي تتكامل بشكل وثيق مع البيانات الأولية التي تكمن وراء كل ما تفعله، ويمكن أن تكون أكثر دقة نتيجة لذلك.

لكني أعتقد أن هذا أقل أهمية من مجرد وجود نظام ذكاء اصطناعي مدمج في عملاق الشركة وهو Office. بمجرد طرح هذه الميزات - وعندما تضغط غوغل على التبديل في تطبيقات الويب الخاصة بها - سيكون لدى ملايين الأشخاص حول العالم القدرة على استخدام ذكاء اصطناعي قوي كزميل في العمل، دون الحاجة إلى إقناع الإدارة بتسجيل الخروج، دون الحاجة إلى التجربة والثقة بمزود جديد، ودون أن يقرر أي شخص بوعي "التحول إلى الذكاء الاصطناعي".

شركة أدوبي

مايكروسوفت كانت البداية فقط. إذ أعلنت "أدوبي" عن إصلاح مماثل لمنتجاتها الخاصة، ما أدى إلى إنشاء صورة AI إلى Creative Cloud (المعروف باسم فوتوشوب). الخدمة الجديدة، المسماة Firefly هي في جزء منها امتداد مشابه للعرض لتلك التي تنتجها مايكروسوفت، حيث توفر تقنية مدعومة بالذكاء الاصطناعي العمليات الداخلية وسير العمل التي اعتاد عليها عملاء الشركة بالفعل.

وهذا يعني أن المستخدمين سيكونون قادرين على تدوير Firefly لإنشاء صور جديدة بالكامل، مثل مولدات الصور الأخرى مثل Midjourney و Stable Diffusion، أو لإنشاء تأثيرات نصية للحروف. تخطط الشركة أيضاً لإدخال تحرير الفيديو المدعوم بالذكاء الاصطناعي ("اجعل هذا المشهد يبدو كما لو تم تصويره في الشتاء")، والنمذجة ثلاثية الأبعاد، والتلاعب بالصور الرقمية.

كانت "أدوبي" أحد المزودين التجاريين الرائدين للأدوات التي تعمل بالذكاء الاصطناعي لبعض الوقت حتى الآن. كان "الملء المدرك للمحتوى" في فوتوشوب، والذي استخدم تقنيات proto-AI لاستبدال الخلفية في الصور المحررة، علامة بارزة في تحرير الصور عندما تم إصداره قبل أكثر من عقد من الزمان.

لكن عرض الشركة هذه المرة هو أكثر من مجرد بناء نفس جيل الذكاء الاصطناعي في برمجياتها الخاصة. تتمثل أحد الركائز الأساسية لـ Firefly في أن الشركة تقدم جيلاً "آمناً": إن أنموذجها التوليدي "مدرب على صور Adobe Stock، والمحتوى المرخص علناً، ومحتوى المجال العام حيث انتهت صلاحية حقوق النشر". بمعنى آخر، إذا كنت تعمل مع الصور التي تم إنشاؤها بواسطة Firefly، فأنت تعلم على وجه اليقين أنه لا توجد دعوى قضائية سيئة تتعلق بحقوق الطبع والنشر.

هذا يتناقض بشكل صارخ مع GPT-4 ، الذي تم تدريبه.. حسناً، لا أحد يعرف حقاً. (في مقابلة معبرة للغاية، لم يرد كبير علماء OpenAI عندما سئل عما إذا كان بإمكان الشركة التأكيد بشكل حاسم على أن بيانات التدريب الخاصة بها لا تتضمن مواد مقرصنة).

إن خطط "أدوبي" لتمييز نفسها هنا تذهب أبعد من ذلك. ففي عام 2019، أسست الشركة مبادرة أصالة المحتوى، والتي تهدف إلى محاربة المعلومات المضللة من خلال بناء معيار للصور والوسائط الأخرى لتضمين دليل على مصدرها. الآن، يتم توسيع ذلك من خلال إدخال علامة "عدم التدريب" على الصور، مما يسمح للمبدعين ضمان عدم دمج وسائطهم في النماذج المستقبلية. إنها ليست قوية كما يرغب بعض النقاد - نظام إلغاء الاشتراك سوف يجذب دائماً عدداً أكبر من الأشخاص بشكل يفاجئ نظام التقيد - ولكنه دفع واضح للاحترام.

غوغل مرة أخرى

بعد ساعة فقط من إعلان "أدوبي"، كشفت غوغل النقاب عن المشروع الذي يمكن أن يقتل الإوزة التي تبيض ذهباً - أو يحفظها.

أصبح Bard، الذكاء الاصطناعي للمحادثات ChatGPT-esque من غوغل والذي تم الإعلان عنه في وقت سابق من هذا العام (مرة أخرى، قبل أيام فقط من إعلان مايكروسوفت عن Bing Chat وتسويقه) حقيقياً الآن، مع قيام الشركة بإتاحة الوصول إلى المستخدمين من خلال قائمة الانتظار.

بالمقارنة مع المنافسة، لا يوجد شيء مذهل على الفور فيما يمكن أن يفعله Bard. لكن هناك ميزتان تميزانه، مثل القدرة على إنشاء مسودات متعددة لاستجابة أطول تلقائياً لمعرفة ما تفضله، أو التمييز بين المنشورات الواقعية البسيطة التي تصل مع حواشي إلى المصادر وتلك التي لا تحتوي على مثلها، أو القدرة على إنشاء بحث غوغل تلقائي من استعلاماتك.

لكن الأمر سيستغرق بعض الوقت للكشف عن المكان الذي يتفوق فيه Bard وهي ظاهرة تعرف في الصناعة باسم "زيادة القدرات". نكتشف عادةً ما يمكن أن تفعله نماذج الذكاء الاصطناعي في الأسابيع والأشهر التي تلي صنعها، حيث تفسح الاستعلامات البسيطة المجال لأوامر أكثر تفصيلاً وتمرساً. في الوقت الحالي، ومع استمرار العرض التوضيحي المباشر السريع، يبدو أنه يكافئ المنافسة تقريباً، على الرغم من أن Bard ارتكب خطأ في رده الأول: الرد على طلب للحصول على قائمة بالأنشطة الملائمة للأطفال في طوكيو، حيث فشل في الإشارة إلى أن السوق الذي اقترحه قد تم نقله إلى حد كبير منذ عام 2018.

من غير الواضح أيضاً والأكثر وجوداً، ما إذا كان بإمكان Bard التعايش مع بحث غوغل. لن تجيب الشركة على أسئلة حول مقدار تكلفة تشغيل استعلام Bard، وبدلاً من ذلك تستمر بالتحدث عن تحسينات الكفاءة التي أجرتها، ولكن الرقم التقريبي الذي يبلغ 10 إلى 100 مرة مقارنة ببحث واحد في غوغل يعد رهاناً آمناً. ومع ذلك، لا تعرض Bard للمستخدمين أي إعلانات (حتى الآن) ، لذلك ليس من الواضح أنها ستكون قادرة على ربح حتى جزء بسيط من عائدات كبسة البحث العادية بأناقة.

تصر الشركة على أن بعض الاستفسارات ستتم الإجابة عليها بشكل أفضل من خلال البحث (بما في ذلك سؤالي الخاص عن اليابان)، وإذا كان Bard بمثابة استراتيجية مكلفة لدرء تدفق محتمل من المستخدمين وانسحابهم إلى Bing و ChatGPT فقد يكون ذلك جيداً بما فيه الكفاية على المدى القصير. لكنها تبدو كاستراتيجية معلقة حيث يجب أن تسعى غوغل إلى البحث بين النجوم.

----

بقلم: أليكس هيرن

ترجمة عن موقع: The Guardian