لا تحتمل نماذج الذكاء الاصطناعي بجيلها الأخير المبني على «نماذج اللغة الضخمة» التعامل معها ببطء نظرًا لتسارع المنافسة عليها ولحجم البيانات التي تستهلكها، فبعد تراكم بحثي انطلق في خمسينيات القرن العشرين عبر نماذج إلكترونيّة بسيطة تحاكي الشبكات العصبية البشرية، انتقلت نماذج الذكاء الاصطناعي لمستوى أكثر تعقيدًا خلال العقد والنصف الأخيرين بعدما توفرت لها العوامل اللازمة لذلك: تركز الموارد والاستثمارات التقنية في وادي السيليكون، والبيانات الضخمة التي لم يعد تخزينها صعبًا، والشرائح الإلكترونية السريعة والفعّالة في تحليل البيانات.
وفي تشرين الثاني 2022 جاء إعلان شركة «أوبن إي آي» في سان فرانسيسكو عن نموذج «تشات جي بي تي» كنقطة تحوّل أولى صوّرت نماذج الذكاء الاصطناعي كأدوات لصناعة دهشةٍ تتجاوز الجوانب التقنية، وتفاوت النظر إليها بين الانبهار والخوف من قدرات غير معتادة رغم محدوديتها الحالية. وفي الأسبوع الأخير من كانون الأول 2024 أعلنت شركة «ديب سيك»، بعد أقل من عامين على تأسيسها في مدينة هانغتشو الصينية، عن النسخة الثالثة من نموذجها «ديب سيك ڤي 3»، لتكرّس بإعلانها هذا نقطة تحول ثانية.
ما الجديد في «ديب سيك ڤي 3»؟
ركزت شركة «ديب سيك» في إعلانات نماذجها الأولى على كونها مفتوحة المصدر، وتجنبت المقارنات الشاملة مع نماذج مغلقة أكبر وأكثر فعالية في عدد واسع من التطبيقات، خاصة النماذج الأكثر شهرةً مثل «جي بي تي». إلا أن «ديب سيك» لم تكتفِ بتلك الخاصية التي تتيح معرفة تفاصيل النموذج وتعديلها لاستعمالات تجارية أو شخصية، فبعد تجارب بحثية مستمرة أعلنت عن نموذج «ديب سيك ڤي 3» بقدرات تتخطى «جي بي تي 4» في تطبيقات عدة، وذلك بعد تدريب لمدة شهرين زادت تكلفته عن خمسة ملايين دولار، وليست هذه التكلفة قليلة، بل كانت لتبدو -حتى سنوات قليلة ماضية- غير واقعية لتدريب نموذج تقني واحد، لكنها تشير إلى عكس ذلك إذا ما قورنت مع تكاليف تدريب النماذج المنافسة.
على سبيل المثال، لم تعلن «أوبن إي آي» عن تفاصيل تدريب «جي بي تي 4»؛ وهو النموذج الأساس لنماذج أخرى تنتجها الشركة اليوم، لكن التقديرات التقنية للكلفة تتراوح بين 60 إلى ما يزيد عن 100 مليون دولار عبر استعمال آلاف الشرائح الإلكترونية شديدة السرعة الحسابية، مع حفظ حوالي 1.8 تريليون عامل متغير (parameter) يستعملها النموذج للإجابة على الأسئلة الموجهة إليه. أي أن التكلفة المالية لتدريب «ديب سيك ڤي 3» هبطت، بحسب التقديرات، أكثر من عشرة أضعاف، كما ينخفض معها عدد العوامل المتغيرة إلى 671 مليار (0.671 تريليون)، يستعملها النموذج انتقائيًا، ما يجعل النموذج الجديد أصغر حجمًا وأسهل تشغيلًا، دون تأثير ذلك على أدائه من حيث الدقّة في الرد على الإجابات، بحسب الشركة المصنّعة.
ومنذ بداية العام لم تتوقف التبعات وردود الفعل إثر إطلاق «ديب سيك ڤي 3». تقنيًا، صارت الشركة الأولى في الصين لجهة إنتاج نماذج ذكاء اصطناعي بمثل هذه القدرات، وبالاعتماد على شرائح تقنية متطورة دون أن تضاهي بتقدمها الشرائح المتوفرة للشركات المنافسة في الولايات المتحدة وشرقي آسيا وغربي أوروبا بسبب منع الولايات المتحدة تصدير الشرائح الأكثر تطورًا للصين. ماليًا، خسرت شركة «إنفيديا» الأميركية المصنعة للشرائح التقنية في 27 كانون الثاني حوالي 600 مليار دولار من قيمتها، وهي الخسارة الأكبر في يوم واحد بتاريخ أسواق البورصة. أما تجاريًا، فقد احتل «ديب سيك» المرتبة الأولى للتطبيقات المجانية على متجر «أبل» بعد إزاحة منافسه الأبرز «تشات جي بي تي». يُذكر أن «ديب سيك» أعلنت عن تعرضها لهجمات سيبرانية دفعتها لإيقاف خدمات التسجيل الجديدة مؤقتًا.
كيف يعمل «ديب سيك ڤي 3»؟
يتألف نموذج «ديب سيك ڤي 3» التقني من نماذج متعددة صغيرة تتشارك العمل فيما بينها أثناء التدريب والرد على الأسئلة. تُعرف هذه الفكرة خوارزميًا بـ«مجموع الخبراء» (mixture of experts)، حيث يمكن اعتبار كل نموذج صغيرٍ خبيرًا في مهمّة معينة يتركز عمله عليها، فيختص «خبيرٌ» بالتعامل مع الأفعال مثلًا، بينما يركز آخر على علامات التوقف والاستفهام، ليتعامل ثالثٌ مع الأرقام أو التاريخ. فيما يعمل جزء آخر من النموذج؛ يسمى بالمحوّل (router)، على تسيير الأجزاء المختلفة من الجمل للـ«خبير» المختص، ويتم التنسيق بين ردودها لتشكيل الرد النهائي الأكثر ترجيحًا من حيث الدقة، وذلك بعد تقدير النموذج للأنماط اللغوية وتوزيع الانتباه على العلاقة بين الكلمات خلال التدريب. تُدرب هذه النماذج الضخمة على مدى أسابيع أو أشهر، وعبر تحليل أعداد هائلة من النصوص يتم جمعها من شبكة المواقع والمكتبات الإلكترونية. ويسعى النموذج -بعد انتهاء التدريب- لتوقّع الكلمات بالتوالي خلال تحضيره للرد، لتدريب «ديب سيك ڤي 3» مثلًا احتاج الفريق لبيانات تضم حوالي 15 تريليون كلمة، وصمّم النموذج ليحاول توقّع كلمات متعددة عند كل خطوة (multi-token prediction) بدل توقعها بشكل فردي بهدف تسريع التدريب وتحسين الأداء معًا.
لم تكن تلك الخطوات الخوارزمية وحدها خلف الأرقام الملفتة لأداء وتكلفة «ديب سيك ڤي 3». فنظرًا للقدرة التقنية المحدودة نسبيًا في الشرائح المتوفرة لدى «ديب سيك» اتجه الفريق المصمم لتخزينٍ منخفض الدقة للبيانات خلال إجراء معظم العمليات الحسابية أثناء التدريب، وهو ما أتاح وفرًا كبيرًا في الوقت المطلوب لانتهاء التدريب وفي مساحة الذاكرة الإلكترونية التي يتطلبها تحليل البيانات، دون تأثير واضح على النتائج. ولاستغلال الموارد المتاحة بطريقة أفضل، اختار الفريق تدريب النموذج على استعمال مجموعات متعددة من مجمل عوامله المتغيّرة، تشكل كل مجموعة منها حوالي 5% فقط من مجمل العوامل (بواقع 37 مليار من أصل 671 مليار)، للعمل على توقع الكلمات سواء خلال التدريب أو الرد لاحقاً على الأسئلة.
ما الذي تعنيه نماذج «ديب سيك» للمستخدمين والمستخدمات؟
أظهرت مقارنات أجرتها «ديب سيك» تفوق نماذجها في حل المسائل الرياضية، وإنتاج البرمجيات الصغيرة، والمحادثة باللغة الصينية، فضلًا عن قدرات عالية في إنتاج النصوص الإنكليزية أيضًا. بالعربية، وعند الرد على أسئلة حول مدن كعمّان وبيروت، أو تاريخ السينما العربية، ردّ النموذج علينا بفقرات موجزة وعامة لا تخلو من الدقة، وعند التحدث معه باللهجات الدارجة استطاع تحليل الأسئلة ورد عليها بلغة فصحى. بمقارنة سريعة مع «تشات جي بي تي 4 أو-ميني» يبدو «ديب سيك ڤي 3» مماثلًا في الأداء للاستعمال اليومي والإجابة على أسئلة محددة لم تتجاوز تفاصيلها تشرين الأول 2023، حين توقفت البيانات المتاحة لتدريب النموذج. ويظهر النموذج «ديب سيك ڤي 3» أكثر «جديّةً» من منافسه أيضًا، حيث احتوت ردود «جي بي تي» على مزاح طفيف عندما سألناه عن طعم القهوة مع الهيل مثلًا، وردّ باستخدام لهجة عامية.
سياسيًا، جاءت ردود النموذجين حيادية جافة، أكثر منها منحازة، على أسئلة متعلقة بالولايات المتحدة، لكن «ديب سيك» لم يُجب على أسئلة سياسية حول الصين أو تايوان مثلًا، طالبًا الحديث عن مسائل أخرى. وقد نالت تلك الردود حيزًا من الانتباه في الفضاء الرقمي إزاء حدود التعبير السياسي التي تفرضها الحكومات والشركات على إجابات تلك النماذج أو محتوى التطبيقات الرقمية، كما أثار نقاشًا ذا طابع أيديولوجي انتقائي بين تيارين؛ ركّز أحدهما على مسألة التضييق على المحتوى الذي ينتجه «ديب سيك ڤي 3»، فيما اختار التيار الثاني التركيز على أهمية دمقرطة الشركة لنماذج الذكاء الاصطناعي الضخمة وتقديم خدماتها وبرمجياتها بشكل مفتوح دون الإشارة لذلك التضييق.
بعد إطلاق «ديب سيك ڤي 3» أعلنت الشركة في 20 كانون الثاني عن نموذج آخر أسمته «ديب سيك آر 1»، ودرّبته على إظهار الخطوات التي تبعها بما يشبه تسلسل الأفكار البشرية قبل الوصول لإجابة ما، لينافس بذلك نموذج أوبن إي آي «أو 1». حتى اليوم، توفر «ديب سيك» هذه النماذج مجانًا، بما فيها تلك الأكثر تطورًا مقارنة بمثيلاتها في «أوبن إي آي» التي يتطلب الاستعمال المفتوح لمعظمها اشتراكات مدفوعة. وقد تابعت «ديب سيك» إصدار نماذجها بشكل متسارع، فأعلنت في 27 كانون الثاني عن نموذج «جانوس-پرو» لإنتاج الصور، وهي لم تضغط بإعلاناتها المتتالية على منافساتها في الولايات المتحدة فحسب، بل دفعت كذلك شركة «كْوِن» الصينية للإعلان أيضًا، في 28 كانون الثاني، عن نموذجها العملاق لإنتاج النصوص.
كيف يبدو التنافس الأمريكي-الصيني التقني؟
عملت الولايات المتحدة خلال الفترة الرئاسية الأولى لدونالد ترمب على منع وصول تقنيات تصنيع الشرائح الأكثر تقدمًا للصين، وشددت إدارة جو بايدن لاحقًا تلك الإجراءات على مراحل، كان آخرها في كانون الثاني الحالي، لمنعها من الوصول للمزيد من أنواع الشرائح أو تقنيات التصنيع إما عبر التنسيق والتفاوض مع حلفاء الولايات المتحدة، أو حتى عبر الضغط عليهم أحيانًا. شجعت تلك الإجراءات الشركات الصينية على البحث عن حلول تقنية أنتجت نماذج اصطناعية متقدمة بكلفة منخفضة. وقد اعتبر ترمب النماذج الصينية الأخيرة لحظة تحذيرية لقطاع التكنولوجيا في الولايات المتحدة، ورحب كلاميًا بها آملًا أن تستفيد الشركات الأميركية منها من أجل الوصول إلى نماذج أقل كلفة.
تعكس هذه التفاعلات معضلات تواجه الولايات المتحدة في محاولتها للفوز بـ«السباق التقني» في مجال الذكاء الاصطناعي، حيث يسبب الحدّ من توريد التقنيات الأكثر تقدمًا أثرًا اقتصاديًا سلبيًا عليها، ويدفع خصومها لتطوير تقنياتها محليًا على حساب الاحتكار الأميركي النسبي لها. وفيما يسهم التركيز على تطوير النماذج مغلقة المصدر، والتي غالبًا ما تعتمد عليها الشركات الكبرى في وادي السيليكون، في مراكمة أرباح هائلة، لكنها تفتح الباب أمام الشركات غير الأميركية، والصينية خصوصًا، لحيازة مكان أوسع في سوق إنتاج النماذج مفتوحة المصدر، والوصول تدريجيًا لصدارة المؤثرين على البرمجيات الأكثر تقدمًا في مجال الذكاء الاصطناعي.
مع ذلك، ليست «ديب سيك» التي نشأت بتمويل من صندوق استثماري يدير استثمارات قدّرت بثمانية مليارات دولار حاملةً لقضايا المهمشين كما قد يصوّرها البعض، وليس التنافس بين الولايات المتحدة والصين، رغم حدّته، مغلقًا لجهة وجود فروع الشركات التقنية بين البلدين وتبادلهما انتاج المعارف إلى حد غير قليل في الفضاء البحثي المفتوح تقنيًا وأكاديميًا.