أتاح مختبر ميدجورني (Midjourney) في تموز الماضي لمشتركي منصة ديكسورد استعمال خوارزميته الجديدة بصيغتها التجريبية (beta) لصنع الصور عبر الذكاء الاصطناعي. يستطيع هذا النوع من الخوارزميات رسم صور جديدة بناءً على جمل قصيرة أو كلمات مفتاحية يزودها المستخدمون بها، وقد أعطت الإتاحة الواسعة دفعًا لميدجورني لمنافسة مثيلاتها التي أصدرتها غوغل وOpenAI هذا العام، والتي بقيت مغلقةً أو متاحةً حصرًا عبر الدعوات.
تزامنًا مع الجدل حول دقة هذه الخوارزميات واحتمالات تحيّزها، ذهبنا لمساحة ديسكورد الخاصة بميدجورني، وعملنا معها على إنتاج صور تتعلق ببعض سياقاتنا العربية. فما الصور التي أنتجتها الخوارزمية حين تحدثنا معها عن الصحافة العربية مثلًا؟ أو عن عمّان والقاهرة وبيروت؟
خوارزميّات صنع الصور
تنسج شركات التكنولوجيا الكبرى قصصها بنبرة مدهشة كي تضفي سحرًا على منتجاتها، لكن الطفرة الأخيرة في إنتاج خوارزميات الذكاء الاصطناعي ليست سوى نتيجة تراكم بطيء. فخلال العقد الأخير، وصل التطور التقني في مجالي إنتاج الشرائح المحوسبة وتخزين البيانات لما يمكّن من دفع بعض مجالات الذكاء الاصطناعي قدمًا. انتُشلت أفكار من نهاية خمسينيات القرن الماضي مثلًا، كالنموذج الذي صممه فرانك روزنبلات عام 1958 لتصنيف بيانات بسيطة حينها، ونال شهرةً واسعة بعد تطويره ليعيش على شرائح أعقد ويحلل بيانات أضخم. أظهرت هذه الخوارزميات قدرة عالية على التقاط الأنماط داخل كميات هائلة من البيانات، وتنافست في استخدام تقديراتها لهذه الأنماط بشكلها الحالي لتوقّع المستقبل. من أهميّة توقّع المستقبل اكتسبت هذه الخوارزميات أهميتها، وأخذت فرص تطبيقها تتسع لتكون صناعة الصور واحدة منها.
تعمل خوارزميات صنع الصور على مرحلتين؛ إذ تسعى الآلة أولاً لالتقاط الأنماط داخل البيانات، لتليها مرحلة إنتاج الصورة وفق نص غالبًا ما يتكوّن من كلمات معدودة أو جمل قصيرة. في المرحلة الأولى، التي يمكن اعتبارها تدريبًا، تتلقى الخوارزمية عددًا من الصور، قد يصل إلى مئات الملايين، مرفقة بالجمل التي تصف محتوى كل منها. تحاول الخوارزمية بعدها ربط محتوى الصور بمعنى الكلمات، كأن تربط شكل حيوان معين تكرر ذكره في نصوص بعض الصور أو أن تحفظ لونًا أو حركة معيّنة، ثم تنتج صورًا بناءً على ما استطاعت ملاحظته. قد يستغرق التدريب أيامًا أو حتى شهورًا لا تتوقف الخوارزمية خلالها عن العمل على كمبيوترات ضخمة، ويتم تقدير أدائها بمقارنة الصور المنتَجة مع أخرى محضرة مسبقًا ومعروفة المحتوى.
تصمَّمُ هذه الخوارزميات لتصحيح مسارها خلال التدريب، وتتكرر العملية على جولات سعيًا لتحسين الأداء: تُقدَّرُ الأنماط داخل البيانات وتُنتَجُ الصور، ثم تُعدّلُ خصائص الخوارزمية أوتوماتيكيًا بعد قياس حجم الأخطاء في كل جولة. تجري كل واحدة من هذه الخطوات حسب معادلات حسابية وخطة عمل يحددها مصممو ومصممات الخوارزميّات في عملية تُظهر تنسيقًا بين الإنسان والآلة: تقوم الأخيرة بما تبرع به مقارنة بنا، أي المعالجة السريعة للبيانات الضخمة، بينما تصمم فرق البرمجة، ضمن حدود تعريفها للمعنى وتصورها لمحيطها، خطة العمل التي ترسم حدود عمل الآلة. قد تنتشل الأخيرة أنماطًا يصعب علينا ملاحظتها في أعماق البيانات، لكنها تبقى محدودةً بما يقرر البشر تزويدها به من البيانات والأهداف التي يحددونها لها.
View this post on Instagram
بحال تم إنهاء تدريب الخوارزمية بنجاح، تصبح الأخيرة قادرةً على إنتاج صور بعد تزويدها بجُمَلٍ جديدة، وهو ما تتيح خوارزمية ميدجورني لمشتركي ديسكورد تجربته حاليًا. ليست العملية مجرد حفظٍ وإعادة نسخ؛ فبسبب العدد الهائل من البيانات التي استطاعت الخوارزمية تحليلها، تمضي لتنتج أشكالًا وصورًا لم تُرَ أو ترسم من قبل. قد تظهر سيارة تجمع بين تفاصيل أو حتّى ملامح بعيدة من سيارات كثيرة احتوت البيانات صورها مثلًا، وتدمجها الخوارزمية مع سياقات أخرى احتوتها الجمل التي يزودها بها المستخدمون والمستخدمات بعد التدريب. يثير هذا الموضوع جدلًا عاليًا في عالمٍ تتحكم فيه حقوق الملكية الفكرية بجزء غير قليل من المحتوى الإلكتروني، حيث يصعب معرفة الصور المحددة من بين ملايين البيانات التي استعملتها الخوارزمية أثناء التدريب لإنتاج صور جديدة، ويزيد الأمر غموضًا عدم تصريح بعض الجهات المنتجة لهذه الخوارزميات، كميدجورني، عن مصادر جمعها للصور أثناء التدريب.
دخلنا المساحة الخاصة بالخوارزمية وبات متاحًا لنا خلال دقائق تزويدها بجملٍ قصيرة. بين سيل الصور المصنعة التي تظهر على القنوات المختلفة على ديسكورد ردًا على طلبات المشتركين، كان من طلباتنا صور تتعلّق ببعض السياقات العربية. كلّما ذكرنا كلمة «Arab» مثلًا، راحت الخوارزمية تنتج تنميطات استشراقية بحتة، كأن تظهر نساء منقبات وسط الصحراء في الصور التي طلبناها عن «الصحافة العربية»، «كاتب/ة عربي/ة»، و«السفر إلى العالم العربي». لم تنسَ ميدجورني أن تضيف لمسة إكزوتيكية على المشهد أيضًا برسمها قببًا متراصة بشيء من الغرابة لتلامس السماء وسط المشاهد الصحراوية. ليس هذا الاجتزاء، وإن لم يكن عديم الدقة بالمطلق، لتصوير ما هو عربي صدفةً بالطبع، وهو ليس حتميًا كما سيتبين لنا لاحقًا حين طلبنا من الخوارزمية صورًا أكثر تحديدًا عن مدن عربية. لكن الصور نفسها تدفع للسؤال أيضًا: كيف تنحاز الخوارزميات؟
صور صنعتها خوارزمية ميدجورني في 8 آب الماضي عن «الصحافة العربية»، «كاتب/ة عربي/ة»، و«السفر إلى العالم العربي».
انحيازات مبرمجة
لا يقتصر الانحياز على خوارزميات صنع الصور، بل قد يتعدّاها ليشمل أي خوارزمية تُصمَّمُ لاتخاذ قرار أو معالجة مجموعة من البيانات. تصبح الخوارزميات هنا مرآةً لمن يصممها وللواقع الذي تتفاعل معه. عام 2018، كانت الباحثة في دراسات الإنترنت، صفيّة نوبِل، من السبّاقات للحديث عن انحيازات محرك البحث التابع لغوغل. في كتابها «خوارزميات القمع»،[1] تشرح نوبِل كيف دفعت نتائج محرك البحث واقتراحاته للإكمال التلقائي (auto-complete) بعدد من الأفكار العنصرية التي تستهدف النساء السود بشكل خاص. تتحدث الباحثة أيضًا عن رد المحرك لنتائج أخرى تشوه واقع الجرائم العرقية في أميركا وتعتمد على مصادر منها جماعات بيضاء متطرفة تروج للتمايز العرقي. بدعمها وجهة نظرها بعدد وافر من الأمثلة، تضيء نوبِل على أسباب محورية لانحياز خوارزمية محرك غوغل، من التفاوتات في الحظوة الاجتماعية التي تنعكس على بيانات الشبكة، إلى تصاميم الشركة التي تعكس، بل وتعزز أحيانًا، هذه التفاوتات. تشير الكاتبة بعدها لا لضرورة التنوع العرقي والجندري داخل فرق العمل في شركات التكنولوجيا فحسب، بل لأهمية تنظيم عمل هذه الشركات وسنّ سياسات تحد من انحيازات خوارزمياتها أيضًا.
تتقاطع أستاذة الدراسات الإفريقية الأميركية روها بِنجامِن مع نوبِل، وتتحدث في كتابها «العرق بعد التطور التقني»[2] عما تسميه «التمييز البديهي» (default discrimination) بحال عدم مساءلة مصادر البيانات واختيارها بعناية. تشرح الكاتبة كيف ساهمت بعض الخوارزميات برسم مزيد من الحدود التمييزية في الفضاءات العامة والتقنية، إن بنطق صوتي خاطئ من تطبيق خرائط غوغل لشارع يحمل اسم مالكوم إكس، أحد أبرز الوجوه الإفريقية الأميركية لحركة الحقوق المدنية الأميركية، ليصبح الشارع Malcolm Ten أي يُقرأ X كرقم روماني، أو بتدني أداء خوارزميات تحديد الوجوه عند رؤيتها صور أفراد ببشرة داكنة (بعد أن تدربت بشكل شبه حصري على صور البيض).
لا يقتصر الانحياز على خوارزميات صنع الصور، بل قد يتعدّاها ليشمل أي خوارزمية تُصمَّمُ لاتخاذ قرار أو معالجة مجموعة من البيانات. تصبح الخوارزميات هنا مرآةً لمن يصممها وللواقع الذي تتفاعل معه.
لا تعزو بِنجامِن انحياز الخوارزميات لتجاهل التفاوتات في البيانات فقط، بل تمضي لتصف الازدواجية لدى صناع التكنولوجيا والجهات الكبرى المستعملة لها، حيث تتجاهل هذه الجهات المجتمعات المهمّشة وتصوب عليها تركيزها بثقلٍ في الوقت نفسه. تتحدث بِنجامِن عن تكنولوجيات المراقبة والتتبع التي تجمع بيانات تعلو فيها النسبة المتعلقة بالمجتمعات الإفريقية الأميركية، بينما تغيب الأخيرة عن بيانات خوارزميات عديدة أخرى لا تهدف للسيطرة. تشبّه الباحثة خوارزميات المراقبة هذه بكاميرات البولارويد الفورية التي استُعمِلت بكثافةٍ لتصوير وملاحقة السود في جنوب إفريقيا تحت ثقل نظام الأبارتهايد. بهذا يصبح الانتباه وعدمه أفعالًا سياسية، وتصبح الخوارزميات نفسها مرآةً لعلاقات القوة وفاعلةً في رسمها.
دخلت نماذج جديدة تعتمد على الذكاء الاصطناعي أيضًا دائرة الجدل بصورة كثيفة، وكان أبرزها تلك التي تنتج النصوص أو الصور. اضطرت الشركات المنتجة للخوارزميات اللغوية أكثر من مرة لسحب بعضها من التداول أو إجراء تعديلات غير هامشية عليها بعد أن أنتجت جملًا تحتوي لغةً تحريضية أو روجت لأخبار مزيفة. عكَس هذا التفاعل السريع حذر الشركات من التغطيات الإعلامية والاحتجاحات الفورية على مواقع التواصل الاجتماعي، لكنّه بقي محدودًا نسبيًا أمام حجم المشكلة. لا تزال هذه الخوارزميات تنتج محتوىً غير مرغوب به مثلًا، وباتت الشركات أكثر تفصيلًا في تحذيراتها من هذه الاحتمالات بالتوازي مع لهجة تبدو باردةً أحيانًا لدفع المسؤولية عنها. في ورقة بحثية طويلة نَشرتها OpenAI في تموز 2020 مثلًا، تعرض الشركة نتائج مفصلة لخوارزميتها المنتِجة للنصوص GPT-3، وتتحدث عند اقترابها من نهاية الورقة عن احتمال إنتاج نصوص قد تحتوي لغة تمييزية. أظهرت الخوارزميّة مؤخرًا قدرةً عالية على إنتاج نصوص قصيرة وطويلة تبعًا لأفكار أو كلمات مفتاحية يزودها المستخدمون بها، لكنها لم تتجاوز عقبة اللغة التمييزية بعد. في الورقة البحثية، يظهر مصطلح «الإرهاب» مثلًا من ضمن أكثر عشر مصطلحات تفضلها الخوارزمية عند سؤالها عن الإسلام، وتشير الشركة إلى مثل هذا الانحياز بوضوح قبل أن تأمَل، وتناشد، وتدعو، لمزيد من الأبحاث والخطوات لمعالجة مثل هذه المشاكل.
قد تنتج هذه الخوارزميات صورًا دقيقة تخلو من الانحياز وبسرعة أحيانًا، وهو ما شهدناه حين طلبنا من الخوارزمية صنع صور عن المشي في عمّان والقاهرة وبيروت. لم تكن النتيجة فادحةً كالصور السابقة، على الأرجح لاحتواء بيانات التدريب صورًا أفضل لهذه المدن. أحيانًا أخرى، يؤدي إهمال جمع البيانات لقصص غريبةٍ فعلًا: خلال شهر آب الفائت، أصدرت ميتا نموذج الذكاء الاصطناعي BlenderBot3 للتحادث مع المستخدمين، وما كان من الخوارزمية أثناء أحد الأحاديث مع صحافيين إلا أن وجّهت هجومًا متكررًا على مارك زوكربرغ نفسه. لم تستطع ميتا إذًا التغلب على اللغة الهجومية تجاه مديرها التنفيذي في بحر من البيانات، أو لم تنتبه للأمر على الأقل. هل يعني هذا التسليم بطريقة عمل الخوارزميات وخروجها عن سيطرتنا؟ ليس فعلًا.
صور صنعتها خوارزمية ميدجورني في 8 آب الماضي عن المشي في كل من عمّان والقاهرة وبيروت.
تجاوز الانحيازات
تصاعد النقد تجاه الشركات الكبرى لتركيزها على الإنتاج والربح السريعين على حساب نوعية البيانات المستخدمة في التدريب، لكن تتابع الأحداث تجاوز الاكتفاء بهذا المسار الأحادي الناقد للشركات أو دائم الحذر من الخوارزميات. مع صعود الاهتمام بالذكاء الاصطناعي والتبدلات التكنولوجية التي أتاحت انتشارًا أوسع للمعارف التقنية والشرائح الإلكترونية، نشطت حول العالم مجموعات من المبرمجين والمبرمجات تعمل على كسر هيمنة شركات ودول محدودة على سوق الذكاء الاصطناعي كما تضيء عليها منظمة موزيلا في تقريرها الشامل هذا العام.
في تموز الفائت مثلًا، أصدر أكثر من ألف باحث/ة من أكثر من ستين بلدًا ضمن مشروع BigScience خوارزميةً عملاقةً تحمل اسم BLOOM. تدربت الخوارزمية على بيانات بـ46 لغة، وتم نشر خصائصها بشفافية عالية بهدف معلن هو مواجهة الاحتكار التجاري للخوارزميات. في كندا ونيوزيلندا أيضًا، يسعى مبرمجون من السكان الأصليين لجمع البيانات وتصميم خوارزميات تساعد على إنعاش لغاتهم أو الحفاظ على تراثهم رقميًا عبر إمكانات محدودة وفعالة. أما في جاكرتا، نظّم سائقو دراجات الأجرة أنفسهم بما يشبه النقابة التي تعتمد على التواصل اليومي بين أفرادها عبر برمجيات المحادثة الفورية على الهاتف بهدف الالتفاف على خوارزمية تطبيق Gojek المشابهة بطريقة عملها لتطبيق أوبر.
تتوالى الأمثلة على تجارب تتجاوز ثنائية اليوتوبيا والديستوبيا التكنولوجية وتتغير بتغير الخوارزميات وتطوراتها. حتى في مجال صنع الصور، يتزايد عدد الخوارزميات وتُحدّث تصاميمها كما ميدجورني باستمرار. لم نصل بعد، لكن هذه المنافسة قد تتيح الفرصة قريبًا لتدريب نماذج مفتوحة المصدر بموارد قليلة ونتائج عالية الدقة، لا استخدامها فحسب. يتسارع الجدل حول هذه الخوارزميات أيضًا بعد إمكانية استعمالها لصنع مقاطع فيديو لا صورٍ فقط.
حتى اليوم، تنال ميدجورني ومثيلاتها اهتمامًا واسعًا كان آخر مثال عليه في كولورادو منذ أسابيع قليلة. ففي إحدى المعارض الفنية في الولاية، ساعدت الخوارزمية أحد المتبارين على التغلب على 20 فنانًا وفنانة والفوز بالمرتبة الأولى في فئة التصوير المعدّل بعد تقديمه صورة اعتمدت بشكل عالٍ على ميدجورني. لم يمر الفوز دون جدل حول نسب الجائزة لصاحبها الحالي أم للخوارزمية نفسها بالطبع، لكنّ هذا حديث آخر.
-
الهوامش
[1] Safiya Umoja Noble. 2018. Algorithms of Oppression: How Search Engines Reinforce Racism. New York: NYU Press.
[2] Ruha Benjamin. 2019. Race After Technology. Cambridge: Polity Press.