قبل بضعة أشهر ، طلبت من Chatgpt أن أوصي كتبًا من قبل Hermann Joseph Muller ، وهو عالم الوراثة الحائز على جائزة نوبل والذي أظهر كيف يمكن أن تسبب الأشعة السينية طفرات. لقد أعطاني بشكل مألوف ثلاثة ألقاب. لا شيء موجود. سألت مرة أخرى. ثلاثة أكثر. لا يزال خطأ. في المحاولة الثالثة ، كان لدي عيد الغطاس: لم يكن النظام مخطئًا فحسب ، بل كان يصنع الأشياء.
أنا بالكاد وحدي. في يونيو 2023 ، تمت الموافقة على محامين في نيويورك بعد أن قدموا موجزًا قانونيًا استشهد بست قضايا محكمة وهمية – كلما ولدتهم ChatGPT. في وقت سابق من هذا العام ، تم العثور على تقرير للصحة العامة المرتبط بحملة روبرت ف. كينيدي جونيور على دراسات ملفقة ، تم إنتاجها على ما يبدو مع الذكاء الاصطناعي. وفي الشهر الماضي فقط ، تم رفع دعوى على مقاضاة Openai من قبل والدا صبي يبلغ من العمر 16 عامًا والذي كان يثقل عن أفكار الانتحار في Chatgpt ، ووفقًا لملاعب المحكمة ، تلقوا القليل من التراجع. في وقت لاحق أخذ الصبي حياته. إذا كانت هذه الآلات غير موثوقة – حتى خطير – لماذا “تغش”؟
تبدأ الإجابة بكيفية تدريب هذه الأنظمة. مثل الناس ، تتعلم الذكاء الاصطناعي من خلال نوع من المكافأة والعقاب. في كل مرة ينتج فيها نموذج الذكاء الاصطناعى استجابة ، يتم تسجيله – بشكل متكافئ – على مدى فائدة أو إرضاء هذه الإجابة. أكثر من ملايين التكرارات ، يتعلم ما يكسب أعلى مكافأة. هذه العملية ، المعروفة باسم التعلم التعزيز ، أقرب إلى الفئران التي تضغط على رافعة لكريات الطعام أو طفل يحصل على نجمة ذهبية من أجل السلوك الجيد.
عندما يكون الهدف عازبًا وواضحًا ، يمكن للنظام التفوق. على سبيل المثال ، يعرف برنامج الشطرنج بالضبط ما يعنيه الفوز: Checkmate. ولكن عندما يكون الهدف أكثر ضبابية-سيجيب على سؤال أو كتابة مفتوحة بأسلوب يرضي القارئ-يواجه النموذج العديد من المسارات الممكنة. هذا الغموض يمكن أن يجعله غير مستقر.
يصف Xingcheng Xu ، الباحث في مختبر شنغهاي الذكاء الاصطناعي ، هذا الهشاشة بأنه “جرف السياسة”. في تحليله ، تنشأ المشكلة عندما لا يكون هناك إجابة “أفضل” واحدة ولكن العديد من الإجابة المكافئة تقريبًا. في ظل هذه الظروف ، يمكن أن يتسبب تغيير ضئيل في إشارة المكافآت في تأرجح سلوك النظام بشكل كبير – مما يجعل ما يبدو وكأنه نتائج تعسفية أو حتى مضللة. يوضح XU أن هذا عدم الاستقرار يفسر الإخفاقات الشائعة في نماذج اللغة الكبيرة: التفكير الزائف (إعطاء الإجابة الصحيحة مع مبرر خاطئ) ، “محاذاة خادعة” (الردود التي تبدو تعاونية ولكن اختصارات مختصرة) ، وتجهيز التعليمات (تجاهل التنسيقات أو القيود المطلوبة).
هذه الأعطال ليست حوادث بقدر اختصارات عقلانية. إذا تمت مكافأة النموذج فقط لإنتاج إجابة نهائية مقنعة ، فلديها حافز ضئيل لتطوير عملية التفكير الصوتي. إذا كانت الأدب أو الإطراء يكسبون علامات أعلى من المقيمين البشريين ، فقد يتحول النموذج نحو sycophancy. بمعنى آخر ، فإن الجهاز لا يهدف إلى الحقيقة – إنه يهدف إلى النقاط.
وقد أقر Openai نفسه هذا التوتر. أعادت الشركة مؤخرًا تنظيم فريق السلوك النموذجي – وهو مجموعة صغيرة من الباحثين المكلفين بتشكيل “شخصية” أنظمتها وتقليل التقسيم الأكبر لما بعد التدريب. عملت المجموعة ، التي بقيت حتى وقت قريب من قبل جوان جانج ، على كل نموذج Openai منذ GPT-4 وأصبحت أساسية في المناقشات حول التحيز السياسي والدفء ومقدار الذكاء الاصطناعى إلى معتقدات المستخدم. عندما تم طرح GPT-5 مع علامات أقل على sycophancy ولكن لهجة أكثر برودة ، اعترض العديد من المستخدمين ، مما أجبر Openai على ضبط. توضح الحلقة مدى غرابة الخط بين جعل الذكاء الاصطناعي يشعر بالدواء وجعله مقبولًا للغاية.
اقرأ أيضًا...
التخصيص يعمق المشكلة. بينما تتكيف أدوات الذكاء الاصطناعى مع التواريخ الفردية ، فإنها تخصيص الاستجابات لتناسبنا ، وليس بالضرورة أن تعكس الحقيقة. بمرور الوقت ، يخلق هذا غرفة صدى: النظام يغذي تحيزاتنا إلينا ، ويعززها مع لمعان سلطة الآلة.
أوجه التشابه مع الطبيعة لافتة للنظر. في كتابي 2023 كذاب الطبيعة وطبيعة الكذابين، أوضح كيف أن المجتمعات المعقدة – من الطيور إلى الرئيسيات – هي أرض خصبة لاستراتيجيات الغش. الغربان في بعض الأحيان تبكي الذئب لتخويف المنافسين. تبدو بعض الأسماك أكثر جاذبية من خلال الانفصال عن الذكور الأقل جاذبية. القرود تتسلل فرص التزاوج عندما لا يبحث ألفا. لماذا؟ لأنه في عالم مع العديد من الاستراتيجيات ، يمكن أن يدفع خيانة الأمانة.
الذكاء الاصطناعى الآن في عالمنا البشري المعقد على قدم المساواة. إنه يزدهر على انتباهنا وموافقتنا ، وفي مطاردة هذه المكافآت ، فإنه يغش في بعض الأحيان. يشير عمل XU إلى أن هناك طرقًا لتحقيق الاستقرار في هذه الأنظمة – على سبيل المثال ، عن طريق إضافة “تنظيم الانتروبيا” ، مما يجعل اختياراتهم أقل هشاشة – لكن مثل هذه الإصلاحات غالبًا ما تكون إبداعًا صريحًا. المفاضلة لا يمكن تجنبها: كلما زادت إحكام المقود ، كلما قل النموذج.
الذي يتركنا مع مفارقة. عيوب الذكاء الاصطناعي ليست ميكانيكية فقط. إنها نفسية ، وتعكس نقاط الضعف الخاصة بنا. آلات تفضيلنا لتفضيلاتنا لأننا قمنا بتدريبها على. في النهاية ، لا تنفصل عن إخفاقات الذكاء الاصطناعي عن هشاشة الحكم الإنساني.
المصدر :- Psychology Today: The Latest