لماذا تغش الذكاء الاصطناعى: علم النفس العميق وراء التعلم العميق

قبل بضعة أشهر ، طلبت من Chatgpt أن أوصي كتبًا من قبل Hermann Joseph Muller ، وهو عالم الوراثة الحائز على جائزة نوبل والذي أظهر كيف يمكن أن تسبب الأشعة السينية طفرات. لقد أعطاني بشكل مألوف ثلاثة ألقاب. لا شيء موجود. سألت مرة أخرى. ثلاثة أكثر. لا يزال خطأ. في المحاولة الثالثة ، كان لدي عيد الغطاس: لم يكن النظام مخطئًا فحسب ، بل كان يصنع الأشياء.

أنا بالكاد وحدي. في يونيو 2023 ، تمت الموافقة على محامين في نيويورك بعد أن قدموا موجزًا قانونيًا استشهد بست قضايا محكمة وهمية – كلما ولدتهم ChatGPT. في وقت سابق من هذا العام ، تم العثور على تقرير للصحة العامة المرتبط بحملة روبرت ف. كينيدي جونيور على دراسات ملفقة ، تم إنتاجها على ما يبدو مع الذكاء الاصطناعي. وفي الشهر الماضي فقط ، تم رفع دعوى على مقاضاة Openai من قبل والدا صبي يبلغ من العمر 16 عامًا والذي كان يثقل عن أفكار الانتحار في Chatgpt ، ووفقًا لملاعب المحكمة ، تلقوا القليل من التراجع. في وقت لاحق أخذ الصبي حياته. إذا كانت هذه الآلات غير موثوقة – حتى خطير – لماذا “تغش”؟

تبدأ الإجابة بكيفية تدريب هذه الأنظمة. مثل الناس ، تتعلم الذكاء الاصطناعي من خلال نوع من المكافأة والعقاب. في كل مرة ينتج فيها نموذج الذكاء الاصطناعى استجابة ، يتم تسجيله – بشكل متكافئ – على مدى فائدة أو إرضاء هذه الإجابة. أكثر من ملايين التكرارات ، يتعلم ما يكسب أعلى مكافأة. هذه العملية ، المعروفة باسم التعلم التعزيز ، أقرب إلى الفئران التي تضغط على رافعة لكريات الطعام أو طفل يحصل على نجمة ذهبية من أجل السلوك الجيد.

عندما يكون الهدف عازبًا وواضحًا ، يمكن للنظام التفوق. على سبيل المثال ، يعرف برنامج الشطرنج بالضبط ما يعنيه الفوز: Checkmate. ولكن عندما يكون الهدف أكثر ضبابية-سيجيب على سؤال أو كتابة مفتوحة بأسلوب يرضي القارئ-يواجه النموذج العديد من المسارات الممكنة. هذا الغموض يمكن أن يجعله غير مستقر.

يصف Xingcheng Xu ، الباحث في مختبر شنغهاي الذكاء الاصطناعي ، هذا الهشاشة بأنه “جرف السياسة”. في تحليله ، تنشأ المشكلة عندما لا يكون هناك إجابة “أفضل” واحدة ولكن العديد من الإجابة المكافئة تقريبًا. في ظل هذه الظروف ، يمكن أن يتسبب تغيير ضئيل في إشارة المكافآت في تأرجح سلوك النظام بشكل كبير – مما يجعل ما يبدو وكأنه نتائج تعسفية أو حتى مضللة. يوضح XU أن هذا عدم الاستقرار يفسر الإخفاقات الشائعة في نماذج اللغة الكبيرة: التفكير الزائف (إعطاء الإجابة الصحيحة مع مبرر خاطئ) ، “محاذاة خادعة” (الردود التي تبدو تعاونية ولكن اختصارات مختصرة) ، وتجهيز التعليمات (تجاهل التنسيقات أو القيود المطلوبة).

هذه الأعطال ليست حوادث بقدر اختصارات عقلانية. إذا تمت مكافأة النموذج فقط لإنتاج إجابة نهائية مقنعة ، فلديها حافز ضئيل لتطوير عملية التفكير الصوتي. إذا كانت الأدب أو الإطراء يكسبون علامات أعلى من المقيمين البشريين ، فقد يتحول النموذج نحو sycophancy. بمعنى آخر ، فإن الجهاز لا يهدف إلى الحقيقة – إنه يهدف إلى النقاط.

وقد أقر Openai نفسه هذا التوتر. أعادت الشركة مؤخرًا تنظيم فريق السلوك النموذجي – وهو مجموعة صغيرة من الباحثين المكلفين بتشكيل “شخصية” أنظمتها وتقليل التقسيم الأكبر لما بعد التدريب. عملت المجموعة ، التي بقيت حتى وقت قريب من قبل جوان جانج ، على كل نموذج Openai منذ GPT-4 وأصبحت أساسية في المناقشات حول التحيز السياسي والدفء ومقدار الذكاء الاصطناعى إلى معتقدات المستخدم. عندما تم طرح GPT-5 مع علامات أقل على sycophancy ولكن لهجة أكثر برودة ، اعترض العديد من المستخدمين ، مما أجبر Openai على ضبط. توضح الحلقة مدى غرابة الخط بين جعل الذكاء الاصطناعي يشعر بالدواء وجعله مقبولًا للغاية.

التخصيص يعمق المشكلة. بينما تتكيف أدوات الذكاء الاصطناعى مع التواريخ الفردية ، فإنها تخصيص الاستجابات لتناسبنا ، وليس بالضرورة أن تعكس الحقيقة. بمرور الوقت ، يخلق هذا غرفة صدى: النظام يغذي تحيزاتنا إلينا ، ويعززها مع لمعان سلطة الآلة.

أوجه التشابه مع الطبيعة لافتة للنظر. في كتابي 2023 كذاب الطبيعة وطبيعة الكذابين، أوضح كيف أن المجتمعات المعقدة – من الطيور إلى الرئيسيات – هي أرض خصبة لاستراتيجيات الغش. الغربان في بعض الأحيان تبكي الذئب لتخويف المنافسين. تبدو بعض الأسماك أكثر جاذبية من خلال الانفصال عن الذكور الأقل جاذبية. القرود تتسلل فرص التزاوج عندما لا يبحث ألفا. لماذا؟ لأنه في عالم مع العديد من الاستراتيجيات ، يمكن أن يدفع خيانة الأمانة.

الذكاء الاصطناعى الآن في عالمنا البشري المعقد على قدم المساواة. إنه يزدهر على انتباهنا وموافقتنا ، وفي مطاردة هذه المكافآت ، فإنه يغش في بعض الأحيان. يشير عمل XU إلى أن هناك طرقًا لتحقيق الاستقرار في هذه الأنظمة – على سبيل المثال ، عن طريق إضافة “تنظيم الانتروبيا” ، مما يجعل اختياراتهم أقل هشاشة – لكن مثل هذه الإصلاحات غالبًا ما تكون إبداعًا صريحًا. المفاضلة لا يمكن تجنبها: كلما زادت إحكام المقود ، كلما قل النموذج.

الذي يتركنا مع مفارقة. عيوب الذكاء الاصطناعي ليست ميكانيكية فقط. إنها نفسية ، وتعكس نقاط الضعف الخاصة بنا. آلات تفضيلنا لتفضيلاتنا لأننا قمنا بتدريبها على. في النهاية ، لا تنفصل عن إخفاقات الذكاء الاصطناعي عن هشاشة الحكم الإنساني.

المصدر :- Psychology Today: The Latest

الرعاية الصحية العقلية في الكليات تتوسع، ولكن هل هي فعالة؟

تصميم أنظمة مخصصة صديقة لاضطراب فرط الحركة ونقص الانتباه

الشعور بالذنب والعار لا يعني دائمًا أنك اتخذت خيارًا سيئًا

الصودا الدايت والدماغ

العقوبات الإبداعية قد تكون جيدة للمخالفات البسيطة

نصائح للمساعدة الذاتية يستمر الناس في التغاضي عنها

توقيت الوجبات وإنقاص الوزن قد يكون السر الخفي للحفاظ على…

الشلل بعد تناول الدجاج غير المطهو جيدًا: السبب الصادم

تأثير فرق التوقيت في كأس العالم 2026 على صحة المشجعين

حسنًا، هذه اللدغات: الوقاية من اللدغات البحرية وعلاجها

يقول العلماء إن معظم الناس يحتاجون إلى بروتين أكثر مما…

يساعد هذا العلاج الناشئ الأشخاص على تجنب جراحة استبدال الركبة

Arib تحصل على 23.5 مليون دولار لدفع التكنولوجيا المالية السعودية…

شركة zypl.ai تجمع تمويلاً بقيمة 5.5 مليون دولار لتطوير حلول…

MovitOn تجمع مليوني دولار لإحداث ثورة في الشحن العالمي عبر منصة…

منصة GAGA تجمع 2.5 مليون دولار لإحداث تحول جذري في…

iQtech تؤمن تمويلا استراتيجيا لإحداث ثورة في التدريب الطبي في…

Skipr يجمع 2 مليون دولار لتعزيز التواصل الذكي مع البنية…

اعتقد العلماء أن التهاب الدماغ كان يؤدي إلى الإصابة بكوفيد طويل الأمد، لكن عمليات المسح تحكي قصة مختلفة

لماذا قد يكون الاستماع أقوى دواء

متشابهة ولكن مختلفة! الفرق بين نوبة القلق والنوبة القلبية

هل يمكن للحيوانات الحصول على اضطراب ما بعد الصدمة؟

جذور وتطور العلوم النفسية

الصحة النفسية

لماذا تغش الذكاء الاصطناعى: علم النفس العميق وراء التعلم العميق

اترك تعليقاً إلغاء الرد

الثقل الذي لا يحصى من الاعتداء الجنسي على الأطفال

كيف تفيد المشاركة الموسيقية النشطة صحتك

الذكاء الاصطناعي وقواعد الحياة

اقرأ أيضًا...

لماذا نعمل ، وماذا سنفعل في مستقبل ما بعد العمل

كيف تجعل الحزن أقل وحيدا قليلا