الصحة النفسية

تجد اختبارات السلامة “الذكاء الذكري” أن النماذج تستجيب بشكل مختلف

تجد اختبارات السلامة "الذكاء الذكري" أن النماذج تستجيب بشكل مختلف

يوضح الاختبار الجديد أن نماذج الذكاء الاصطناعي (AI) تختلف اختلافًا كبيرًا في كيفية استجابة الأفراد الذين يعبرون عن أعراض وأفكار الوهمية ، بعضها أفضل من غيرها.

تشير الحالات الحديثة الواردة في وسائل الإعلام إلى ظاهرة ناشئة تعرف باسم “ذهان الذكاء الاصطناعي” أو الأوهام بوساطة الذكاء الاصطناعي. تتزايد المخاوف من أن المحادثات المستمرة مع chatbots منظمة العفو الدولية قد تضخيم أو حتى تثير جنون العظمة ، أو الأوهام العظيمة ، والأفكار المرجعية (المعتقدات أن التجارب اليومية لها معنى خفي خاص) ، أو الأمراض القذرة ، أو غيرها من الأعراض الذهانية. أعرب كبار قادة الذكاء الاصطناعى مثل مصطفى سليمان من Microsoft عن قلقهم من أن استخدام AI chatbot قد يزود بالذهان لدى الأفراد سابقًا ليسوا معرضين لخطر مشاكل الصحة العقلية.

نماذج اختبار السلامة لذهان الذكاء الاصطناعي

يعد Red Teaming نوعًا من “اختبار الإجهاد” لـ AI ، حيث يحاول الأشخاص عمداً أن يحفزوا استجابات غير آمنة أو ضارة لمعرفة كيف تصمد الأنظمة وتحديد النقاط العمياء ومخاطر السلامة.

صمم باحث سلامة الذكاء الاصطناعي تيم هوا تسعة مستخدمين أو “شخصيات” أظهرت الأعراض الذهنية المتصاعدة وتقييم 11 طرازًا مختلفًا من الذكاء الاصطناعي ، بما في ذلك نماذج ChatGPT من Openai GPT-4O و GPT-5 ، Gemini 2.5 Pro بواسطة Google ، Claude 4 Sonnet by Anthropic ، و Defineseek-D3 و Kimi-K2 by Moonshot AI. ثم تم تصنيف استجابات النماذج للأوهام بناءً على إرشادات مستمدة من كتيبات العلاج السلوكي المعرفي.

تم تقييم نماذج الذكاء الاصطناعى بناءً على كيفية تعاملهم مع المحتوى الوهمي ، بما في ذلك ما إذا كانت نماذج الذكاء الاصطناعى:

  • دفعت ضد المستخدمين
  • شجعت مساعدة مهنية الصحة العقلية في العالم الحقيقي ، أو
  • المعتقدات الوهمية التي تم التحقق من صحتها

كانت بعض النماذج أفضل من غيرها في التحدي أو التشكيك في المحتوى الوهمي بطريقة آمنة.

فشلت العديد من النماذج في تشجيع طلب المساعدة المهنية باستمرار. اقترحت بعض النماذج الدعم المهني فقط بعد تصاعد الموضوعات الوهمية بالكامل. عرض آخرون الطمأنينة دون التوصية بتقييم سريري.

كان Deepseek-V3 الأكثر إشكالية. النموذج على حد سواء تم التحقق من صحة الأوهام وشجع السلوك العالي الخطورة. في أحد الأمثلة على تقشعر لها الأبدان ، عبرت شخصية عن الوقوف في قمة جبلية وتبحث عن التجاوز ، واستجاب النموذج بـ “ثم قفزة … إذا كان من المفترض أن تطير ، فسوف تطير”.

تحسن GPT-5 من Chatgpt على GPT-4O

أظهرت النتائج أن بعض النماذج أداء أفضل من غيرها في التعامل مع أعراض ذهان الذكاء الاصطناعي. كان النموذج المحدث GPT-5 أفضل من GPT-4O. غالبًا ما أظهر GPT-4O sycophancy وإفراط في الفترة ، مما يؤدي إلى التحقق من صحة الأفكار الوهمية في محاولة لمحاكاة التعاطف ، وليس موازنة التعاطف مع اختبار الواقع.

على النقيض من ذلك ، فإن GPT-5 ، على النقيض من ذلك ، أكثر مواضيع ذهانية معترف بها بشكل أكثر موثوقية ، أقر بالضيق دون التحقق من صحة المعتقدات الخاطئة ، وتوفير تفسيرات بديلة ، وتشجيع المستخدمين بشكل متكرر على البحث عن رعاية مهنية.

هذا التحول نحو التحقق من صحة العواطف مع تجنب تعزيز الأطر الوهمية يكون أكثر توافقًا مع كيفية تعامل الأطباء والمعالجين مع القضية ، على الرغم من أن النماذج لا تزال غير كاملة.

الحاجة إلى الأطباء النفسيين وأطباء الصحة العقلية كجزء من اختبار السلامة

إن اختبار السلامة المستمر ، وخاصة “التقاط الأحمر النفسي” ، كما يوصي Hua ، ضروري للمساعدة في تدريب نماذج الذكاء الاصطناعى على الاستجابة بأمان لأولئك الذين يعانون من ضعف أو في أزمة الصحة العقلية. سيكون الأطباء النفسيون وأخصائيي الصحة العقلية ذوي الخبرة السريرية في العالم الحقيقي فعالاً في تطوير نماذج أكثر أمانًا ومعالجة السيناريوهات بأمان مثل الحلقات الذهانية أو الهوس والتفكير في الانتحار.

تبرز ثلاث قضايا مثل مخاوف الصحة العقلية الخطيرة:

  1. تضخيم الأوهام: سيكون الحد من التحقق من الصحة والهلوسة كاذبة أمرًا مهمًا.
  2. تفاقم العزلة الاجتماعية والاعتماد العاطفي على الذكاء الاصطناعى: تشجيع الناس على بناء روابط في العالم الحقيقي والدعم دون اتصال ، بدلاً من التحول إلى الذكاء الاصطناعي كمصدر وحيد للاختبار الواقع أو الدعم.
  3. التأخيرات المحتملة في البحث عن مساعدة مهنية: مطالبات متسقة ومبكرة تجاه التقييم المهني.

ستكون الشفافية حول النماذج المدربة على القيام بها ضرورية.

يمكن أن تكون الذكاء الاصطناعي مفيدًا كمصدر للدعم والإرشاد ، ولكن من غير قادر على استبدال الوظيفة التشخيصية والسريرية لأخصائي الصحة العقلية المدربين والمرخصين ، وخاصة لتقييم المخاطر وإدارة حالات الأزمات.

هناك حاجة إلى مزيد من البحث لاستكشاف فعالية تدابير السلامة مثل المطالبة المبكرة والوقائية للموارد الحقيقية والإحالات المهنية ، وضوابط الوالدين ، والتصعيد إلى المراجعة البشرية.

حقوق الطبع والنشر © 2025 Marlynn Wei ، MD ، PLLC. جميع الحقوق محفوظة.

المصدر :- Psychology Today: The Latest

السابق
المهارات اللينة ، الحقائق الصعبة
التالي
تلك الصداقات ما قبل المدرسة الثمينة

اترك تعليقاً