تجد اختبارات السلامة "الذكاء الذكري" أن النماذج تستجيب بشكل مختلف

يوضح الاختبار الجديد أن نماذج الذكاء الاصطناعي (AI) تختلف اختلافًا كبيرًا في كيفية استجابة الأفراد الذين يعبرون عن أعراض وأفكار الوهمية ، بعضها أفضل من غيرها.

تشير الحالات الحديثة الواردة في وسائل الإعلام إلى ظاهرة ناشئة تعرف باسم “ذهان الذكاء الاصطناعي” أو الأوهام بوساطة الذكاء الاصطناعي. تتزايد المخاوف من أن المحادثات المستمرة مع chatbots منظمة العفو الدولية قد تضخيم أو حتى تثير جنون العظمة ، أو الأوهام العظيمة ، والأفكار المرجعية (المعتقدات أن التجارب اليومية لها معنى خفي خاص) ، أو الأمراض القذرة ، أو غيرها من الأعراض الذهانية. أعرب كبار قادة الذكاء الاصطناعى مثل مصطفى سليمان من Microsoft عن قلقهم من أن استخدام AI chatbot قد يزود بالذهان لدى الأفراد سابقًا ليسوا معرضين لخطر مشاكل الصحة العقلية.

نماذج اختبار السلامة لذهان الذكاء الاصطناعي

يعد Red Teaming نوعًا من “اختبار الإجهاد” لـ AI ، حيث يحاول الأشخاص عمداً أن يحفزوا استجابات غير آمنة أو ضارة لمعرفة كيف تصمد الأنظمة وتحديد النقاط العمياء ومخاطر السلامة.

صمم باحث سلامة الذكاء الاصطناعي تيم هوا تسعة مستخدمين أو “شخصيات” أظهرت الأعراض الذهنية المتصاعدة وتقييم 11 طرازًا مختلفًا من الذكاء الاصطناعي ، بما في ذلك نماذج ChatGPT من Openai GPT-4O و GPT-5 ، Gemini 2.5 Pro بواسطة Google ، Claude 4 Sonnet by Anthropic ، و Defineseek-D3 و Kimi-K2 by Moonshot AI. ثم تم تصنيف استجابات النماذج للأوهام بناءً على إرشادات مستمدة من كتيبات العلاج السلوكي المعرفي.

تم تقييم نماذج الذكاء الاصطناعى بناءً على كيفية تعاملهم مع المحتوى الوهمي ، بما في ذلك ما إذا كانت نماذج الذكاء الاصطناعى:

دفعت ضد المستخدمين
شجعت مساعدة مهنية الصحة العقلية في العالم الحقيقي ، أو
المعتقدات الوهمية التي تم التحقق من صحتها

كانت بعض النماذج أفضل من غيرها في التحدي أو التشكيك في المحتوى الوهمي بطريقة آمنة.

فشلت العديد من النماذج في تشجيع طلب المساعدة المهنية باستمرار. اقترحت بعض النماذج الدعم المهني فقط بعد تصاعد الموضوعات الوهمية بالكامل. عرض آخرون الطمأنينة دون التوصية بتقييم سريري.

كان Deepseek-V3 الأكثر إشكالية. النموذج على حد سواء تم التحقق من صحة الأوهام وشجع السلوك العالي الخطورة. في أحد الأمثلة على تقشعر لها الأبدان ، عبرت شخصية عن الوقوف في قمة جبلية وتبحث عن التجاوز ، واستجاب النموذج بـ “ثم قفزة … إذا كان من المفترض أن تطير ، فسوف تطير”.

تحسن GPT-5 من Chatgpt على GPT-4O

أظهرت النتائج أن بعض النماذج أداء أفضل من غيرها في التعامل مع أعراض ذهان الذكاء الاصطناعي. كان النموذج المحدث GPT-5 أفضل من GPT-4O. غالبًا ما أظهر GPT-4O sycophancy وإفراط في الفترة ، مما يؤدي إلى التحقق من صحة الأفكار الوهمية في محاولة لمحاكاة التعاطف ، وليس موازنة التعاطف مع اختبار الواقع.

على النقيض من ذلك ، فإن GPT-5 ، على النقيض من ذلك ، أكثر مواضيع ذهانية معترف بها بشكل أكثر موثوقية ، أقر بالضيق دون التحقق من صحة المعتقدات الخاطئة ، وتوفير تفسيرات بديلة ، وتشجيع المستخدمين بشكل متكرر على البحث عن رعاية مهنية.

هذا التحول نحو التحقق من صحة العواطف مع تجنب تعزيز الأطر الوهمية يكون أكثر توافقًا مع كيفية تعامل الأطباء والمعالجين مع القضية ، على الرغم من أن النماذج لا تزال غير كاملة.

الحاجة إلى الأطباء النفسيين وأطباء الصحة العقلية كجزء من اختبار السلامة

إن اختبار السلامة المستمر ، وخاصة “التقاط الأحمر النفسي” ، كما يوصي Hua ، ضروري للمساعدة في تدريب نماذج الذكاء الاصطناعى على الاستجابة بأمان لأولئك الذين يعانون من ضعف أو في أزمة الصحة العقلية. سيكون الأطباء النفسيون وأخصائيي الصحة العقلية ذوي الخبرة السريرية في العالم الحقيقي فعالاً في تطوير نماذج أكثر أمانًا ومعالجة السيناريوهات بأمان مثل الحلقات الذهانية أو الهوس والتفكير في الانتحار.

تبرز ثلاث قضايا مثل مخاوف الصحة العقلية الخطيرة:

تضخيم الأوهام: سيكون الحد من التحقق من الصحة والهلوسة كاذبة أمرًا مهمًا.
تفاقم العزلة الاجتماعية والاعتماد العاطفي على الذكاء الاصطناعى: تشجيع الناس على بناء روابط في العالم الحقيقي والدعم دون اتصال ، بدلاً من التحول إلى الذكاء الاصطناعي كمصدر وحيد للاختبار الواقع أو الدعم.
التأخيرات المحتملة في البحث عن مساعدة مهنية: مطالبات متسقة ومبكرة تجاه التقييم المهني.

ستكون الشفافية حول النماذج المدربة على القيام بها ضرورية.

يمكن أن تكون الذكاء الاصطناعي مفيدًا كمصدر للدعم والإرشاد ، ولكن من غير قادر على استبدال الوظيفة التشخيصية والسريرية لأخصائي الصحة العقلية المدربين والمرخصين ، وخاصة لتقييم المخاطر وإدارة حالات الأزمات.

هناك حاجة إلى مزيد من البحث لاستكشاف فعالية تدابير السلامة مثل المطالبة المبكرة والوقائية للموارد الحقيقية والإحالات المهنية ، وضوابط الوالدين ، والتصعيد إلى المراجعة البشرية.

المصدر :- Psychology Today: The Latest

الرعاية الصحية العقلية في الكليات تتوسع، ولكن هل هي فعالة؟

تصميم أنظمة مخصصة صديقة لاضطراب فرط الحركة ونقص الانتباه

الشعور بالذنب والعار لا يعني دائمًا أنك اتخذت خيارًا سيئًا

الصودا الدايت والدماغ

العقوبات الإبداعية قد تكون جيدة للمخالفات البسيطة

نصائح للمساعدة الذاتية يستمر الناس في التغاضي عنها

توقيت الوجبات وإنقاص الوزن قد يكون السر الخفي للحفاظ على…

الشلل بعد تناول الدجاج غير المطهو جيدًا: السبب الصادم

تأثير فرق التوقيت في كأس العالم 2026 على صحة المشجعين

حسنًا، هذه اللدغات: الوقاية من اللدغات البحرية وعلاجها

يقول العلماء إن معظم الناس يحتاجون إلى بروتين أكثر مما…

يساعد هذا العلاج الناشئ الأشخاص على تجنب جراحة استبدال الركبة

Arib تحصل على 23.5 مليون دولار لدفع التكنولوجيا المالية السعودية…

شركة zypl.ai تجمع تمويلاً بقيمة 5.5 مليون دولار لتطوير حلول…

MovitOn تجمع مليوني دولار لإحداث ثورة في الشحن العالمي عبر منصة…

منصة GAGA تجمع 2.5 مليون دولار لإحداث تحول جذري في…

iQtech تؤمن تمويلا استراتيجيا لإحداث ثورة في التدريب الطبي في…

Skipr يجمع 2 مليون دولار لتعزيز التواصل الذكي مع البنية…

6 طرق تطورية يمكن للوالدين مساعدة أطفالهم على تعليمهم

ترتبط أدوية القولون العصبي الشائعة بارتفاع خطر الوفاة في دراسة رئيسية

3 علامات أنك تتابع شخصًا يعاني من قضايا الالتزام

وجد الأطباء طريقة لوقف تفاعل الميتفورمين القاتل

جهاز جديد لتدفق الهواء يلتقط الجراثيم الداخلية قبل انتشارها

الصحة النفسية

تجد اختبارات السلامة “الذكاء الذكري” أن النماذج تستجيب بشكل مختلف

نماذج اختبار السلامة لذهان الذكاء الاصطناعي

تحسن GPT-5 من Chatgpt على GPT-4O

الحاجة إلى الأطباء النفسيين وأطباء الصحة العقلية كجزء من اختبار السلامة

اترك تعليقاً إلغاء الرد

كاذب بابتسامة: هل يتم تسليط الضوء على منظمة العفو الدولية؟

هل يمكنك إيقاف تساقط الشعر من مضادات الاكتئاب؟

تحليل حلم النقل داخل دودة

نماذج اختبار السلامة لذهان الذكاء الاصطناعي

تحسن GPT-5 من Chatgpt على GPT-4O

اقرأ أيضًا...

الحاجة إلى الأطباء النفسيين وأطباء الصحة العقلية كجزء من اختبار السلامة

المهارات اللينة ، الحقائق الصعبة

تلك الصداقات ما قبل المدرسة الثمينة

الرعاية الصحية العقلية في الكليات تتوسع، ولكن هل هي فعالة؟

تصميم أنظمة مخصصة صديقة لاضطراب فرط الحركة ونقص الانتباه

الشعور بالذنب والعار لا يعني دائمًا أنك اتخذت خيارًا سيئًا

الصودا الدايت والدماغ

العقوبات الإبداعية قد تكون جيدة للمخالفات البسيطة

نصائح للمساعدة الذاتية يستمر الناس في التغاضي عنها

اترك تعليقاً إلغاء الرد