Home » التكنولوجيا في الحياة اليومية » تحديث أمان ChatGPT يحسّن اكتشاف المخاطر

يقدّم ChatGPT تحديثات أمان جديدة تهدف إلى تحسين كيفية تعرّف النظام على المخاطر والاستجابة في المحادثات الحساسة.

يستخدم الأشخاص ChatGPT يومياً لمجموعة واسعة من المحادثات، بدءاً من الأسئلة البسيطة وصولاً إلى المواضيع الشخصية المعقدة. ومع ذلك، قد تتضمن بعض التفاعلات حالات من الضيق أو مخاطر ناشئة.

لذلك، تم تحديث ChatGPT ليصبح أكثر قدرة على التعرف على الحالات التي قد تتطور فيها المخاطر بمرور الوقت. تساعد هذه التحسينات النظام على اكتشاف الإشارات الدقيقة أو المتغيرة عبر المحادثات.

وبالتالي، يمكن للنظام الاستجابة بشكل أكثر حذراً عند الحاجة، بما في ذلك تهدئة المواقف، ورفض تقديم تفاصيل ضارة، أو توجيه المستخدمين نحو خيارات أكثر أماناً.

تستند هذه التحديثات إلى سنوات من تدريب النماذج، والتقييمات، وأنظمة المراقبة، والتعاون مع خبراء الصحة النفسية والسلامة.

لماذا يُعد السياق مهماً في المحادثات

في الحالات الحساسة، يُعد السياق أمراً بالغ الأهمية. فقد تبدو رسالة ما غير ضارة بمفردها، لكنها قد تحمل معنى مختلفاً عند ربطها بإشارات سابقة.

لذلك، يتم تدريب ChatGPT على مراعاة تاريخ المحادثة لفهم النية بشكل أفضل، مما يساعد على التمييز بين التفاعلات الآمنة والحالات النادرة عالية الخطورة.

بالإضافة إلى ذلك، تم تصميم النظام لاكتشاف الأنماط التي قد تشير إلى نية ضارة تتطور تدريجياً بمرور الوقت.

ملخصات الأمان لتعزيز الوعي

قد تظهر بعض المخاطر عبر عدة محادثات بدلاً من محادثة واحدة فقط.

ولمعالجة ذلك، يستخدم ChatGPT الآن ما يُعرف بـ«ملخصات الأمان». وهي ملاحظات قصيرة وموضوعية حول سياقات سابقة ذات صلة بالسلامة.

يتم إنشاء هذه الملخصات بواسطة نموذج مدرّب على مهام الاستدلال المتعلقة بالسلامة، وهي محدودة النطاق وتُخزن لفترة قصيرة فقط.

ومن المهم أنها لا تُستخدم للتخصيص العام أو الذاكرة طويلة المدى، بل تُستخدم فقط عند وجود صلة بمخاوف سلامة جدية.

مدخلات الخبراء في الصحة النفسية

تم تطوير هذه الأنظمة بمساهمة خبراء في الصحة النفسية، بما في ذلك أطباء نفسيون وأخصائيون نفسيون من الشبكة العالمية للأطباء.

ويتخصص هؤلاء في مجالات مثل علم النفس الجنائي، والوقاية من الانتحار، والاستجابة للإيذاء الذاتي.

وقد ساعدت مساهماتهم في تحديد متى يجب إنشاء ملخصات الأمان، ومدة اعتبار السياق، وما هي المعلومات الأكثر أهمية.

كما ساعدت إرشاداتهم في ضمان أن تبقى الاستجابات مناسبة في المواقف الحساسة.

قياس التحسينات في أداء السلامة

تُظهر التقييمات الداخلية تحسناً ملحوظاً في نتائج السلامة.

في سيناريوهات المحادثات الطويلة، تحسن أداء الاستجابة الآمنة بنسبة 50% في حالات الانتحار والإيذاء الذاتي، كما تحسن بنسبة 16% في حالات إيذاء الآخرين.

بالإضافة إلى ذلك، وعلى مستوى عدة محادثات ونماذج، بقيت مكاسب الأداء ثابتة.

في نموذج GPT-5.5 Instant، تحسن أداء الاستجابة الآمنة بنسبة 52% في حالات إيذاء الآخرين، وبنسبة 39% في حالات الانتحار والإيذاء الذاتي.

وعبر أكثر من 4,000 تقييم، حصلت ملخصات الأمان على 4.93 من 5 من حيث الصلة بالمحتوى، و4.34 من 5 من حيث الدقة الواقعية.

وفي الوقت نفسه، أظهرت الاختبارات عدم وجود تراجع ملحوظ في جودة المحادثات اليومية.

النظرة المستقبلية لسلامة الذكاء الاصطناعي

في المستقبل، سيواصل ChatGPT تحسين قدرته على اكتشاف المخاطر التي تتطور تدريجياً أو عبر عدة محادثات.

حالياً، تركز هذه التحسينات على حالات الإيذاء الذاتي وإيذاء الآخرين، إلا أن العمل المستقبلي قد يمتد إلى مجالات عالية الخطورة أخرى مثل البيولوجيا والأمن السيبراني.

كما ستستمر الضوابط الإضافية في توجيه هذا التطوير.

وبشكل عام، يتطور ChatGPT ليحقق توازناً أفضل بين الفائدة والحذر في السياقات الحساسة.