مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

36 خبر
  • هدنة وحصار المضيق
  • العملية العسكرية الروسية في أوكرانيا
  • نبض الملاعب
  • هدنة وحصار المضيق

    هدنة وحصار المضيق

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • نبض الملاعب

    نبض الملاعب

  • إسرائيل تواصل غاراتها على لبنان

    إسرائيل تواصل غاراتها على لبنان

  • عيد النصر على النازية

    عيد النصر على النازية

  • فيديوهات

    فيديوهات

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة

استخدم باحثو معهد ماساتشوستس للتكنولوجيا طريقة جديدة "تحاكي فضول الإنسان" لتدريب النماذج اللغوية الذكية على عدم إعطاء ردود "خطيرة" على الأسئلة المثيرة.

ابتكار "ذكاء اصطناعي سام" لوقف خطر روبوتات الدردشة
صورة تعبيرية / Gettyimages.ru

ويطلق على الطريقة القائمة على التعلم الآلي، اسم "الفريق الأحمر القائم على الفضول" (CRT)، المصمم خصيصا لتوليد أسئلة إشكالية تؤدي إلى استجابات غير مرغوب فيها من روبوتات الدردشة.

وبعد ذلك، يمكن استخدام هذه الأسئلة لتحديد كيفية تصفية المحتوى الخطير من روبوت الدردشة، ما قد يغير قواعد اللعبة لتدريب الذكاء الاصطناعي على عدم إعطاء أجوبة سامة (خطيرة) وغير صالحة للمستخدم.

وعادة، يقوم الخبراء بإنشاء مجموعة من الأسئلة، التي من المحتمل أن تولد استجابات ضارة، عند تدريب نماذج اللغات المعقدة (LLMs)، مثل ChatGPT أو Claude 3 Opus، بهدف تقييد المحتوى الخطير أو الضار.

وأثناء عملية التدريب، يتم استخدام الأسئلة التي تثير محتوى خطيرا، لتدريب النظام على ما يجب تقييده عند طرحه أمام مستخدمين حقيقيين.

وطبّق العلماء التعلم الآلي على CRT ليولد تلقائيا نطاقا أوسع من الأسئلة التي يحتمل أن تكون خطيرة، مقارنة بفرق المشغلين البشريين. وأدى ذلك إلى عدد أكبر من الاستجابات السلبية الأكثر تنوعا.

ثم حفزوا نموذج CRT لتوليد المزيد من الأسئلة المتنوعة، بحيث يمكن أن تثير استجابة سامة من خلال "التعلم الآلي"، ونجح النظام في إثارة استجابة سامة موافقة للأسئلة، ما يمنح القدرة على إضافة التعديلات اللازمة لتقديم الإجابة المناسبة تبعا لجميع خيارات الأسئلة المريبة المحتملة.

وعندما اختبر العلماء طريقة CRT على نموذج LLaMA2 مفتوح المصدر، أنتج نموذج التعلم الآلي 196 سؤالا ينجم عنه محتوى ضار.

وقال الفريق إن النظام تفوق أيضا على أنظمة التدريب الآلية المنافسة.

المصدر: لايف ساينس

التعليقات

أول تعليق إيراني رسمي على الدعم العسكري المصري للإمارات

واشنطن تقترب من ساعة الصفر ضد إيران.. خطط لضرب الموانئ والصواريخ وشبكات القيادة إذا انهارت المفاوضات

بوتين: كنا مستعدين لتوجيه ضربة صاروخية مكثفة ضد وسط كييف إذا تم تعطيل احتفالات النصر

الحرس الثوري يحذر دول المنطقة من "ارتكاب أي خطأ"

منشورات لترامب تتضمن صورا لتدمير الجيش الإيراني

"مهر": دوي انفجار جنوب شرق إيران ناجم عن تدمير ذخائر من مخلفات القصف الأمريكي

أعلى سلطة قضائية سورية تلاحق جنرالا أمنيا وثلاثة وزراء سابقين

بيان الخارجية الأمريكية عن مفاوضات لبنان وإسرائيل

عرض عسكري في الساحة الحمراء في ذكرى النصر الـ81 بحضور الرئيس بوتين (صور)

بوتين: الصراع الأوكراني يقترب من نهايته ومستعد للقاء زيلينسكي في حال الوصول إلى اتفاق سلام نهائي

لبنان لحظة بلحظة.. غارات مكثفة ترفع حصيلة الضحايا ومطالب بانسحاب إسرائيلي كامل

لبنان لحظة بلحظة.. يوم دام في الجنوب وعون يطالب بضغط أوروبي لوقف النار ونشر الجيش على الحدود

مسؤول أمريكي: مدمرات أمريكية تتعرض لهجوم إيراني واسع وخطير خلال عبورها مضيق هرمز

صحيفة "WSJ": قائد في الظل وصور بالذكاء الاصطناعي.. كيف يعرقل "اختفاء" مجتبى خامنئي إنهاء الحرب

سوريا.. أزمة لافتة اللغة العربية في محافظة الحسكة تتفاقم (فيديو+صور)

ترامب: السفن بدأت تغيير مسارها من هرمز إلى الموانئ الأمريكية ونتفاوض مع إيران

بريطانيا وفرنسا تحشدان قوات بحرية قرب هرمز

وزير لبناني سابق يرفض التفاوض المباشر مع إسرائيل ويطالب الحكومة بسحب تجريم المقاومة

بوتين: أوروبا تصعد الحرب في أوكرانيا.. وشرودر أفضل خيار للمفاوضات مع الاتحاد الأوروبي

بوتين: استبعاد الآليات العسكرية من عرض النصر بموسكو مرتبط بتركيز قواتنا على مهامها في العملية الخاصة