مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

72 خبر
  • مونديال 2026
  • اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات
  • قمة روسيا-آسيان في قازان
  • مونديال 2026

    مونديال 2026

  • اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات

    اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات

  • قمة روسيا-آسيان في قازان

    قمة روسيا-آسيان في قازان

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • فيديوهات

    فيديوهات

نماذج الذكاء الاصطناعي تفشل في تجاوز خبراء الرياضيات في اختبار بحثي معقد

خضع الذكاء الاصطناعي، ضمن مشروع "First Proof"، لأحد أكثر اختبارات الرياضيات صعوبة حتى الآن، إذ طُلب من أربعة أنظمة للذكاء الاصطناعي حلّ عشر مسائل بحثية معقّدة.

نماذج الذكاء الاصطناعي تفشل في تجاوز خبراء الرياضيات في اختبار بحثي معقد
صورة تعبيرية / tanit boonruen / Gettyimages.ru

ولم تكن هذه المسائل ضمن بيانات التدريب الخاصة بالنماذج المشاركة، فيما تولّى علماء رياضيات متخصصون مراجعة الإجابات وتقييمها. ويُعد هذا الاختبار الأول من نوعه، إذ يجمع بين مسائل عالية التعقيد، وأسئلة جديدة غير مألوفة لأنظمة الذكاء الاصطناعي، إلى جانب تقييم رسمي يجريه خبراء متخصصون.

وأظهرت النتائج أن نماذج الذكاء الاصطناعي الحالية لا تزال أقل كفاءة من كبار علماء الرياضيات في التعامل مع مسائل مماثلة، كما أنها تفتقر إلى الحدس الرياضي وتظل عرضة لارتكاب الأخطاء أو ما يُعرف بـ"الهلوسة".

واقترح عشرة باحثين هذه المسائل من أعمالهم العلمية غير المنشورة. واقتصرت المشاركة على النماذج المتاحة للجمهور، بما في ذلك نموذج ChatGPT 5.5 Pro من OpenAI، إلى جانب فرق أكاديمية من جامعة كاليفورنيا، وجامعة برينستون، والمعهد الفيدرالي السويسري للتكنولوجيا في زيورخ.

وطوّرت فرق من جامعة كاليفورنيا والمعهد الفيدرالي السويسري للتكنولوجيا ما يُعرف بـ"الأنظمة الوسيطة"، وهي أنظمة يتولى فيها أحد روبوتات الدردشة طرح الحلول، بينما يقوم آخر بمراجعتها والتحقق منها، مع تبادل المعلومات بينهما عدة مرات عند الحاجة.

وسجّل نموذج المعهد الفيدرالي السويسري للتكنولوجيا أفضل أداء، بعدما نجح في حل ست مسائل من أصل عشر. واعتمد النظام على تحسين استجابات ChatGPT من خلال "مجلس استشاري" مكوّن من ثلاثة روبوتات دردشة متقدمة. وجاء فريق جامعة كاليفورنيا في المركز الثاني بنظام مساعد قائم على ChatGPT، تلاه فريق OpenAI باستخدام ChatGPT دون أدوات مساعدة، ثم فريق جامعة برينستون الذي استخدم نظاما قائما على Gemini 3.1 Pro.

ورغم ذلك، لم يتمكن أي فريق من حل ثلاث مسائل من أصل عشر. ووفقا للمشاركين، افتقرت الأنظمة في بعض الحالات إلى الفكرة الجوهرية التي يتوصل إليها البشر بصورة بديهية، بينما نجحت في حالات أخرى في اختيار النهج الصحيح لكنها أخفقت في تنفيذ التفاصيل بدقة.

ومن أبرز التحديات التي رُصدت ظاهرة "الهلوسة"، حيث قدمت أنظمة الذكاء الاصطناعي نتائج غير صحيحة حتى عند مطالبتها بالتحقق من المراجع. كما لوحظ أن بعض النماذج قامت بنسخ أجزاء من مقالات ومصادر منشورة دون الإشارة إليها بشكل واضح.

وأشار الباحثون إلى أن نشر هذه المسائل سيتيح للشركات والمؤسسات الأخرى استخدامها مستقبلا لاختبار قدرات أنظمة الذكاء الاصطناعي وتقييم أدائها في مواجهة التحديات الرياضية المعقدة.

المصدر: science.mail.ru

التعليقات

300 مليار دولار لإعادة الإعمار في إيران.. بزشكيان ينشر بنود المذكرة الموقعة مع ترامب

تحذيرات من "كارثة".. إكسيوس: نتنياهو لم ير نص الاتفاق الإيراني حتى لحظة إعلانه

تقرير أممي يصنف دولا عربية ضمن بؤر الجوع الساخنة

هجوم حاد لفانس.. هل نحن أمام أزمة أمريكية - إسرائيلية كبرى؟ وما حجم الخلاف بين ترامب ونتنياهو؟

فانس: المصالح الأمريكية والإسرائيلية ليست متطابقة دائما.. نحن دولتان مختلفتان وهناك تصور خاطئ سائد

بالفيديو.. ترامب يوقع مذكرة التفاهم مع إيران من قصر فرساي وماكرون يعلق: عمل عظيم

"وُلدوا وفي أيديهم بنادق".. ترامب يطلق تصريحات "مفاجئة" عن "حماس" وتصرفها الجيد

خلاف داخل إسرائيل بشأن عرض ترامب ترك مهمة التعامل مع حزب الله للجيش السوري والشرع

مسؤول أمريكي كبير ينشر النص الكامل للاتفاق بين الولايات المتحدة وإيران

ترتيب مجموعات كأس العالم 2026 بعد نهاية الجولة الأولى.. منافسة مشتعلة

جي دي فانس يرد على انتقاد بن غفير وسموتريتش لمذكرة التفاهم مع إيران

توقيعا ترامب وبزشكيان جنبا إلى جنب على وثيقة تاريخية

"بعد حالة من الجمود".. إعلام عبري: من المتوقع استئناف المحادثات الإسرائيلية - السورية تحت ضغط أمريكي

مسؤول أمني إسرائيلي تعليقا على وقف الحرب بين طهران وواشنطن: "كان أفضل لو لم نبدأ الحرب"

دخلت حيز التنفيذ.. الولايات المتحدة وإيران توقعان مذكرة تفاهم إلكترونيا

الوكالات الإيرانية الرسمية تنشر النص الكامل للاتفاق مع الولايات المتحدة

لافروف: روسيا ستضرب بانتظام أهدافا أوكرانية تعتمد عليها قدرتها القتالية

سفينتان حربيتان ألمانيتان تعبران قناة السويس.. إلى أين تتجهان؟

الجيش الإسرائيلي يكشف تفاصيل مقتل جندي وإصابة 7 آخرين بينهم ضباط كبار في جنوب لبنان

رب ضارة نافعة.. فيضان نهر الفرات يكافح التلوث والملوحة ويخلق زراعة خصبة في دير الزور

نتنياهو يعيش أيامه الأخيرة.. إسرائيل في "خطر شديد"