مباشر
أين يمكنك متابعتنا

أقسام مهمة

Stories

54 خبر
  • إسرائيل ولبنان يتوصلان إلى اتفاق إطار
  • مونديال 2026
  • العملية العسكرية الروسية في أوكرانيا
  • إسرائيل ولبنان يتوصلان إلى اتفاق إطار

    إسرائيل ولبنان يتوصلان إلى اتفاق إطار

  • مونديال 2026

    مونديال 2026

  • العملية العسكرية الروسية في أوكرانيا

    العملية العسكرية الروسية في أوكرانيا

  • اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات

    اتفاق أمريكي إيراني لوقف الحرب على جميع الجبهات

  • زلزال فنزويلا

    زلزال فنزويلا

  • فيديوهات

    فيديوهات

  • الاتحاد الدولي لرفع الأثقال يعيد روسيا للمنافسات تحت علمها ونشيدها

    الاتحاد الدولي لرفع الأثقال يعيد روسيا للمنافسات تحت علمها ونشيدها

  • مبابي ضد هالاند.. الموعد والقنوات الناقلة لمواجهة فرنسا والنرويج

    مبابي ضد هالاند.. الموعد والقنوات الناقلة لمواجهة فرنسا والنرويج

  • المكسيك.. سيارة تدهس مشجعين خلال احتفالات الفوز وتخلف 17 مصابا

    المكسيك.. سيارة تدهس مشجعين خلال احتفالات الفوز وتخلف 17 مصابا

  • بولندا.. صاعقة برق تضرب نافورة في مدينة فروتسواف

    بولندا.. صاعقة برق تضرب نافورة في مدينة فروتسواف

  • الصين.. مياه الأمطار تغمر معظم أنحاء مدينة هوانغشي

    الصين.. مياه الأمطار تغمر معظم أنحاء مدينة هوانغشي

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي

طوّر باحثو جامعة نوفوسيبيرسك التقنية الروسية أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي.

روسيا.. ابتكار أول برنامج وطني لتوليد المحتوى الصوتي بالذكاء الاصطناعي
صورة إرشيفية / abc-av.ru

أفاد بذلك  المشرف على المشروع يغور أنتونيانتس في حديث أدلى به لوكالة "تاس" الروسية.

يهدف هذا التطوير إلى المهام التي تتطلب إنتاجا مستقلا للمقطوعات الموسيقية والأجزاء الغنائية والمؤثرات الصوتية بناء على أوصاف نصية دون الارتباط بخدمات سحابية. ووفقا للمطورين، يوفر النظام دورة كاملة لإنتاج المحتوى الصوتي،  بدءا من الطلب النصي ووصولا للتصدير إلى المنصات واسعة الاستخدام WAV و MP3 و FLAC، ويعمل النظام  في نفس الوقت على أجهزة استهلاكية بحجم ذاكرة فيديو أقل من 6 غيغابايت.

وأشار أنتونيانتس إلى أن  "الميزة الرئيسية لتطويرنا هي الاستقلالية الكاملة عن المنصات الأجنبية وإمكانية العمل في بيئة مغلقة. لقد قمنا بضبط النموذج الأساسي باستخدام محولات LoRA المتخصصة لثلاثة أنواع من المحتوى، وهي الموسيقى الآلية، والأغاني المصحوبة بصوت بشري، والمؤثرات الصوتية، مما يتجنب تأثير اختلاط الخصائص ويحقق تطابقا أدق مع الطلب".

وعلى عكس الحلول الأساسية الموجهة للمستخدمين الناطقين بالإنجليزية، فإن الأداة الجديدة مهيأة للعمل مع الاستعلامات الناطقة بالروسية وتُظهر نتائج تنافسية. فقد بلغ متوسط معيار التقييم الذاتي MOS 4.1 من أصل 5 نقاط، وهو ما يُقارن بمعدلات المنصات التجارية الرائدة.

وأوضح مطور المشروع أرتور خوساينوف قائلا: " من ناحية تقنية تتم المعالجة على عدة مراحل: يقوم نموذج لغوي أولا بتشكيل هيكل دلالي للمقطوعة باستخدام سلسلة من التفكير، ثم يقوم المحول الانتشاري (diffusion transformer) بالتركيب الصوتي في الفضاء الكامن، أما وحدة التصدير فتقوم بتحويل المحتوى إلى الصيغ المستهدفة. وتسمح الواجهة الرسومية المدمجة بإدارة المشاريع، وحفظ وتحميل إعدادات التوليد المسبقة، والمعاينة قبل الاستماع، وتصدير المسارات دون الحاجة إلى محررات خارجية".

وأكد مبتكرو البرنامج أنهم يخططون مستقبلا لتوسيع النظام، بما في ذلك إضافة دعم الصوت المكاني لتطبيقات الواقع الافتراضي، وتنفيذ التكامل مع وحدات تحكم MIDI للتفاعل الحي، وتكييف البرنامج للسيناريوهات الصناعية،  بدءا من إنشاء مقاطع صوتية لألعاب الفيديو ووصولا إلى الدبلجة الآلية للأفلام والبث المباشر والبودكاست والإعلانات التجارية.

المصدر: تاس

التعليقات

في ختام الحوار الأمريكي-الخليجي: رسالة ثلاثية الأبعاد لطهران وبيروت وغزة

سوريا.. تأجيل محاكمة مفتي الجمهورية السابق بعد توجيه تهم ثقيلة إليه (صور + فيديو)

فانس يعلن إجراء الإمارات محادثات مباشرة غير مسبوقة مع الحرس الثوري الإيراني

"حبيب إبراهيمي".. تقارير تكشف تفاصيل عن مخبأ سري للمرشد الأعلى الإيراني الراحل على عمق 35 مترا

وسائل إعلام: مصادر إسرائيلية وأمريكية تتحدث عن التوصل إلى اتفاق إطار بين إسرائيل ولبنان

مسؤول إيراني يحذر دول الخليج من الرهان على السيناريو الأمريكي ويحدد خطا أحمر لا مساومة عليه

يبدو أن الولايات المتحدة قد خسرت الحرب العالمية فعليا...

"وول ستريت جورنال": إيران هاجمت سفينة شحن في اختبار لاتفاق ترامب لإعادة فتح مضيق هرمز