عاجل
بدون مقاييس بقلم: د. صباح الحكيمترتيب مجموعة مصر في كأس العالم 2026 قبل مواجهة نيوزيلنداوزير العمل يدعو المصريين بالأردن إلى سرعة توفيق أوضاعهم قبل 30 سبتمبرفرنسا تتأهب لموجة حر شديدة .. 40 درجة مئوية تشعل الإنذاراتتداول 13 الف طن و 727 شاحنة بضائع عامة ومتنوعة بموانئ البحر الأحمرالأمم المتحدة تحذر من تفاقم الأزمة الصحية في غزة بسبب النزوح ونقص المياهالاحتلال الإسرائيلي يتوغل في ريف درعا الغربي جنوبي سورياإصابة 7 أشخاص في تصادم سيارتين نقل بطريق أسوان الزراعيالقبض على فتاة بالشرقية لانتحال صفة ضابطة شرطة عبر صور مولدة بالذكاء الاصطناعيالتعليم العالي: إنجازات دولية جديدة تعزز مكانة مصر في اليونسكو والإيسيسكوبدون مقاييس بقلم: د. صباح الحكيمترتيب مجموعة مصر في كأس العالم 2026 قبل مواجهة نيوزيلنداوزير العمل يدعو المصريين بالأردن إلى سرعة توفيق أوضاعهم قبل 30 سبتمبرفرنسا تتأهب لموجة حر شديدة .. 40 درجة مئوية تشعل الإنذاراتتداول 13 الف طن و 727 شاحنة بضائع عامة ومتنوعة بموانئ البحر الأحمرالأمم المتحدة تحذر من تفاقم الأزمة الصحية في غزة بسبب النزوح ونقص المياهالاحتلال الإسرائيلي يتوغل في ريف درعا الغربي جنوبي سورياإصابة 7 أشخاص في تصادم سيارتين نقل بطريق أسوان الزراعيالقبض على فتاة بالشرقية لانتحال صفة ضابطة شرطة عبر صور مولدة بالذكاء الاصطناعيالتعليم العالي: إنجازات دولية جديدة تعزز مكانة مصر في اليونسكو والإيسيسكو

أمازون تعلن عن أكبر نموذج لتحويل النص إلى كلام منطوق

تكنولوجيا , No Comment
أعلن فريق من الباحثين في مجال الذكاء الاصطناعي في شركة أمازون عن تطوير ما وصفوه بأنه أكبر نموذج لتحويل النص إلى كلام منطوق على الإطلاق، ويعني ذلك وجود أكبر عدد من المعلمات واستخدام أكبر مجموعة بيانات تدريبية، حيث نشروا ورقة بحثية على خادم الطباعة المسبقة arXiv تصف كيفية تطوير النموذج وتدريبه.
وفقا لما ذكره موقع “techxplore”، اكتسبت نماذج الدردشة بالذكاء الاصطناعى LLMs مثل ChatGPT الاهتمام لقدرتها الشبيهة بالإنسان على الإجابة على الأسئلة بذكاء وإنشاء مستندات عالية المستوى، لكن الذكاء الاصطناعي لا يزال يشق طريقه إلى التطبيقات السائدة الأخرى أيضًا، وفي هذا الجهد الجديد، حاول الباحثون تحسين قدرة تطبيق تحويل النص إلى كلام من خلال زيادة عدد المعلمات والإضافة إلى قاعدة التدريب الخاصة به.
يحتوي النموذج الجديد، المسمى Big Adaptive Streamable TTS ذو القدرات الناشئة، (BASE TTS باختصار) على 980 مليون معلمة وتم تدريبه باستخدام 100000 ساعة من الكلام المسجل (الموجود على المواقع العامة)، معظمها باللغة الإنجليزية.
كما قدم الفريق أيضًا أمثلة لكلمات وعبارات منطوقة بلغات أخرى للسماح للنموذج بنطق العبارات المعروفة بشكل صحيح عندما يواجهها على سبيل المثال، “au Contraire”، أو “adios,amigo”.
اختبر فريق أمازون أيضًا النموذج على مجموعات بيانات أصغر، على أمل معرفة أين يطور ما أصبح معروفًا في مجال الذكاء الاصطناعي بالجودة الناشئة، حيث يتم تطبيق الذكاء الاصطناعي، سواء كان تطبيق LLM أو تطبيق تحويل النص إلى كلام، يبدو فجأة أنه وصل إلى مستوى أعلى من الذكاء.
ووجدوا أنه بالنسبة لتطبيقهم، كانت مجموعة البيانات متوسطة الحجم هي المكان الذي حدثت فيه القفزة إلى مستوى أعلى، عند 150 مليون معلمة.
وأشاروا أيضًا إلى أن هذه القفزة تضمنت مجموعة من السمات اللغوية، مثل القدرة على استخدام الأسماء المركبة، والتعبير عن المشاعر، واستخدام الكلمات الأجنبية، وتطبيق شبه اللغوي وعلامات الترقيم وطرح الأسئلة مع التركيز على الكلمة الصحيحة في النص.
يقول الفريق أن BASE TTS لن يتم إصداره للعامة، فهم يخشون أن يتم استخدامه بشكل غير أخلاقي، وبدلاً من ذلك، يخططون لاستخدامه كتطبيق تعليمي.
 ويتوقعون تطبيق ما تعلموه حتى الآن لتحسين جودة الصوت البشري لتطبيقات تحويل النص إلى كلام بشكل عام.