تم بناء قاعدة البيانات هذه كجزء من اطروحة دكتوراة نوار حلبي في جامعة ساوثهامتون. تم تسجيل قاعدة البيانات هذه في استوديو احترافي بلهجة دمشقية. تم استخدام قاعدة البيانات هذه لتركيب كلام منطوق أوتوماتيكيا ذي جودة عالية.
تصدر قاعدة البيانات هذه تحت رخصة المشاع الإبداعي المحددة أدناه باللغة الإنكليزية. في حال أردتم الحصول على خدمات استشارية لبناء قاعدة بيانات خاصة بكم، يرجى الإتصال بنوار حلبي بالبريد الاكتروني. شكراً جزيلاً لاهتمامكم.
تطوير واستضافة مجموعة المعطيات هذه يتطلب وقت وتمويل. إذا أردت المساعدة، بإمكانك التبرع عبر بي بال :)
سوف يتم إضافة المزيد من الوثائق و الشرح في المستقبل. الرجاء الإطلاع على شهادة الدكتوراة الخاصة بنوار حلبي. ويجب التنويه هنا أن رمز الفاصلة العليا الذي يتبع بعض رموز الفونيمات الصوتية يدل على أن الفونيم الصوتي هذا جزء من مقطع لفظي مشدد أو ذو نبرة (stressed). بإمكانكم زيارة صفحة ويكيبيديا الخاصة بقاعدة البيانات الصوتية العربية للمزيد من المعلومات.
https://github.com/nawarhalabi/festival-tts-arabic-voices-docker في هذا المستودع يوجد دوكر كونتينير لتشغيل السيرفر بسهولة على أي نظام
شكراً جزيلاً لطه زروقي و أحمد برقاوي و كريم حمينة و أسامة حمينة على العمل الرائع و استخدام الكوربس لتوليد النطق:
شكراً لعلي حمدي فاضل و ابراهيم تفاحة و براءة الجوارنة و محمود الايوب لعملهم على المشكل "شكلّها" الذي يفترض ان يكون الأدق لحد علمي https://github.com/AliOsm/shakkelha". قمت بإعادة تدريب المودل على المزيد من المعطيات من كتب أطفال (حواي نصف مليون كلمة جديدة)
Arabic Speech Corpus by Nawar Halabi is licensed under a Attribution 4.0 International (CC BY 4.0) License. Based on a work at www.arabicspeechcorpus.com.
تطوير واستضافة مجموعة المعطيات هذه يتطلب وقت وتمويل. إذا أردت المساعدة، بإمكانك التبرع عبر بي بال :)