Arabic | English

تم بناء قاعدة البيانات هذه كجزء من اطروحة دكتوراة نوار حلبي في جامعة ساوثهامتون. تم تسجيل قاعدة البيانات هذه في استوديو احترافي بلهجة دمشقية. تم استخدام قاعدة البيانات هذه لتركيب كلام منطوق أوتوماتيكيا ذي جودة عالية.

تصدر قاعدة البيانات هذه تحت رخصة المشاع الإبداعي المحددة أدناه باللغة الإنكليزية. في حال أردتم الحصول على خدمات استشارية لبناء قاعدة بيانات خاصة بكم، يرجى الإتصال بنوار حلبي بالبريد الاكتروني. شكراً جزيلاً لاهتمامكم.

تحميل قاعدة البيانات

بإمكانكم تجريب مشكل اللغة العربية خاصتي ذي الدقة العالية على الويب. المشكل يعمل على الأجهزة المحمولة أيضاً.

مشكل الغة العربية

سوف يتم إضافة المزيد من الوثائق و الشرح في المستقبل. الرجاء الإطلاع على شهادة الدكتوراة الخاصة بنوار حلبي. ويجب التنويه هنا أن رمز الفاصلة العليا الذي يتبع بعض رموز الفونيمات الصوتية يدل على أن الفونيم الصوتي هذا جزء من مقطع لفظي مشدد أو ذو نبرة (stressed). بإمكانكم زيارة صفحة ويكيبيديا الخاصة بقاعدة البيانات الصوتية العربية للمزيد من المعلومات.

https://github.com/nawarhalabi/festival-tts-arabic-voices-docker في هذا المستودع يوجد دوكر كونتينير لتشغيل السيرفر بسهولة على أي نظام

شكراً جزيلاً لطه زروقي و أحمد برقاوي و كريم حمينة و أسامة حمينة على العمل الرائع و استخدام الكوربس لتوليد النطق:

  1. Festival for Arabic
  2. مشكل مشكال
  3. مشكل شكالة

شكراً لعلي حمدي فاضل و ابراهيم تفاحة و براءة الجوارنة و محمود الايوب لعملهم على المشكل "شكلّها" الذي يفترض ان يكون الأدق لحد علمي https://github.com/AliOsm/shakkelha". قمت بإعادة تدريب المودل على المزيد من المعطيات من كتب أطفال (حواي نصف مليون كلمة جديدة)

Creative Commons License
Arabic Speech Corpus by Nawar Halabi is licensed under a Attribution 4.0 International (CC BY 4.0) License. Based on a work at www.arabicspeechcorpus.com.