
من نحن
مزوّد لخدمات البيانات باللغة العربية والاستشارات في معالجة اللغة حاسوبياً
جاء تأسيس أراداتا تلبية لاحتياجات سوق الذكاء الصناعي المتزايدة إلى البيانات الممتازة باللغة العربية. فعلى الرغم من أن اللغة العربية هي خامس لغة على مستوى العالم من حيث عدد المتحدثين، وأنها إحدى اللغات الستّ المعتمدة في الأمم المتحدة، ما تزال البيانات المتوفرة باللغة العربية منخفضة الجودة بشكل ملحوظ. وهو ما يشكل عائقاً كبيراً أمام معالجة اللغة العربية حاسوبياً، وخصوصاً نماذج تعلّم الآلة التي تعتمد بشكل هائل على حجم البيانات وجودتها وحسن تنظيمها.
خدماتنا
كيف نبني الموارد اللغوية
مشاريع يمكننا المساعدة فيها
بناء المعاجم
بناء المعاجم
– عامة أو في مجال معين
– مبنية على مدوّنات حقيقية ومتوازنة
– تمثّل الاستخدام الحاليّ للغة العربية
– مرنة التصميم لتناسب استخدامات متنوّعة
تحويل المكتوب إلى منطوق
تحويل المكتوب إلى منطوق
– تحضير مجموعة الأصوات وقواعد النبر والتنغيم وغيرها
– قواعد التحويل من رموز كتابية إلى أصوات (فونيمات)
– تجهيز النصوص للتسجيلات
– قاموس صوتيّ للكلمات الأجنبية والعامية
التعرف الآليّ على الكلام
التعرف الآليّ على الكلام
– حلول عامّة أو في مجال محدّد
– تحضير نموذج اللغة
– تجهيز القاموس الصوتيّ
– اللغة العربية الفصيحة المعاصرة واللهجات
التشكيل
التشكيل
– تشكيل وفق قواعد منتظمة
– تحضير سريع لبيانات تدريب الآلة
– حلول للكلمات العامية والأجنبية
– بيانات اختبار كاشفة
التدقيق الإملائيّ
التدقيق الإملائيّ
– تحديد أنماط الأخطاء الإملائية
– تجهيز نموذج اللغة
– صنع قاموس المصحّح الإملائي
– مدوّنة متوازية (جمل خاطئة وتصويباتها)
تصحيح أخطاء القواعد
تصحيح أخطاء القواعد
– تحديد أنماط الأخطاء القواعدية في اللغة العربية
– تطوير الحلول المبتكرة
– حلول تعتمد على القواعد وعلى التعلّم الآليّ
– بيانات اختبار كاشفة
مشاريع اللهجات
مشاريع اللهجات
– فهم خصائص كل لهجة
– بناء الموارد المعجمية لكل لهجة
– جمع وتحليل بيانات ممثّلة
– طرق ذكية للربط بين اللغة الفصيحة واللهجات
أحدث المقالات
هل اللغة العربية هي الأصعب بين اللغات؟
لا توجد لغة سهلة ولغة صعبة. هناك لغة مدروسة بشكل صحيح وثمّة عناية حقيقية بها، ولغة لم تجد الدراسة والعناية الكافيتين.
لماذا تخفق برمجيات حوسبة اللغة العربية في الوصول إلى مستويات دقة عالية؟ (4/4)
اختيار هيكلية الموارد اللغوية وتحديد الوسوم المناسبة لحلّ المشكلة عمليّة غير بسيطة، وهي تعتمد على فهم المشكلة وعلى الطريقة التي يتم بها مقاربتها.
لماذا تخفق برمجيات حوسبة اللغة العربية في الوصول إلى مستويات دقة عالية؟ (3/4)
هناك حاجة كبيرة إلى موارد لغوية يبنيها لغويون متخصصون، ويتمّ مراجعتها بشكل سليم. كذلك هناك حاجة إلى تنسيق جهود بناء الموارد اللغوية بين الجهات المختلفة.