تعد التعامل الدقيق مع أي نوع من أنواع الغموض مهمة رئيسية في معالجة اللغة الطبيعية، حيث وصلت إلى تقدير كبير مؤخرا بسبب تطوير نماذج اللغة التي تعتمد على السياق واستخدام Word أو Adgeddings.في هذا السياق، يهدف عملنا إلى تحديد كيفية ربط نموذج تمثيل اللغة الشعبي بمكافحة غموض الأسماء في العدد النحوي والجنس بلغات مختلفة.نظهر أن النماذج المدربة على لغة واحدة محددة تحقق نتائج أفضل لعملية الغموض من النماذج متعددة اللغات.أيضا، يتم تناول الغموض بشكل عام بشكل عام في العدد النحوي مما هو عليه في النوع الاجتماعي النحوي، حيث وصلت إلى قيم مسافة أكبر من واحد إلى آخر في مقارنات مباشرة من الحواس الفردية.تظهر النتائج الإجمالية أيضا أن مقدار البيانات اللازمة لتدريب نماذج أحادية التدريب وكذلك يجب عدم التقليل من التقديم.
Accurately dealing with any type of ambiguity is a major task in Natural Language Processing, with great advances recently reached due to the development of context dependent language models and the use of word or sentence embeddings. In this context, our work aimed at determining how the popular language representation model BERT handle ambiguity of nouns in grammatical number and gender in different languages. We show that models trained on one specific language achieve better results for the disambiguation process than multilingual models. Also, ambiguity is generally better dealt with in grammatical number than it is in grammatical gender, reaching greater distance values from one to another in direct comparisons of individual senses. The overall results show also that the amount of data needed for training monolingual models as well as application should not be underestimated.
المراجع المستخدمة
https://aclanthology.org/
قد يتم تحديد الجنس النحاسي من قبل دلالات أو إجمالية أو علم الصوتيات أو يمكن أن يكون تعسفيا.تحديد الأنماط في العوامل التي تحكم نون الجنسين يمكن أن تكون مفيدة لمتعلمي اللغة، وفهم المصادر اللغوية الفطرية للتحيز بين الجنسين.قد يتم استبدال النهج اليدوية ا
يهدف تصحيح الخطأ النحوي (GEC) إلى تصحيح أخطاء الكتابة ومساعدة المتعلمين في اللغة على تحسين مهاراتهم في الكتابة. ومع ذلك، تميل نماذج GEC الحالية إلى إنتاج تصحيحات زائفة أو تفشل في اكتشاف الكثير من الأخطاء. يعد نموذج تقدير الجودة ضروريا لضمان أن يحصل ا
إنٌنا نعيش في عصر علامته المميٌزة هي استخدام الأعداد كالأرقام في كل شأن من
شؤون الحياة على إطلاقها، و لكن هناك دائما صعوبات يواجهها الكثيرون في قراءة العدد
بشكل صحيح و سليم، حيث يلجأ بعضي إلى قراءته باللهجة العامٌيٌة دون التٌقيٌد
بضوابطه، و بعضهم
استرجاع المرور والترتيب هو مهمة رئيسية في الإجابة على الأسئلة المفتوحة واسترجاع المعلومات. تعتمد الأساليب الفعالة الحالية في الغالب على المستردين المعتمدين على النموذج العميق المدربين مسبقا. تم عرض هذه الأساليب نموذجا بفعالية المطابقة الدلالية بين ال
في مجتمع اليوم، يتيح لنا التطوير السريع لتكنولوجيا الاتصالات التواصل مع أشخاص من أجزاء مختلفة من العالم. في عملية الاتصال، يعامل كل شخص الآخرين بشكل مختلف. يتم استخدام بعض الأشخاص في استخدام اللغة الهجومية والساخرة للتعبير عن آرائهم. هذه الكلمات تسبب