أظهر العمل السابق أن الإشراف الهيكلية يساعد نماذج اللغة الإنجليزية على تعلم التعميمات حول الظواهر النحوية مثل اتفاقية الفعل الفعل. ومع ذلك، فإنه لا يزال غير واضح إذا كان مثل هذا التحيز الاستقرائي ستحسن أيضا قدرة نماذج اللغة على تعلم التبعيات النحوية
بلغات مختلفة من الناحية النموذجية. نحن هنا التحقيق في هذا السؤال في لغة الماندرين الصينية، والتي لديها نظام كتابة من مقدم من لفائف التروج، إلى حد كبير؛ ترتيب كلمة مختلفة و sparser التشكل من الإنجليزية. نحن ندرب LSTMS، ونواسيب الشبكة العصبية المتكررة، ونماذج لغة المحولات، ونماذج تحليل التلال المعلمة للمحول على مجموعات بيانات ماندرين الصينية بأحجام مختلفة. نقيم قدرة النماذج على تعلم جوانب مختلفة من قواعد اللغة الماندرين التي تقييم العلاقات النحوية والدالة. نجد أدلة منهية أن الإشراف الهيكلية يساعد في تمثيل الحالة النحوية عبر المحتوى المتداخلة ويحسن الأداء في إعدادات البيانات المنخفضة، مما يشير إلى أن فوائد التحيزات الاستقرائي التسلسل الهرمي في الحصول على علاقات التبعية قد تتجاوز الإنجليزية.
يتطلب تصحيح الأخطاء النحوية (GEC) مجموعة من أزواج الجملة الجملة / النحوية المسمى للتدريب، ولكن الحصول على مثل هذه التوضيحية يمكن أن تكون باهظة الثمن. في الآونة الأخيرة، أظهر إطار عمل استراحة IT-IT (BIFI) نتائج قوية على تعلم إصلاح برنامج مكسور دون أي
أمثلة معدنية، ولكن هذا يعتمد على ناقد مثالي (على سبيل المثال، مترجم) يعيد ما إذا كان المثال صحيحا أم لا، والتي غير موجودة لمهمة GEC. في هذا العمل، نظهر كيفية الاستفادة من نموذج اللغة المسبق (LM) في تحديد LM-RIDIC، الذي يحكم جملة على النحو الحكم إذا قام LM بتعيينه احتمال أعلى من اضطراباتها المحلية. نحن نطبق هذا LM-CRERTIC و BIFI جنبا إلى جنب مع مجموعة كبيرة من الجمل غير المسبقة إلى Bootstrap أزواج حقيقية غير رسمية / نحوية لتدريب مصحح. نقيم نهجنا على مجموعات بيانات GEC على مجالات متعددة (CONLL-2014، BEA-2019، GMEG-WIKI و GMEG-Yahoo) وإظهار أنه يتفوق على الأساليب الموجودة في كل من الإعداد غير المقترح (+7.7 F0.5) والإعداد الإشرافي (+0.5 F0.5).
وجدت أنظمة توليد النص المختلط من التعليمات البرمجية قد وجدت تطبيقات في العديد من المهام المصب، بما في ذلك التعرف على الكلام والترجمة والحوار.تعتمد نموذج أنظمة الجيل هذه على نظريات النحوية المحددة جيدا من خلط التعليمات البرمجية، وهناك نقص في مقارنة هذ
ه النظريات.نقدم تقييم بشري واسع النطاق لنظريات نحوية شعبية وشعبية لغة ماتريكس (ML) وقيد التكافؤ (EC).قارناها ضد ثلاث نماذج قائمة على أساسها وتظهر كمية فعالية فعالية نظريتين نحوي.
في هذه الورقة، نقدم الإصدار اليوناني من خاطئ أداة التوضيح التلقائية (براينت وآخرون، 2017)، والتي أطلقنا عليها اسم Elerrant.وظائف خاطئة كتصنيف نوع من نوع الخطأ القاعدة واستخدامه كأداة التقييم الرئيسية للأنظمة المشاركة في BEA-2019 (براينت وآخرون، 2019)
مهمة مشتركة.هنا، نناقش الاختلافات النحوية والمورفولوجية بين الإنجليزية واليونانية وكيف أثرت هذه الاختلافات على تطوير السائل.نحن نقدم أيضا أول كوربوس اليونانية الأصلية (GNC) و Wikiedits Corpus اليونانية (GWE)، ومجموعات بيانات تقييم جديدة مع أخطاء من المتعلمين اليونانيين الأصليين وتحرير صفحات الحديث في ويكيبيديا على التوالي.تستخدم هذان البيانات اثنين لتقييم السائل.هذه الورقة هي جزء وحيد من صورة أكبر توضح محاولة حل مشكلة لغات الموارد المنخفضة في NLP، في حالتنا اليونانية.
تعد التعامل الدقيق مع أي نوع من أنواع الغموض مهمة رئيسية في معالجة اللغة الطبيعية، حيث وصلت إلى تقدير كبير مؤخرا بسبب تطوير نماذج اللغة التي تعتمد على السياق واستخدام Word أو Adgeddings.في هذا السياق، يهدف عملنا إلى تحديد كيفية ربط نموذج تمثيل اللغة
الشعبي بمكافحة غموض الأسماء في العدد النحوي والجنس بلغات مختلفة.نظهر أن النماذج المدربة على لغة واحدة محددة تحقق نتائج أفضل لعملية الغموض من النماذج متعددة اللغات.أيضا، يتم تناول الغموض بشكل عام بشكل عام في العدد النحوي مما هو عليه في النوع الاجتماعي النحوي، حيث وصلت إلى قيم مسافة أكبر من واحد إلى آخر في مقارنات مباشرة من الحواس الفردية.تظهر النتائج الإجمالية أيضا أن مقدار البيانات اللازمة لتدريب نماذج أحادية التدريب وكذلك يجب عدم التقليل من التقديم.
قد يتم تحديد الجنس النحاسي من قبل دلالات أو إجمالية أو علم الصوتيات أو يمكن أن يكون تعسفيا.تحديد الأنماط في العوامل التي تحكم نون الجنسين يمكن أن تكون مفيدة لمتعلمي اللغة، وفهم المصادر اللغوية الفطرية للتحيز بين الجنسين.قد يتم استبدال النهج اليدوية ا
لقائمة على القواعد اليدوية من خلال النهج الحسابية الأكثر دقة وقابلة للتطوير ولكن أصعب من أجل تفسيرها للتنبؤ بنوع الجنس من المعلومات النموذجية.في هذا العمل، نقترح نماذج تصنيف الجنسية القابلة للتفسير للفرنسية، والتي تحصل على أفضل ما في العالمين.نقدم نهج عصبي عالية الدقة التي تعززها نهج قائم على بديل عالمي جديد لتوضيح التنبؤات.نقدم سمات مساعدة "لتوفير تعقيد تفسير الضبط.
التحدث الرسمي، كلاص النحوي مثل pregroups توفر الأسلاك بين الكلمات من أجل توضيح تفاعلاتها، وهذا يتيح للتحقق من صحة النحوية للجمل والجمل.في هذه الورقة، نقدم أيضا الأسلاك داخل الكلمات.سيمكننا هذا من تحديد البنيات النحوية التي نتوقع أن نكون متساوية أو مر
تبطة ارتباطا وثيقا.وبالتالي، فإن عملنا يمهد الطريق لنظرية القواعد الجديدة، التي توفر حقائق نحوية رواية.نقدم نظرية NOGO للحقيقة أن أسلاكنا للكلمات لا معنى لها على الأقران Preordered، وهو النموذج الذي يستغرقه Calmatical Calculi عادة.بدلا من ذلك، يتطلبون المخططات - أو معادلين، (مجاني) فئات حرفية.
يعاني تصحيح الخطأ النحوي (GEC) من عدم وجود بيانات متوازية كافية. اقترحت دراسات حول GEC عدة طرق لتوليد بيانات زائفة، والتي تشمل أزواج من الجمل النحوية والنصيع بشكل مصطنع. حاليا، فإن النهج السائد لتوليد بيانات الزائفة هو الترجمة مرة أخرى (BT). وقد استخ
دمت معظم الدراسات السابقة باستخدام BT نفس الهندسة المعمارية لكل من نماذج GEC و BT. ومع ذلك، فإن نماذج GEC لها اتجاهات تصحيح مختلفة اعتمادا على بنية نماذجها. وبالتالي، في هذه الدراسة، نقارن اتجاهات تصحيح نماذج GEC المدربة على البيانات الزائفة التي تم إنشاؤها بواسطة ثلاث نماذج BT مع بنية مختلفة، وهي المحول، CNN، و LSTM. تؤكد النتائج أن ميول التصحيح لكل نوع خطأ مختلفة لكل طراز BT. بالإضافة إلى ذلك، يمكننا التحقيق في ميول التصحيح عند استخدام مجموعة من البيانات الزائفة الناتجة عن نماذج BT مختلفة. نتيجة لذلك، نجد أن مجموعة من نماذج BT المختلفة تتحسن أو تحسن أداء كل نوع من نوع الخطأ مقارنة باستخدام نموذج BT واحد مع بذور مختلفة.
الملخص نستخدم شركة كوربيا واسعة النطاق في ست لغات مختلفة مختلفة، إلى جانب الأدوات من نظرية NLP والنظرية، لاختبار ما إذا كانت هناك علاقة بين الجنسين النحوي للأسماء غير الحية والصفات المستخدمة لوصف تلك الأسماء.لجميع اللغات الست، نجد أن هناك علاقة ذات د
لالة إحصائية.نجد أيضا أن هناك علاقات ذات دلالة إحصائية بين الجنسين النحوي للأسماء النووية والأفعال التي تأخذ تلك الأسماء ككائنات مباشرة، ككائنات غير مباشرة، وكما هو مواضيع.نحن نؤجل تحقيق أعمق في هذه العلاقات للعمل في المستقبل.
يَبْقَى ضَبْطُ الْمَعْنَى وَ الْوُصُوْلُ إِلَيْهِ غاية كُلِّ بَاْحِثٍ فِي اللُّغَةِ، وَ مَاْ دَاْمَ الْمَعْنَى هُوَ نِتَاْج التَّرْكِيْبِ النَّحْوِيِّ فِيْ مَقَاْمٍ مُعَيَّنٍ، لَاْ بُدَّ لِذَلِكَ الْبَاْحِثِ أَلَّا يُقْصِيَ أَحَدَهُمَاْ عَلَى حِسَاْب
ِ الْآخَرِ؛ أَيْ: تَدْخُلُ كُلٌّ مِنَ الْعَنَاْصِرِ النَّحْوِيَّةِ وَ الْعَنَاْصِرِ الدِّلَاْلِيَّةِ فِي عَلَاْقَةٍ جَدَلِيَّةٍ فِي تَفْسِيْرِ الْمَعْنَى.
وَ مِنْ هُنَاْ تَنَاْوَلْتُ فِي هَذَا الْبَحْثِ مَفْهُوْمَ مُقْتَضَى الْحَاْلِ وَ الْمُصْطَلَحَاْتِ الْمُتَعَلِّقَة بِهِ، وَ بَيَاْنَ فَاْعِلِيَّتِهِ فِي الْحَقْلِ اللُّغَوِيِّ، وَ أَثَرَ الْعَاْمِلِ الدِّيْنِيِّ فِيْ لَفْتِ أَنْظَاْرِ الْعُلَمَاْءِ الْقُدَاْمَى إِلَى أَهَمِّيَّةِ كُلٍّ مِنَ الشَّكْلِ النَّحْوِيِّ وَ الْمَقَاْمِ الَّذِيْ أَنْتَجَهُ، وَ مَدَى اعْتِمَاْدِ عُلَمَاْئِنَا الْقُدَاْمَى عَلَيْهِمَاْ وَ هُمْ يُفَسِّرُوْنَ النُّصُوْصَ الْقُرْآنِيَّةَ وَ الشَّوَاْهِدَ الشِّعْرِيَّةَ وَ يَسْتَخْرِجُوْنَ الْقَواْعِدَ مِنْهَاْ.