تتحمل الأساليب الحالية لإدماج قيود المصطلحات في الترجمة الآلية (MT) عادة أن شرط القيد يتم توفيرها في أشكالهم المورفولوجية الصحيحة. هذا يحد من تطبيقه إلى سيناريوهات العالم الحقيقي حيث يتم توفير شروط القيد كمولماس. في هذه الورقة، نقدم إطارا وحدات لإدما
ج قيود Lemma في MT العصبية (NMT) التي يمكن فيها تطبيق المعرفة اللغوية وأنواع متنوعة من نماذج NMT بشكل مرني. يعتمد ذلك على وحدة انعطاف عبر اللغات الرواية التي تلحق قيود LEMMA المستهدفة بناء على سياق المصدر. نستكشف وحدات الانقسام العصبية المستندة إلى القواعد ذات الدوافع التي تعتمد على القواعد ومقرها إلى البيانات وتصميم أجنحة اختبار الصحة باللغة الإنجليزية والألمانية والأخبار الإنجليزية - الليتوانية لتقييمها في تكييف المجال وإعدادات MT منخفضة الموارد. تشير النتائج إلى أن وحدة الانعكاسات التي تعتمد على قواعدنا تساعد نماذج NMT على دمج قيود LEMMA بشكل أكثر دقة من الوحدة العصبية وتتفوق على النهج الحالي للنهائي مع انخفاض تكاليف التدريب.
Backtranslation هي تقنية شائعة للاستفادة من البيانات غير المسبقة في سيناريوهات الموارد المنخفضة في الترجمة الآلية.تنطبق الطريقة بشكل مباشر على توليد الانفعال المورفولوجي إذا كانت نماذج الكلمة غير المسبقة متوفرة.تقوم هذه الورقة بتقييم إمكانات خلفية ال
انعطاف المورفولوجي باستخدام البيانات من ست لغات مع البيانات المسمى المسجلة من مورد Sigmorphon المشترك للبيانات والبيانات غير المسبقة من مصادر مختلفة.النتيجة الناتجة الأساسية هي أن Backtranslation يمكن أن تقدم تحسينات متواضعة في سيناريوهات الموارد المنخفضة، ولكن فقط إذا كانت البيانات غير المسبقة نظيفة للغاية وقد تم تصفيتها بنفس المعايير التوضيحية مثل البيانات المسمى.
تقدم هذه الورقة العديد من التحديات التي تواجهها عند إشراف Treebanks التركية وفقا للمبادئ التوجيهية للتبض الشامل (UD) وتقترح الحلول لمعالجتها.معظم هذه التحديات تنبع من الافتقار إلى الدعم الكافي في إطار UD إلى بدقة تمثل مورفيمز البادئة والاشتقامات المع
قدة، مما يؤدي إلى فقدان كبير للمعلومات من أجل التركية.تؤثر هذه الخسارة سلبا على الأدوات التي تم تطويرها بناء على هذه Treebanks.نشأنا وناقشت هذه القضايا داخل المجتمع على بوابة UD الرسمية.تعرض هذه الورقة هذه القضايا ومقترحاتنا تمثل أكثر دقة معلومات مورفوسنكتاسية للتركية في حين تلتزم بمبادئ توجيهية للتكييف.يهدف هذا العمل إلى المساهمة في تمثيل اللغات التركية وغيرها من اللغات الشاقة في Treebanks القائمة على UD، والتي بدورها تساعد على تطوير مجموعات بيانات مشروحة بدقة لهذه اللغات.
يمكن تعلم القواعد المورفولوجية ذات مستويات مختلفة من الخصوصية من مثال lexemes عن طريق التطبيق العسكري للحد الأدنى من التعميم (أولبرايت والهايس، 2002، 2003). النموذج الذي يتعلم القواعد فقط من خلال الحد الأدنى من التعميم كان يستخدم للتنبؤ بمتوسط تصنيفا
ت اختبار الباحث البشري من الألمانيةوالإنجليزية والهولندية في مهمة SIGMORPHON-UNIMORPH 2021 المشتركة، مع نتائج تنافسية.وقد ثبت بعض الخصائص الرسمية لعملية التعميم الحد الأدنى.تم تطوير طريقة تلقائية لإنشاء محفزات اختبار Wug للتجارب المستقبلية التي تحقق ما إذا كانت التعميمات المورفولوجية النموذجية ضئيلة للغاية.
تعرض هذه الورقة أنظمة مختلفة لمجموعة مختلفة من النماذج المورفولوجية، في سياق المهمة المشتركة Sigmorphon 2021 2. الهدف من هذه المهمة هو تصحيح الكلمات العنقودية بشكل صحيح بلغة معينة من قبل نموذج اندلاطها، دون أي معرفة سابقة باللغة وبدون إشراف من البيان
ات المسمى لأي فرز. تعد الكلمات الموجودة في النموذج المورفولوجي الواحد بمتغيرات انتشار مختلفة من ليمما الأساسي، مما يعني أن الكلمات تشترك في معنى أساسي مشترك. كما أنها - عادة - تظهر درجة عالية من التشابه الجبادي. بعد حدس هذه الحدس، نحقق في تجميع كماينز باستخدام نوعين مختلفين من تمثيلات الكلمات: يركز المرء على التشابه الجبائي والتركيز الآخر على التشابه الدلالي. يتم تحديد الأدوار الوسطى المحددة مسبقا بناء على وجود خوارزمية فرعية مشتركة عادية أو طريقة رسم بيانية متصلة مبنية بأطول فرعية شائعة. بالنسبة لجميع لغات التطوير، فإن المدينات القائمة على الطابع تؤدي بالمثل إلى خط الأساس، وتشير المبدأ الدوالي أداء أقل بكثير من خط الأساس إلى أن أخطاء النظم تشير إلى أن التجميع القائم على تمثيلات إلكترونية مناسبة لمجموعة واسعة من الآليات المورفولوجية، لا سيما كجزء من نظام أكبر.
تقدم هذه الورقة تقديم فريق Guclasp ل Sigmorphon 2021 المهمة المشتركة بشأن التعميم في توليد الانعطاف المورفولوجي.نقوم بتطوير نموذج متعدد اللغات للانضباط المورفولوجي والتركيز بشكل أساسي على تحسين النموذج باستخدام استراتيجيات تدريب مختلفة لتحسين الدقة والتعميم عبر اللغات.
نحن تصف مهمة Sigmorphon الثانية على التورفولوجيا غير المدعومة: الهدف من المهمة المشتركة SIGMORPHON 2021 على تجميع النماذج المورفولوجية غير المزدئة غير المنشأة هو أنواع الكلمات العنقودية من كوربوس نص الخام إلى النماذج.تحقيقا لهذه الغاية، نطلق سرورا لم
دة 5 لغات تطوير و 9 لغات اختبار، وكذلك النماذج الجزئية الذهبية للتقييم.نتلقى 14 تقريرا من 4 فرق تتبع الاستراتيجيات المختلفة، ويستند أفضل نظام أداء على قواعد النحوية.تختلف النتائج بشكل كبير عبر اللغات.ومع ذلك، فإن جميع الأنظمة متفوقة من قبل Lemmmmmmmatizer تحت إشراف، مما يعني أنه لا يزال هناك مجال للتحسين.
تحليل مورفولوجي (MA) والتطبيع المعجمي (LN) هي مهام مهمة للنص الياباني الذي تم إنشاؤه بواسطة المستخدمين (UGT).لتقييم ومقارنة أنظمة MA / LN المختلفة، قمنا ببناء كوربوس UGT اليابانية المتاحة للجمهور.يشتمل كوربوس لدينا على 929 جمل مشروحة مع معلومات مورفو
لوجية وتطبيعا، إلى جانب معلومات الفئة المصنفة لظواهر خاصة بوحشية UGT.أظهرت التجارب على الجثة أداء أداء منخفضة من أساليب MA / LN الحالية للكلمات غير العامة والنماذج غير القياسية، مما يشير إلى أن الكائن ستكون معيارا صعبا لمزيد من البحث حول UGT.
في الورقة، نقدم عملية إضافة معلومات مورفولوجية إلى Wordnet البولندية (Plwlnet).نحن تصف أسباب هذا الاتصال والحماسات وراء ذلك.نستفصل أيضا الانتباه إلى خصوصية المورفولوجيا البولندية.نظرا لأن المهام التي تعتبرها المعلومات المورفولوجية مهمة وكيف يمكن تطوي
ر الطرق من خلال توسيعها لتشمل المعلومات المورفولوجية مجتمعة بناء على WordNet.
أجريت الدراسة في أربعة مواقع تابعة لمنطقة الشيخ بدر في محافظة طرطوس؛ إذ تم توصيف عشرة طرز من الكرمة (العنب) مختلفة بالاعتماد على المعايير الدولية، أخذت القراءات لموسمي 2016 و2017 ، إذ تم تسجيل المواصفات المظهرية و التحليل الفيزيائي و الكيميائي للعناق
يد الثمرية. تباينت الطرز المدروسة في العديد من الصفات، إذ أظهرت نتائج التحليل العنقودي توزع الطرز المدروسة في مجموعتين بنسبة تباين وصلت إلى 93%، تراوح متوسط وزن العنقود بين الوسط (349.0غ) و الكبير جدا (1140.45غ)، و نسبة المواد الصلبة الذائبة الكلية بين المنخفضة (12.75 %) و العالية ( 18.82 %)، و الحموضة بين المنخفضة جداً (3.53 غ/ل) و المتوسطة (6.38 غ/ل).