ترغب بنشر مسار تعليمي؟ اضغط هنا

نقدم المهمة الجديدة لحل النزاعات اسم النطاق (DNDR)، والذي يتنبأ بنتيجة عملية لحل النزاعات حول استحقاق قانوني لاسم النطاق.يحدد TheICann UDRP عملية تحكيم إلزامية للنزاع بين مالك العلامة التجارية وسجل اسم النطاق المتعلق باسم مجال كبير المستوى (GTLD) (GT LD) (واحد ينتهي في .com، .org، .NET، إلخ).يؤدي طبيعة المشكلة إلى مجموعة بيانات متحفة للغاية، والتي تنبع من القدرة على تسجيل اسم مجال مع سهولة شديدة، ومصروفات قليلة للغاية، ولا حاجة لإثبات استحقاقها.في هذه الورقة، نحن تصف ثيتاسك ومجموعة البيانات المرتبطة بها.ونحن نقدم أيضا نتائج مرجعية بناء على مجموعة من MOD-ELS، والتي تظهر أن خطوط الأساس البسيطة بشكل عام صعبة التغلب عليها بسبب توزيع البيانات المنحرفة، ولكن في حالة المستفتى المحددة التي قدمت استجابة، برت ضبط صقليقدم النموذج تحسينات كبيرة على نموذج فئة الأغلبية
دقة Aquerence هي مفتاح العديد من مهام معالجة اللغة الطبيعية، لكنها غير مستكشفة نسبيا في معالجة لغة الإشارة. في لغات موقعة، تستخدم الفضاء في المقام الأول لتحديد المرجع. لن يقوم حل دقة Aquerence للغات الموقعة فقط بتمكين أنظمة معالجة لغة الإشارة عالية ا لمستوى، بل تقوم أيضا بتعزيز فهمنا للغة في طرائق مختلفة والمراجع الموجودة، وهي مشاكل رئيسية في دراسة اللغة المحددة. في هذه الورقة، نحن: (1) تقديم دقة COMARCALE الموقعة (SCR)، تحديا جديدا لنمذجة Aquerence وعلاج لغة الإشارة؛ (2) جمع وجعة مشروحة من لغة الإشارة الألمانية مع ملصقات ذهبية ل Taquerence جنبا إلى جنب مع برنامج شرح للمهمة؛ (3) استكشاف ميزات لفتة اليد، الإيقاعي، والعقارات المكانية الموجودة والمضي قدما لاقتراح مجموعة من الاستدلال المباشرة المباشرة ونماذج غير مخالفة للمهمة؛ (4) طرح عدة مقترحات حول طرق معالجة تعقيدات هذا التحدي بفعالية.
ساهمت نماذج اللغة الملثمين (MLMS) في تحسينات أداء جذرية فيما يتعلق بدقة anaphora الصفر (ZAR).لتعزيز هذا النهج، في هذه الدراسة، قدمنا مقترحين.الأول هو مهمة محتملة جديدة تدرب MLMS على علاقات الاستعمارية مع الإشراف الصريح، والاقتراح الثاني هو طريقة أصلي ة جديدة ستصطدم بمسألة سيئة السمعة، والتناقض في التباين المؤمنأظهرت تجاربنا على ZAR اليابانية أن مقترحنا تعزز الأداء الحديثة، وتحليلنا التفصيلي يوفر رؤى جديدة حول التحديات المتبقية.
منذ فترة طويلة تم حل الضمائر إلى مراحلها كمشكلة فهم لغة طبيعية أساسية.تعمل سابقا على قرار الضمير (PCR) في الغالب على حل الضمائر للإشارة في النص أثناء تجاهل السيناريو الإيفهور.الضمائر Exophoric شائعة في الاتصالات اليومية، حيث قد يستخدم المتحدثون بشكل مباشر الضمائر للإشارة إلى بعض الكائنات الموجودة في البيئة دون إدخال الكائنات أولا.على الرغم من عدم ذكر هذه الكائنات في نص الحوار، إلا أنها غالبا ما يتم ترحيلها من قبل الموضوعات العامة للحوار.بدافع من ذلك، نقترح الاستفادة بشكل مشترك السياق المحلي والمواضيع العالمية للحوارات لحل مشكلة PCR خارج النص.توضح تجارب واسعة فعالية إضافة موضوع تنظيم الموضوع لحل الضمائر الإيفولية.
عادة ما يتم تدريب النماذج العصبية الأكاديمية لدقة COMERASE (COREF) على مجموعة بيانات واحدة، ويتم قياس التحسينات النموذجية في نفس مجموعة البيانات.ومع ذلك، تعتمد تطبيقات COREF العالمية في العالم الحقيقي على المبادئ التوجيهية التوضيحي ومجال مجموعة البيا نات المستهدفة، والتي تختلف غالبا عن تلك الموجودة في أونتونو.نحن نهدف إلى تحديد قابلية تحويل نماذج COREF بناء على عدد المستندات المشروح المتوفرة في مجموعة البيانات المستهدفة.نحن ندرس أحد عشر مجموعة بيانات مستهدفة ونتطلع إلى أن التدريب المستمر فعال باستمرار وفائدة بشكل خاص عندما تكون هناك عدد قليل من المستندات المستهدفة.نحن نؤسس معايير جديدة في العديد من مجموعات البيانات، بما في ذلك النتائج الحديثة على Preco.
في هذه الورقة، نقدم تجارب حل النواة مع كورفوس كورفوس متعددة اللغات التي تم إنشاؤها حديثا (Nedoluzhko et al.، 2021).نحن نركز على اللغات التالية: التشيكية والروسية والبولندية والألمانية والإسبانية والكاتالونية.بالإضافة إلى التجارب أحادية الأحادية، نجمع بين بيانات التدريب في تجارب متعددة اللغات وتدريب نماذج متضررة - لغلق سلافية وللجميع اللغات معا.نحن نعتمد على نموذج التعلم العميق في نهاية إلى نهاية تتكيف قليلا مع Corefud Corpus.تظهر نتائجنا أنه يمكننا الاستفادة من التعليقات التوضيحية المنسقة، واستخدام النماذج الانضمام تساعد بشكل كبير على اللغات مع بيانات التدريب الأصغر.
نشير إلى أن ممارسات التقييم المشتركة لحل النواة المستندات كانت غير متسقة بشكل غير واقعي في إعداداتها المفترضة، مما أثار نتائج تضخيم.نقترح معالج هذه المشكلة عبر مبادئ منهجية التقييم.أولا، كما هو الحال في المهام الأخرى، ينبغي تقييم النماذج بشأن الأهمية المتوقعة بدلا من الإشراهات الذهبية.القيام بذلك يثير قضية خفية فيما يتعلق بمجموعات Singleton Comeference، والتي نتعلمها عن طريق فصل تقييم التقييم للكشف عن ربط COMELES.ثانيا، نجرب أن النماذج يجب ألا تستغل بنية الموضوع الاصطناعي لمجموعة بيانات البنك المركزي الأوروبي + المعيار، مما أجبر النماذج لمواجهة تحدي الغموض المعجمي، على النحو المقصود من قبل منشئو البيانات.نوضح بالتجريد التأثير الجذراني لمبادئ تقييمنا الأكثر واقعية لدينا على نموذج تنافسي، مما يؤدي إلى درجة أقل 33 F1 مقارنة بتقييم الممارسات اللانوية السابقة.
في هذه الورقة، نقترح حل عالمي قابل للتفسير لحل مشكلة NLP البارزة: قرار الكيان (ER). نحن فوركون في وقت متأخر من مشكلة تقسيم الرسم البياني. يتم تمثيل كل إشارة إلى كيان عالمي حقيقي بواسطة عقدة في الرسم البياني، وتستخدم درجات SIM الزوجية بين التفسير في ر بط هذه العقد إلى زمرة واحدة بالضبط، والتي تمثل كيان عالمي حقيقي في مجال ER. في هذه الورقة، نستخدم مشكلة تقسيم Clique (CPP)، وهو ما يعد عددا صحيحا (IP) لصياغة ER كقسم رسم بياني، ثم قم بتسلط الضوء على الطبيعة القابلة للتفسير لهذه الطريقة. نظرا لأن CPP هو NP-Hard، نقدم إجراءات حل فعالة، خوارزمية XER، لحل CPP كملكة كيميائية لإيجاد أقصى حد من الزمرات في الرسم البياني ثم أداء التعبئة المعممة المعممة باستخدام صياغة جديدة. نناقش مزايا استخدام XER على الأساليب التقليدية وتوفير الخيارات الحسابية ونتائج تطبيق هذه الطريقة إلى مجموعات بيانات ER.
تعد دقة Coureference Event مشكلة بحثية مهمة في العديد من التطبيقات.على الرغم من النجاح الرائع الأخير للنماذج اللغوية المدربة مسبقا، فإننا نجادل بأنه لا يزال مفيدا للغاية لاستخدام الميزات الرمزية للمهمة.ومع ذلك، نظرا لأن المدخلات لتحليل Aquerence عادة ما تأتي من مكونات المنبع في خط أنابيب استخراج المعلومات، فإن الميزات الرمزية المستخرجة تلقائيا يمكن أن تكون صاخبة وأن تحتوي على أخطاء.أيضا، اعتمادا على السياق المحدد، يمكن أن تكون بعض الميزات أكثر إفادة من غيرها.بدافع من هذه الملاحظات، نقترح وحدة نمطية معتمدة على السياق على الرواية السيطرة على تدفق المعلومات من ميزات المدخلات الرمزية.جنبا إلى جنب مع طريقة تدريب صاخبة بسيطة، فإن أفضل طرازات لدينا تحقق نتائج أحدث من الفنون على مجموعة بيانات: ACE 2005 و KBP 2016.
تم تجاهل المعلومات النحوية والدلية الخارجية إلى حد كبير من قبل نماذج حل النواة العصبية الحالية.في هذه الورقة، نقدم نموذجا مقرا له من الرسوم البيانية غير متجانسة لإدماج الهياكل النحوية والدلالية للجمل.يحتوي الرسم البياني المقترح على رسم بياني فرعي سنو ي حيث يتم توصيل الرموز الرائعة بناء على شجرة التبعية، ورسم إلكتروني فرعي دلالي يحتوي على حجج ويستند كمستلزمات دورا دالايا كحواف.من خلال تطبيق شبكة انتباه الرسوم البيانية، يمكننا الحصول على تمثيل كلمة معدنية من الناحية النحوية وغير المعزز، والتي يمكن دمجها باستخدام طبقة تكامل اليقظة وآلية Gating.تجارب في OnTonotes 5.0 معيار المعيار إظهار فعالية نموذجنا المقترح.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا