تركز أساليب تصنيف النص الحالية أساسا على مجموعة تسمية ثابتة، في حين أن العديد من التطبيقات في العالم الحقيقي تتطلب تمديد فئات جديدة من الرباعي حيث يزيد عدد العينات لكل علامة. لاستيعاب هذه المتطلبات، نقدم مشكلة جديدة تسمى تصنيف الحبيبات الخشنة إلى الد
قيقة، والتي تهدف إلى أداء تصنيف جيد الحبيبات على البيانات المشروحة بشكل خشن. بدلا من طلب التعليقات التوضيحية البشرية المحبوبة الجديدة، فإننا نقوم باختيار الاستفادة من أسماء السطح التسمية باعتبارها الإرشادات البشرية الوحيدة والنسج في نماذج لغوية غنية مدربة مسبقا في استراتيجية الإشراف الضعيفة المتكررة. على وجه التحديد، نقترح أولا صياغة صياغة دقيقة مشروطة على التسمية لتحريك هذه المولدات لمهمتنا. علاوة على ذلك، نركض هدف تنظيمي بناء على قيود العلامات الجميلة الخشنة المستمدة من إعداد مشكلتنا، مما يتيح لنا المزيد من التحسينات على الصيغة السابقة. يستخدم إطار عملنا النماذج الإدارية التي تم ضبطها بشكل جيد لعينة بيانات التدريب الزائفة لتدريب المصنف، و BootStraps على البيانات الحقيقية غير المسبقة لتحسين النموذج. تجارب واسعة دراسات حالة عن مجموعات بيانات عالمية في العالم الحقيقي تثبت أداء فائقا فوق خطوط خطوط تصنيف Sota-Shot-Shot.
تهدف استخراج العلاقات الزمنية الفائقة (FINETEMPRL) إلى الاعتراف بتذكير فترات الزمن والجدول الزمني في النص.جزء مفقود في نماذج التعلم العميقة الحالية ل Finetemprel هو فشلهم في استغلال الهياكل النحوية لجمل المدخلات لإثراء ناقلات التمثيل.في هذا العمل، نق
ترح ملء هذه الفجوة من خلال إدخال طرق جديدة لإدماج الهياكل النحوية في نماذج التعلم العميق ل Finetemprel.يركز النموذج المقترح على نوعين من المعلومات النحوية من أشجار التبعية، أي عشرات الأهمية التي تستند إلى بناء الجملة لتعلم تمثيل الكلمات والاتصالات النحوية لتحديد كلمات السياق الهامة لذكر الحدث.نقدم أيضا تقنيات جديدة لتسهيل نقل المعرفة بين المهام الفرعية في Finetempr، مما يؤدي إلى نموذج جديد مع الأداء الحديث لهذه المهمة.
تستند نهج كتابة الكيانات التقليدية إلى نماذج تصنيف مستقلة، مما يجعلها من الصعب التعرف على أنواع الكيان المعتمدة والذات طويل الذيل والحبوب. في هذه الورقة، نجادل بأن التبعيات الخارجية والمترنوية المتطودة ضمنيا بين الملصقات يمكن أن توفر معرفة حاسمة لمعا
لجة التحديات المذكورة أعلاه. تحقيقا لهذه الغاية، نقترح شبكة تسمية الملصقات (LRN)، والتي الأسباب التسلل تسميات الكيانات الجميلة من خلال اكتشاف واستغلال المعرفة التبعيات الملصقات المتاحة في البيانات. على وجه التحديد، تستخدم LRN شبكة التراجع التلقائي لإجراء منطق استنتاجي ورسم رسمي من السمة الحيوية لإجراء منطق حثي بين الملصقات، والتي يمكن أن تكفذ بشكل فعال، وتعلم وسبب تبعيات التسمية المعقدة في مجموعة تسلسل إلى مجموعة، ونهاية إلى نهاية وبعد تظهر التجارب أن LRN تحقق الأداء الحديثة على معايير كيانات كيانات فائقة الفيرلة القياسية، ويمكن أيضا حل مشكلة تسمية الذيل الطويل بشكل فعال.
BertScore، متري التلقائي المقترح مؤخرا لجودة الترجمة الآلية، تستخدم بيرت، نموذج لغة كبير مدرب مسبقا لتقييم ترجمات المرشحين فيما يتعلق بالترجمة الذهبية. الاستفادة من قدرات بيرت الدلالية والنزالية، تسعى BertScore إلى تجنب عيوب النهج السابقة مثل بلو، بد
لا من ذلك تسجيل ترجمات المرشحين بناء على تشابههم الدلالي لحكم الذهب. ومع ذلك، بيرت ليست معصومة؛ في حين أن أدائها في مهام NLP، حددت حالة من الفن الجديد بشكل عام، فقد أظهرت دراسات ذات ظواهر النحوية والدلية المحددة أين ينحرف أداء بيرت عن حالة البشر بشكل عام. هذا يثير بشكل طبيعي الأسئلة التي نعالجها في هذه الورقة: ما هي نقاط القوة والضعف في BertScore؟ هل يرتبطون بالضعف المعروفين من جانب بيرت؟ نجد أنه في حين أن BertScore يمكن أن يكتشف عندما يختلف المرشح عن مرجع في كلمات محتوى مهمة، فهو أقل حساسية للأخطاء الأصغر، خاصة إذا كان المرشح مشابه بشكل جذري أو بشكل مصمم مرجع.
على الرغم من نجاح أنظمة الحوار العصبي في تحقيق أداء عال في مجلس الإدارة، لا يمكنهم تلبية متطلبات المستخدمين في الممارسة العملية، بسبب ضعف مهارات المنطق. السبب الأساسي هو أن معظم نماذج الحوار العصبي تلتقط فقط المعلومات النحوية والدلية، ولكنها تفشل في
نموذج الاتساق المنطقي بين محفوظات الحوار والاستجابة الناتجة. في الآونة الأخيرة، تم اقتراح مهمة حوار جديدة متعددة الدوران، لتسهيل أبحاث التفكير الحوار. ومع ذلك، هذه المهمة صعبة، لأن هناك اختلافات طفيفة فقط بين الاستجابة غير المنطقية وتاريخ الحوار. كيفية حل هذا التحدي فعال لا يزال يستحق الاستكشاف. تقترح هذه الورقة نموذج مقارنة غرامة (FCM) لمعالجة هذه المشكلة. مستوحاة من سلوك الإنسان في فهم القراءة، يقترح تركيز آلية المقارنة على الاختلافات الجميلة في تمثيل كل مرشح استجابة. على وجه التحديد، يتم مقارنة كل تمثيل مرشح بالسجل بأكمله للحصول على تمثيل تناسق التاريخ. علاوة على ذلك، تعتبر إشارات الاتساق بين كل مرشح وتاريخ مكبر الصوت في قيادة نموذج يفضل مرشحا متسقا منطقيا مع منطق تاريخ المتكلم. أخيرا، يتم توظيف تمثيلات الاتساق أعلاه لإخراج قائمة التصنيفات من ردود المرشحين لتفويض الحوار متعدد الدوران. النتائج التجريبية على مجموعة بيانات الحوار العامة تظهر أن طريقتنا تحصل على درجات أعلى تصنيف من النماذج الأساسية.
تظهر النهج الحديثة القائمة على المحولات نتائج واعدة على استخراج المعلومات العلمية العلائقية. تركز مجموعات البيانات الحالية على وصف رفيع المستوى لكيفية تنفيذ البحث. بدلا من ذلك، نركز على التفاصيل الدقيقة لكيفية تقديم الرابطات التجريبية من خلال بناء SC
ICLAIL، وهي مجموعة بيانات من المطالبات العلمية المستمدة من أوراق العلوم الاجتماعية والسلوكية (SBS)، PubMed، وحالات الحبل 19. يشتمل مخطط شرح الرسم البياني الربيعي على أن الكيانات الخشنة فقط يمتد كعقد العقد والعلاقات كحواف بينهما، ولكن أيضا سمات الحبيبات الدقيقة التي تعدل الكيانات وعلاقاتها، لما مجموعه 12738 ملميا في الشئ. من خلال إدراج المزيد من أنواع الملصقات وأكثر من ضعف كثافة التسمية من مجموعات البيانات السابقة، يلتقط SCICIMAL مع الجمعيات السببية والمقارنة والتنبؤ والإحصائية والتناسبية على المتغيرات التجريبية إلى جانب مؤهلاتهم وسلعيتهم وأدليلهم. نحن نقوم بتوسيع العمل في كيان مشترك ومقرها المحول واستخراج العلاقات لاستنتاج مخططنا بشكل فعال، مما يدل على وعد الرسوم البيانية المعرفة بحبائها الجميلة في المطالبات العلمية وما بعدها.
نقدم النتائج والنتائج الرئيسية للمهمة المشتركة في WOAH 5 على الكشف عن الميمات البغيضة.تتضمن المهمة ملاحقتين فرعيين يتعلق بالتحديات المتميزة في الكشف الدقيق للميمات البغيضة: (1) الفئة المحمية تعرضت لها MEME و (2) نوع الهجوم.3 فرق قدم وصف نظام وصف النظ
ام.تعتمد هذه المهمة المشتركة على مهمة الكشف عن الأيمن التي تم إنشاؤها بواسطة بحث Facebook AI في عام 2020.
أظهرت أنظمة الكشف عن اللغة المسيئة الحالية التحيز غير المقصود تجاه ميزات حساسة مثل الجنسية أو الجنس. هذه قضية حاسمة، والتي قد تؤذي الأقليات والجماعات الممثلة تمثيلا ناقصا إذا تم دمج هذه الأنظمة في تطبيقات العالم الحقيقي. في هذه الورقة، نقوم بإنشاء اخ
تبارات مخصصة من خلال أداة قائمة المراجعة (Ribeiro et al.، 2020) للكشف عن التحيزات داخل مصنفات اللغة المسيئة للغة الإنجليزية. نقارن سلوك نماذج استنادتين في بيرت، واحد مدرب على مجموعة بيانات الكلام الكراهية العامة والآخر في مجموعة بيانات للكشف عن الحرج. يوضح تقييمنا أنه على الرغم من أن المصنفات القائمة على بيرت تحقق مستويات عالية الدقة على مجموعة متنوعة من مهام معالجة اللغة الطبيعية، فإنها تؤدي بشكل سيء للغاية فيما يتعلق بالإنصاف والتحيز، لا سيما بشأن العينات التي تنطوي على الصور النمطية الضمنية، وتعبيرات عن الكراهية نحو الأقليات والسمات المحمية كما العرق أو الميل الجنسي. نطلق سراح كل من أجهزة الكمبيوتر المحمولة المنفذة لتوسيع اختبارات الإنصاف ومجموعات البيانات الاصطناعية التي يمكن استخدامها لتقييم تنظيم الأنظمة بشكل مستقل عن قائمة المراجعة.
حقق تعدين الرأي الرأي الدقيق (OM) جاذبية متزايدة في مجتمع معالجة اللغات الطبيعية (NLP)، والتي تهدف إلى إيجاد هياكل الرأي التي عبرت عن آرائها تجاه ما "في جملة واحدة. في هذا العمل، بدافع من تمثيلها المستندة إلى تعبيرات الرأي والأدوار، نقترح نهجا موحدا
قائما على إعداد OM في نهاية إلى نهاية. علاوة على ذلك، مستوحاة من الشكليات الموحدة المستندة المستندة إلى OM و EM و Constitioning، نستكشف طريقتين مختلفتين (التعلم متعدد المهام والشبكة العصبية التنافيلية) لإدماج مكونات النحوية في النموذج المقترح للمساعدة OM. نحن نقوم بإجراء تجارب على DataSet MPQA 2.0 شائع الاستخدام. تظهر النتائج التجريبية أن نهجنا المقرر أن يحقق النهج المستند إليه التحسينات المهمة على الأعمال السابقة في درجة F1 الدقيقة ويقلل من عدد تعبيرات الرأي والأدوار المتوقعة بشكل خاطئ، يظهر فعالية طريقتنا. بالإضافة إلى ذلك، فإن دمج الناخبين النحوي يحقق تحسينات واعدة على أساس الأساس القوي المعزز من خلال تمثيلات الكلمات السياقية.
بدأت أنظمة التلخيص المبخر مسبقا مدربة مسبقا في تحقيق أداء موثوق، ولكن عائق رئيسي أمام استخدامها في الممارسة العملية هو ميلهم لإخراج الملخصات التي لا تؤيد المدخلات وتحتوي على أخطاء واقعية. في حين تم استكشاف عدد من مجموعات البيانات المشروحة والنماذج ال
إحصائية لتقييم التوظيف، إلا أنه لم يتم استكشاف صورة واضحة للأخطاء الأكثر أهمية لاستهداف أو عندما تنجح التقنيات الحالية والفشل. نستكشف كل من مصادر البيانات الاصطناعية والإنسانية ذات العلامات بين النماذج التدريبية لتحديد الأخطاء الواقعية في تلخيص، ودراسة الواقعية على مستوى الكلمة والاعتماد على مستوى الجملة. ملاحظاتنا هي ثلاثة أضعاف. أولا، تختلف الأخطاء الواقعية المعروضة بشكل كبير عبر مجموعات البيانات، والمجموعات التدريبية التي تستخدمها عادة من الأخطاء الاصطناعية البسيطة لا تعكس الأخطاء التي تم إجراؤها على مجموعات بيانات الجماعة مثل XSUM. ثانيا، توفر البيانات ذات العلامات البشرية ذات العلامات النووية ذات التوضيحية الدقيقة إشارة تدريب أكثر فعالية من التعليقات التوضيحية على مستوى الجملة أو البيانات الاصطناعية. أخيرا، نظير على أن أفضل نموذج الكشف عن الواقعين لدينا يتيح تدريب المزيد من نماذج تلخيص XSUM أكثر واقعية من خلال السماح لنا بتحديد الرموز المميزة غير الواقعية في بيانات التدريب.