غالبا ما تشمل توصيات المرادف التقليدية اقتراحات غير مناسبة للسياقات المحددة للكاتب.نقترح نهج بسيط لتوصية مرادف السياق من خلال الجمع بين الرسوم البيانية القائمة على الإنسان، على سبيل المثالWordnet، مع نماذج اللغة المدربة مسبقا.نقوم بتقييم تقنيةنا عن طريق برعاية مجموعة من أزواج الجملة بكلمة الكلمة متوازنة عبر كوربورا وأجزاء الكلام، ثم قم بتسليم كل زوج جملة الكلمة مع مجموعة من المرادفات المناسبة للسياق.وجدنا أن نهج نموذج اللغة الأساسية لها دقة أعلى.الأساليب الاستفادة من سياق الجملة لها استدعاء أعلى.بشكل عام، كانت النهج السياقي الأخير لديه أعلى درجة F.
Traditional synonym recommendations often include ill-suited suggestions for writer's specific contexts. We propose a simple approach for contextual synonym recommendation by combining existing human-curated thesauri, e.g. WordNet, with pre-trained language models. We evaluate our technique by curating a set of word-sentence pairs balanced across corpora and parts of speech, then annotating each word-sentence pair with the contextually appropriate set of synonyms. We found that basic language model approaches have higher precision. Approaches leveraging sentence context have higher recall. Overall, the latter contextual approach had the highest F-score.
المراجع المستخدمة
https://aclanthology.org/
إن جودة أنظمة تبسيط النص الآلي بالكامل ليست جيدة بما يكفي للاستخدام في إعدادات العالم الحقيقي؛بدلا من ذلك، يتم استخدام التبسيط البشري.في هذه الورقة، ندرس كيفية تحسين تكلفة وجودة التبسيط البشري من خلال الاستفادة من الجماعة الجماعية.نقدم نهج الانصهار ا
كيف يفهم الناس معنى كلمة صغيرة "عند استخدامها لوصف البعوض أو الكنيسة أو كوكب؟في حين أن البشر لديهم قدرة رائعة على تشكيل معاني من خلال الجمع بين المفاهيم القائمة، فإن نمذجة هذه العملية تحديا.تتناول هذه الورقة هذا التحدي من خلال Cerebra (تمثيلات المعنى
تعتمد توصية العلامات على وظيفة الترتيب لعلامات Top-K أو طريقة توليد التشغيل التلقائي.ومع ذلك، فإن الطرق السابقة تهمل واحدة من اثنين من الخصائص المتضاربة التي يبدو أنها مرغوبة للغاية لمجموعة العلامة: مناسبا والاعتماد بين الاعتماد.في حين فشل نهج التصني
تصف هذه الورقة نظامنا (IREL) لتصنيف سياق استشهاد 3C - مهمة مشتركة من ورشة عمل معالجة الوثيقات العلمية في Naacl 2021. شاركنا في كل من التركاس الفرعي A و Subtask B. لقد حقق أفضل نظامنا على درجة ماكرو F1 من 0.26973 على المتصدرين الخاصينللحصول على التراك
نحن ندرس مشكلة استخراج وسيطة الأحداث عبر اللغات (CEAE). تهدف المهمة إلى التنبؤ بأدوار حجة من يذكر الأحداث في النص، والتي تختلف لغتها عن اللغة التي تم تدريبها على نموذج تنبؤي. أظهر العمل السابق على CEAE الفوائد المتبادلة لأشجار الاعتماد الشامل في التق