ترغب بنشر مسار تعليمي؟ اضغط هنا

تحسين توصية مرادف باستخدام سياق الجملة

Improving Synonym Recommendation Using Sentence Context

252   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

غالبا ما تشمل توصيات المرادف التقليدية اقتراحات غير مناسبة للسياقات المحددة للكاتب.نقترح نهج بسيط لتوصية مرادف السياق من خلال الجمع بين الرسوم البيانية القائمة على الإنسان، على سبيل المثالWordnet، مع نماذج اللغة المدربة مسبقا.نقوم بتقييم تقنيةنا عن طريق برعاية مجموعة من أزواج الجملة بكلمة الكلمة متوازنة عبر كوربورا وأجزاء الكلام، ثم قم بتسليم كل زوج جملة الكلمة مع مجموعة من المرادفات المناسبة للسياق.وجدنا أن نهج نموذج اللغة الأساسية لها دقة أعلى.الأساليب الاستفادة من سياق الجملة لها استدعاء أعلى.بشكل عام، كانت النهج السياقي الأخير لديه أعلى درجة F.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

إن جودة أنظمة تبسيط النص الآلي بالكامل ليست جيدة بما يكفي للاستخدام في إعدادات العالم الحقيقي؛بدلا من ذلك، يتم استخدام التبسيط البشري.في هذه الورقة، ندرس كيفية تحسين تكلفة وجودة التبسيط البشري من خلال الاستفادة من الجماعة الجماعية.نقدم نهج الانصهار ا لجملة في الرسم البياني لزيادة التبسيط البشري ونهج إعادة النشر لكل من تحديد المبسط عالية الجودة والسماح باستهداف التبسيط بمستويات متفاوتة من البساطة.باستخدام DataSet Newsela (XU et al.، 2015) نظهر تحسينات متسقة على الخبراء في مستويات تبسيط مختلفة وتجد أن تبسيط الانصهار الجملة الإضافية تسمح بإخراج أبسط من التبسيط البشري وحدها.
كيف يفهم الناس معنى كلمة صغيرة "عند استخدامها لوصف البعوض أو الكنيسة أو كوكب؟في حين أن البشر لديهم قدرة رائعة على تشكيل معاني من خلال الجمع بين المفاهيم القائمة، فإن نمذجة هذه العملية تحديا.تتناول هذه الورقة هذا التحدي من خلال Cerebra (تمثيلات المعنى المعنى المعني بالسياق في الدماغ) نموذج الشبكة العصبية.يميز Cerebra كيف يتكيف معاني الكلمات بشكل ديناميكي في سياق جملة من خلال الحكم المتحلل في جمهورية FMRI إلى الكلمات والكلمات في ميزات الدلالية المجدولة في الدماغ.يوضح أن الكلمات في سياقات مختلفة لها تمثيلات مختلفة والكلمة التي تعني التغييرات بطريقة ذات معنى إلى الموضوعات البشرية.يمكن أن تستخدم التمثيلات القائمة على سياق Cerebra لجعل تطبيقات NLP أكثر تشبه الإنسان.
تعتمد توصية العلامات على وظيفة الترتيب لعلامات Top-K أو طريقة توليد التشغيل التلقائي.ومع ذلك، فإن الطرق السابقة تهمل واحدة من اثنين من الخصائص المتضاربة التي يبدو أنها مرغوبة للغاية لمجموعة العلامة: مناسبا والاعتماد بين الاعتماد.في حين فشل نهج التصني ف في معالجة الاعتماد بين العلامات بين العلامات عندما تكون في المرتبة، فإن النهج التلقائي فشل في اتخاذ أمر في الاعتبار لأنه مصمم لاستخدام العلاقات المتسلسلة بين الرموز.نقترح طريقة توليد تسلسل غبيهة لتوصية العلامات، حيث يتم إنشاء العلامة التالية مستقلة عن ترتيب العلامات التي تم إنشاؤها وترتيب علامات الحقيقة الأرضية التي تحدث في بيانات التدريب.النتائج التجريبية على نطيفين مختلفين، إنستغرام ومكدس تجاوز، تبين أن طريقتنا متفوقة بشكل كبير على النهج السابقة.
تصف هذه الورقة نظامنا (IREL) لتصنيف سياق استشهاد 3C - مهمة مشتركة من ورشة عمل معالجة الوثيقات العلمية في Naacl 2021. شاركنا في كل من التركاس الفرعي A و Subtask B. لقد حقق أفضل نظامنا على درجة ماكرو F1 من 0.26973 على المتصدرين الخاصينللحصول على التراك ج الفرعية واحتل المرتبة الأولى.بالنسبة إلى SubTask B أفضل نظامنا الذي حقق درجات ماكرو F1 من 0.59071 على المتصدرين الخاص وكان المرتبة الثانية.استخدمنا نماذج مماثلة لكل من المهن الفرعية مع بعض التغييرات الطفيفة، كما تمت مناقشته في هذه الورقة.كان لدينا أفضل نموذج أداء لكلا المراكب الفرعي هو نموذج Scibert Finetuned متبوعا بطبقة خطية.توفر هذه الورقة وصفا مفصلا لجميع الأساليب التي حاولناها ونتائجها.
نحن ندرس مشكلة استخراج وسيطة الأحداث عبر اللغات (CEAE). تهدف المهمة إلى التنبؤ بأدوار حجة من يذكر الأحداث في النص، والتي تختلف لغتها عن اللغة التي تم تدريبها على نموذج تنبؤي. أظهر العمل السابق على CEAE الفوائد المتبادلة لأشجار الاعتماد الشامل في التق اط الهياكل النحوية المشتركة للجمل عبر اللغات. على وجه الخصوص، يستغل هذا العمل وجود الاتصالات النحوية بين الكلمات في أشجار التبعية كمعرفة مرساة لنقل التمثيل تعلم عبر اللغات لنماذج CEAE (I.E.، عبر الرسوم البيانية الشبكات العصبية العلاجية - GCNS). في هذه الورقة، نقدم مصادر رواية معلومات مستقلة من اللغة للحصول على نماذج CEAE بناء على التشابه الدلالي وعلاقات التبعية الشاملة في Word Pairs بلغات مختلفة. نقترح استخدام مصادر المعلومات لإنتاج هياكل جملة مشتركة لسد الفجوة بين اللغات وتحسين الأداء المتبادل لنماذج CEAE. يتم إجراء تجارب واسعة مع اللغة العربية والصينية والإنجليزية لإظهار فعالية الطريقة المقترحة للحصول على CEAE.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا