ترغب بنشر مسار تعليمي؟ اضغط هنا

تكييف دقة Aquerence لمعالجة روايات الموت العنيفة

Adapting Coreference Resolution for Processing Violent Death Narratives

389   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

دقة Aqueference هي مؤسسة كوم النظرية مهمة مهمة في تحليل النص السردي من البيانات السردية من البيانات الإدارية (على سبيل المثال، المصادر السريرية أو الشرطة). ومع ذلك، فإن نماذج Coulsference الحالية Transedon اللغة اللغوية تعاني من قدرة سيئة بسبب ثغرات المجال، ولا سيما عند تطبيقها على النوع الاجتماعي شاملة Datawith Lesbian، مثلي الجنس، المخنثين، والجمنانية الهوائية (LGBT) الفرد. في هذه الورقة، نحن Alyzed تحديات طراز Couress Construcation في شكل مثالي من الإدارة المكتوب باللغة الإنجليزية: الموت العنيف NAR-STATIVS من مراكز الولايات المتحدة الأمريكية DISEASECONTROL (CDC) الوطنية للعنف المنعطف. قمنا بتطوير مجموعة من قواعد البيانات لتحسين طراز Perfor-Mance باستخدام برنامج Probabilistic DataPrampramework. تجارب على روايات قاعدة البيانات الإدارية المقدمة، بالإضافة إلى مجموعات البيانات الأساسية التي تعمل بنظام الأساس، وستدير شيطان فعالية نماذج COMENTION التدريبية لتعزيز البيانات التي يمكن أن تقدم بيانات نصية حول الأفراد LGBT.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تم تجاهل المعلومات النحوية والدلية الخارجية إلى حد كبير من قبل نماذج حل النواة العصبية الحالية.في هذه الورقة، نقدم نموذجا مقرا له من الرسوم البيانية غير متجانسة لإدماج الهياكل النحوية والدلالية للجمل.يحتوي الرسم البياني المقترح على رسم بياني فرعي سنو ي حيث يتم توصيل الرموز الرائعة بناء على شجرة التبعية، ورسم إلكتروني فرعي دلالي يحتوي على حجج ويستند كمستلزمات دورا دالايا كحواف.من خلال تطبيق شبكة انتباه الرسوم البيانية، يمكننا الحصول على تمثيل كلمة معدنية من الناحية النحوية وغير المعزز، والتي يمكن دمجها باستخدام طبقة تكامل اليقظة وآلية Gating.تجارب في OnTonotes 5.0 معيار المعيار إظهار فعالية نموذجنا المقترح.
الكيانات المتعلقة بالأحداث والأحداث في النص هي مكون رئيسي لفهم اللغة الطبيعية.دقة Coreference Coreference، على وجه الخصوص، أمر مهم بالنسبة للمصلحة المتزايدة بمهام تحليل المستندات متعددة الوثائق.في هذا العمل، نقترح نموذجا جديدا يمتد نموذج التنبؤ المتس لسل الفعال لتحليل Corefery لإعدادات تبادل المستندات وتحقق نتائج تنافسية لكلا كلا كلا كائن الكيان والحدث مع توفير أدلة قوية على فعالية كل من النماذج المتسلسلة والاستدلال المرتفعإعدادات الوثيقة عبر المستندات.يتطلب نموذجنا بشكل تدريجي يذكر في تمثيل الكتلة ويتوقع الروابط بين الإشارة والمجموعات التي تم إنشاؤها بالفعل، تقريب نموذج أعلى للترتيب.بالإضافة إلى ذلك، نقوم بإجراء دراسات بديلة الأزمة التي توفر رؤى جديدة في أهمية مختلف المدخلات وأنواع التمثيل في Courceer.
في هذه الورقة، نقدم تجارب حل النواة مع كورفوس كورفوس متعددة اللغات التي تم إنشاؤها حديثا (Nedoluzhko et al.، 2021).نحن نركز على اللغات التالية: التشيكية والروسية والبولندية والألمانية والإسبانية والكاتالونية.بالإضافة إلى التجارب أحادية الأحادية، نجمع بين بيانات التدريب في تجارب متعددة اللغات وتدريب نماذج متضررة - لغلق سلافية وللجميع اللغات معا.نحن نعتمد على نموذج التعلم العميق في نهاية إلى نهاية تتكيف قليلا مع Corefud Corpus.تظهر نتائجنا أنه يمكننا الاستفادة من التعليقات التوضيحية المنسقة، واستخدام النماذج الانضمام تساعد بشكل كبير على اللغات مع بيانات التدريب الأصغر.
وقد وجدت الأعمال الحديثة دليلا على التحيز بين الجنسين في نماذج من الترجمة الآلية ودقة Aquerence باستخدام مجموعات بيانات التشخيص الاصطناعية في الغالب. في حين أن هذه التحيز الكمي في تجربة خاضعة للرقابة، فإنها غالبا ما تفعل ذلك على نطاق صغير وتتكون في م عظمها من الجمل الاصطناعية، خارج التوزيع. في هذا العمل، نجد أنماط نحوية تشير إلى مهام الدورانية النمطية وغير النمطية (مثل الممرضات الإناث مقابل الراقصين الذكور) في كوربورا من ثلاثة مجالات، مما أدى إلى أول مجموعة بيانات BIAS الجنسية على نطاق واسع من 108 ألفا جمل. نحن نتحقق يدويا من جودة Corpus الخاصة بنا واستخدامها لتقييم التحيز بين الجنسين في نماذج تحليل الأسلحة الأساسية المختلفة ونماذج الترجمة الآلية. نجد أن جميع النماذج المختبرة تميل إلى الإفراط في الاعتماد على الصور النمطية الجنسانية عند تقديمها مع المدخلات الطبيعية، والتي قد تكون ضارة بشكل خاص عند نشرها في النظم التجارية. أخيرا، نظيرنا على أن مجموعة بياناتنا تضفي نفسها على نموذج دقة COMEARCASE، ويجد أن يجدد التحيز على مجموعة مشغولة. تتوفر DataSet ونماذجنا علنا ​​في Github.com/slab-nlp/bug. نأمل أن يحفزون البحوث المستقبلية في تقنيات تخفيف تقييم التقييم بين الجنسين في الإعدادات الواقعية.
ندرس مشكلة جديدة في التعلم عبر التحويلات المتبادلة لحدث القرار (ECR) حيث يتم تكييف النماذج المدربة على البيانات من لغة مصدر للتقييمات باللغات المستهدفة المختلفة. نقدم النموذج الأساسي الأول لهذه المهمة بناء على نموذج لغة XLM-Roberta، وهو نموذج لغوي مت عدد اللغات مسبقا. نحن نستكشف أيضا الشبكات العصبية اللغوية اللغوية (LANN) التي تتولى التمييز بين النصوص من المصدر واللغات المستهدفة لتحسين تعميم اللغة ل ECR. بالإضافة إلى ذلك، نقدم آليتين رواية لتعزيز التعلم التمثيلي العام ل LANN، والتي تتميز بما يلي: (1) محاذاة متعددة الرؤية لمعاقبة محاذاة التسمية العاصمة من Aquerence من الأمثلة في المصدر واللغات المستهدفة، و (2) النقل الأمثل إلى حدد أمثلة وثيقة في المصدر واللغات المستهدفة لتوفير إشارات تدريبية أفضل لتمييز اللغة. أخيرا، نقوم بإجراء تجارب مكثفة ل ECR عبر اللغات من الإنجليزية إلى الإسبانية والصينية لإظهار فعالية الأساليب المقترحة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا