دقة Aqueference هي مؤسسة كوم النظرية مهمة مهمة في تحليل النص السردي من البيانات السردية من البيانات الإدارية (على سبيل المثال، المصادر السريرية أو الشرطة). ومع ذلك، فإن نماذج Coulsference الحالية Transedon اللغة اللغوية تعاني من قدرة سيئة بسبب ثغرات المجال، ولا سيما عند تطبيقها على النوع الاجتماعي شاملة Datawith Lesbian، مثلي الجنس، المخنثين، والجمنانية الهوائية (LGBT) الفرد. في هذه الورقة، نحن Alyzed تحديات طراز Couress Construcation في شكل مثالي من الإدارة المكتوب باللغة الإنجليزية: الموت العنيف NAR-STATIVS من مراكز الولايات المتحدة الأمريكية DISEASECONTROL (CDC) الوطنية للعنف المنعطف. قمنا بتطوير مجموعة من قواعد البيانات لتحسين طراز Perfor-Mance باستخدام برنامج Probabilistic DataPrampramework. تجارب على روايات قاعدة البيانات الإدارية المقدمة، بالإضافة إلى مجموعات البيانات الأساسية التي تعمل بنظام الأساس، وستدير شيطان فعالية نماذج COMENTION التدريبية لتعزيز البيانات التي يمكن أن تقدم بيانات نصية حول الأفراد LGBT.
Coreference resolution is an important compo-nent in analyzing narrative text from admin-istrative data (e.g., clinical or police sources).However, existing coreference models trainedon general language corpora suffer from poortransferability due to domain gaps, especiallywhen they are applied to gender-inclusive datawith lesbian, gay, bisexual, and transgender(LGBT) individuals.In this paper, we an-alyzed the challenges of coreference resolu-tion in an exemplary form of administrativetext written in English: violent death nar-ratives from the USA's Centers for DiseaseControl's (CDC) National Violent Death Re-porting System. We developed a set of dataaugmentation rules to improve model perfor-mance using a probabilistic data programmingframework. Experiments on narratives froman administrative database, as well as existinggender-inclusive coreference datasets, demon-strate the effectiveness of data augmentationin training coreference models that can betterhandle text data about LGBT individuals.
المراجع المستخدمة
https://aclanthology.org/
تم تجاهل المعلومات النحوية والدلية الخارجية إلى حد كبير من قبل نماذج حل النواة العصبية الحالية.في هذه الورقة، نقدم نموذجا مقرا له من الرسوم البيانية غير متجانسة لإدماج الهياكل النحوية والدلالية للجمل.يحتوي الرسم البياني المقترح على رسم بياني فرعي سنو
الكيانات المتعلقة بالأحداث والأحداث في النص هي مكون رئيسي لفهم اللغة الطبيعية.دقة Coreference Coreference، على وجه الخصوص، أمر مهم بالنسبة للمصلحة المتزايدة بمهام تحليل المستندات متعددة الوثائق.في هذا العمل، نقترح نموذجا جديدا يمتد نموذج التنبؤ المتس
في هذه الورقة، نقدم تجارب حل النواة مع كورفوس كورفوس متعددة اللغات التي تم إنشاؤها حديثا (Nedoluzhko et al.، 2021).نحن نركز على اللغات التالية: التشيكية والروسية والبولندية والألمانية والإسبانية والكاتالونية.بالإضافة إلى التجارب أحادية الأحادية، نجمع
وقد وجدت الأعمال الحديثة دليلا على التحيز بين الجنسين في نماذج من الترجمة الآلية ودقة Aquerence باستخدام مجموعات بيانات التشخيص الاصطناعية في الغالب. في حين أن هذه التحيز الكمي في تجربة خاضعة للرقابة، فإنها غالبا ما تفعل ذلك على نطاق صغير وتتكون في م
ندرس مشكلة جديدة في التعلم عبر التحويلات المتبادلة لحدث القرار (ECR) حيث يتم تكييف النماذج المدربة على البيانات من لغة مصدر للتقييمات باللغات المستهدفة المختلفة. نقدم النموذج الأساسي الأول لهذه المهمة بناء على نموذج لغة XLM-Roberta، وهو نموذج لغوي مت