تقدم الصابغة فرصة كمصدر بيانات للبحث في NLP والتعليم والعلوم الاجتماعية.ومع ذلك، فإن الإجابة على أسئلة بحثية محددة مع هذه البيانات صعبة، حيث تحتوي الصخور على أساليب كتابة أكثر تنوعا من الخيال الرسمي.نقدم خط أنابيب معالجة النصوص للقصص، مع التركيز على تحديد النص المرتبط بالأحرف.يتضمن خط الأنابيب وحدات لتحديد الأحرف وكور المعلومات، وكذلك إسناد الاقتباس والسرد إلى تلك الشخصيات.بالإضافة إلى ذلك، يحتوي خط الأنابيب على نهج رواية في Conment Coreence الذي يستخدم المعرفة من إسناد Quote لحل الضمائر داخل علامات الاقتباس.لكل وحدة، نقوم بتقييم فعالية النهج المختلفة على 10 قصص صانفة مشروحة.هذا خط أنابيب تتفوق الأدوات المتقدمة للخيال الرسمي على مهام Aquerence Aquer Aquare و Quote
Fanfiction presents an opportunity as a data source for research in NLP, education, and social science. However, answering specific research questions with this data is difficult, since fanfiction contains more diverse writing styles than formal fiction. We present a text processing pipeline for fanfiction, with a focus on identifying text associated with characters. The pipeline includes modules for character identification and coreference, as well as the attribution of quotes and narration to those characters. Additionally, the pipeline contains a novel approach to character coreference that uses knowledge from quote attribution to resolve pronouns within quotes. For each module, we evaluate the effectiveness of various approaches on 10 annotated fanfiction stories. This pipeline outperforms tools developed for formal fiction on the tasks of character coreference and quote attribution
المراجع المستخدمة
https://aclanthology.org/
نقدم EventPlus، وهو الحدث الزمني لفهم خط أنابيب يدمج عن مكونات فهم الحدث المختلفة بما في ذلك مشغل الحدث والكشف عن اكتب، والكشف عن وسيطة الأحداث، ومدة الأحداث واستخراج العلاقات الزمنية.معلومات الحدث، وخاصة المعرفة الزمنية الحدث، هي نوع من المعرفة الحس
تعد صياغة صياغة Reprrase مهمة صعبة تعزز تحويل جملة مدخلية معقدة معينة إلى جمل متعددة أقصر معاداة معنى معادل. نهج إعادة كتابة هذا تصور أن الجمل الأقصر تستفيد من القراء البشري وتحسين مهام الخبراء اللامبرية التي تحضرها كخطوة مسبقة مسبقة. يقدم هذا العمل
تعتبر خلط التعليمات البرمجية ظاهرة خلط الكلمات والعبارات من لغتين أو أكثر في كلام واحد من الكلام والنص.نظرا للتنوع اللغوي العالي، يعرض خلط التعليمات البرمجية العديد من التحديات في تقييم مهام توليد اللغة الطبيعية القياسية (NLG).تعمل العديد من المقاييس
في هذا التقرير الفني، وصفنا أن خط أنابيب ASR-MT المصنف الذي تم ضبطه على المهمة المشتركة IWSLT.نقوم بإزالة عينات الكلام الأقل فائدة عن طريق فحص WER مع نموذج ASR، وتدريب أحدث وحدة ASR القائمة على WAV2VEC ومقرها المحولات بناء على البيانات المرتبطة.بالإض
نعتمد وتقييم وتحسين خطاب خط أنابيب طبيعي من خطوتين (NLU) على خطاب (NLU) الذي يرصد تدريجيا على تباين إيداع اللغة الطبيعية غير المقيدة والخرائط إلى سلوكيات الروبوت القابلة للتنفيذ.يقوم خط الأنابيب أولا بإضافة تمثيل تمثيل المعنى التجريدي (AMR) لالتقاط ا