أوراق بحثية, رسائل ماجستير ودكتوراه حول التعقيد

بسيطة أو معقدة؟توليد سؤال قابل للتحكم في التعقيد مع قوالب ناعمة ومزيج عميق من نموذج الخبراء

212 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

إن القدرة على توليد أسئلة باللغة الطبيعية مع مستويات التعقيد التي تسيطر عليها مرغوب فيه للغاية لأنها توزع تطبيق تطبيق سؤال. في هذه الورقة، نقترح نموذجا من جيلات السؤال العصبي المرتعل من نهاية إلى نهج، مما يشتمل على مزيج من الخبراء (MOE) كمحدد قوالب ن اعمة لتحسين دقة مراقبة التعقيد ونوعية الأسئلة التي تم إنشاؤها. القوالب الناعمة تلتقط التشابه السؤال مع تجنب البناء باهظ الثمن للقوالب الفعلية. تقدم طريقتنا رواية ومقدر تعقيد عبر المجال لتقييم تعقيد سؤال، مع مراعاة المقطع والسؤال والإجابة وتفاعلاتها. تظهر النتائج التجريبية على مجموعات بيانات QA القياسية على أن نموذج QG الخاص بنا متفوقا على الأساليب الحديثة في كل من التقييم التلقائي واليدوي. علاوة على ذلك، فإن مقدر التعقيد لدينا أكثر دقة بكثير من خطوط الأساس في كلا من إعدادات المجال والخروج.

simple or complex complexity-controllable question generation بسيطة أو معقد توليد السؤال السيطرة على التعقيد صناعة حمض الفوسفور

Semeval-2021 المهمة 1: تنبؤ التعقيد المعجمي

218 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تقدم هذه الورقة النتائج والنتائج الرئيسية لمهمة Semeval-2021 1 - تنبؤ التعقيد المعجمي.قدمنا المشاركين مع نسخة معدية من كوربوس المعقدة (Shardlow et al. 2020).تعد Complex وجبة إنجليزية متعددة المجالات التي تم فيها تفاح الكلمات والتعبيرات المتعددة الكلم ة (MWES) فيما يتعلق بعقودها باستخدام مقياس Likert خمس نقاط.Semeval-2021 المهمة 1 الممتازة بمهام فرعية: المهمة الفرعية 1 التي تركز على الكلمات الفرعية والمهمة الفرعية 2 التي تركز على mwes.اجتذبت المنافسة 198 فريقا في المجموع، منها 54 فريقا قدم رسميا يدير في بيانات الاختبار إلى المهمة الفرعية 1 و 37 إلى المهمة الفرعية 2.

lexical complexity prediction lexical complexity complexity prediction تنبؤ التعقيد المعجمي تعقيد معجمي تنبؤ التعقيد صناعة حمض الفوسفور المزيد..

LCP-RIT في مهمة Semeval-2021 1: استكشاف الميزات اللغوية لتنبؤ التعقيد المعجمي

254 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

توضح هذه الورقة تقديم فريق LCP-RIT إلى مهمة Semeval-2021 1: تنبؤ التعقيد المعجمي (LCP).قدم منظمو المهام للمشاركين نسخة معدية من المعقد (Shardlow et al.، 2020)، ومجموعة بيانات إنجليزية متعددة المجالات التي تم تفاحها الكلمات في السياق فيما يتعلق بعقوده ا باستخدام مقياس ليكرت خمس نقاط.يستخدم نظامنا الانحدار اللوجستي والمجموعة واسعة من الميزات اللغوية (على سبيل المثالنقوم بتحليل تأثير الميزات اللغوية المختلفة على أداء التصنيف ونقوم بتقييم النتائج من حيث الخطأ المطلق، ويعني الخطأ التربيعي، وارتباط بيرسون، وارتباط سبيرمان.

انحدار التعقيد المعجمي exploring linguistic features استكشاف الميزات اللغوية صناعة حمض الفوسفور

محور في مهمة Semeval-2021 1: الانصهار من الجملة وتردد الكلمات للتنبؤ التعقيد المعجمي

168 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

في هذه الورقة، نقترح طريقة لاستدادتها معلومات جملة المعلومات ومعلومات تردد الكلمات الخاصة بمهمة التعقيد ذات التعقيد 1-LCP (LCP). في نظامنا، تأتي معلومات الجملة من نموذج روبرتا، وتأتي معلومات تردد الكلمات من خوارزمية TF-IDF. استخدم Black Block كطبقة م شتركة لتعلم العقوبة ومعلومات تردد الكلمات وصفنا تنفيذ أفضل نظامنا وناقش أساليبنا وتجاربنا في المهمة. تنقسم المهمة المشتركة إلى مهمتين فرعيتين. الهدف من المهام الفرعية هو التنبؤ بعقد كلمة محددة سلفا. تنقسم المهمة المشتركة إلى قسمين فرعيين. الهدف من اثنين من المهن الفرعية هو التنبؤ بعقد كلمة محددة سلفا. مؤشر تقييم المهمة هو معامل الارتباط بيرسون. يحتوي أفضل نظام الأداء لدينا على معاملات ارتباط بيرسون من 0.7434 و 0.8000 في مجموعة اختبار المراكز الفرعية ذات الرمز الفرعي واحد ومجموعة اختبار الترجمة الفرعية متعددة رميات، على التوالي.

word frequency information predict lexical complexity word frequency معلومات تردد كلمة توقع التعقيد المعجمي كلمة تردد صناعة حمض الفوسفور المزيد..

أخيرا في مهمة Semeval-2021 1: تحسين تنبؤ التعقيد متعدد الكلمات باستخدام تدابير جمعية Bigram

192 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تصف هذه الورقة النظام الذي طورته STATISTICK DES TESSSES (أخيرا) ل TETISTIVER DES TESSES (LAST) من أجل تعقيد التعقيد المعجمي المهمة المشتركة في Semeval-2021.يتكون النظام المقترح من نموذج LightgBM يتغذى مع ميزات تم الحصول عليها من العديد من قوائم تردد Word، والمعايير المعجمية المنشورة والبيانات السيكلية.لمعالجة خصوصية المهمة المتعددة الكلمة، فإنه يستخدم تدابير جمعية Bigram.على الرغم من أن الميزة السياقية الوحيدة المستخدمة كانت طول الجملة، حقق النظام أداء مشرف في المهمة المتعددة الكلمة، ولكن أكثر فقرا في مهمة كلمة واحدة.تم العثور على تدابير جمعية بيجرام مفيدة، ولكن إلى حد محدود.

improving multi-word complexity multi-word complexity prediction تحسين تعقيد متعدد الكلمة التعقيد متعدد الكلمات التنبؤ صناعة حمض الفوسفور

IITK @ LCP في مهمة Semeval-2021 1: تصنيف مهمة انحدار التعقيد المعجمي

250 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تصف هذه الورقة مساهمتنا في مهمة Semeval 2021 1 (Shardlow et al.، 2021): تنبؤ التعقيد المعجمي.في نهجنا، نستفيد النموذج Electra ومحاولة تعكس نظام شرح البيانات.على الرغم من أن المهمة مهمة الانحدار، إلا أننا نوضح أننا نستطيع التعامل معها كجميع العديد من نماذج التصنيف والانحدار.حقق هذا النهج المضاد بشدة إلى حد ما درجة مياه 0.0654 للمهمة الفرعية 1 و MAE من 0.0811 بشأن المهمة الفرعية 2. بالإضافة إلى ذلك، استخدمنا مفهوم إشارات الإشراف الضعيفة من برت لمعان في عملنا، وتحسن بشكل كبيردرجة ماي في المهمة الفرعية 1.

بناء على الديموغرافية lexical complexity regression انحدار التعقيد المعجمي صناعة حمض الفوسفور

Ochadai-Kyoto في مهمة Semeval-2021 1: تعزيز التعميم النموذجي والمتانة لتنبؤ التعقيد المعجمي

172 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نقترح نموذج فرقة للتنبؤ بالتعقيد المعجمي للكلمات وتعبيرات متعددة الكلمات (MWES).يتلقى النموذج كإدخال جملة بكلمة مستهدفة أو MWE وتخرج درجة التعقيد.بالنظر إلى أن التحدي الرئيسي مع هذه المهمة هو الحجم المحدود للبيانات المشروح، يعتمد نموذجنا على تمثيلات السياقية المحددة مسبقا من نماذج اللغة القائمة على المحولات المختلفة (IE، Bert and Roberta)، وعلى مجموعة متنوعة منطرق التدريب لمزيد من تعزيز التعميم النموذجي والترويج: التعلم متعدد الخطوات من الترابط والتعلم متعدد المهام، والتدريب الخصم.بالإضافة إلى ذلك، نقترح إثراء التمثيلات السياقية بإضافة ميزات مصنوعة يدوية أثناء التدريب.حقق نموذجنا نتائج تنافسية ومرتبة بين أنظمة أفضل 10 في كلتا المهام الفرعية.

تنبؤ التعقيد enhancing model generalization تعزيز نموذج التعميم صناعة حمض الفوسفور

Archer في Semeval-2021 المهمة 1: التعقيد المعجمي

226 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

إن تقييم تعقيد كلمة مستهدفة في سياق حكومي هو الهدف من مهمة تنبؤ التعقيد المعجمية في Semeval-2021.تقدم هذه الورقة النظام الذي تم إنشاؤه لتقييم تعقيد كلمات واحدة معجمية، والجمع بين المتغيرات اللغوية والنفسية في مجموعة من التجارب التي تنطوي على غابة عشو ائية و XGBOOST Regrations.ما وراء ترميز معلومات خارج السياق حول LEMMA، نفذنا ميزات بناء على نماذج اللغة المدربة مسبقا لنموذج تعقيد الكلمة المستهدف في السياق.

contextualising lexical complexity contextualising lexical السياق التعقيد المعجمي السياق المعجمية صناعة حمض الفوسفور

التحقيق المنخفض التعقيد عبر العثور على الشبكات الفرعية

177 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

تتمثل النهج المهيمن في التحقيق في الشبكات العصبية للعقارات اللغوية في تدريب Perceptron متعدد الطبقات الضحلة (MLP) على رأس التمثيلات الداخلية للنموذج. يمكن لهذا النهج اكتشاف الخصائص المشفرة في النموذج، ولكن بتكلفة إضافة معلمات جديدة قد تتعلم المهمة مب اشرة. نقترح بدلا من ذلك، حيث نقترح مسبارا شبه جذاب، حيث نجد شبكة فرعية حالية تؤدي المهمة اللغوية المصالحة. بالمقارنة مع MLP، تحقق مسبار الشبكة الفرعية كلتا الدقة العليا على النماذج المدربة مسبقا ودقة منخفضة على النماذج العشوائية، لذلك فهي أفضل في العثور على خصائص ذات أهمية وأسوأ من التعلم بمفردها. بعد ذلك، من خلال اختلاف تعقيد كل مسبار، نوضح أن التحقيق في الشبكة الفرعية التي يسيطر عليها البريتو - يحقق في تحقيق الدقة العليا التي تحقق أي ميزانية تعقيد التحقيق. أخيرا، نقوم بتحليل شبكات فرعية الناتجة الناتجة في مختلف المهام لتحديد مكان ترميز كل مهمة، ونتجد أن المهام ذات المستوى الأدنى يتم التقاطها في طبقات أقل، إعادة إنتاج نتائج مماثلة في العمل الماضي.

pareto-dominates mlp probing probing pareto-dominates mlp low-complexity probing باريتو يهيمن على التحقيق MLP التحقيق في باريتو المهيمنة MLP التحقيق منخفض التعقيد صناعة حمض الفوسفور المزيد..

فقدان التعقيد اللغوي في العلاج القائم على النص

230 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

وقد لوحظت مفارقة خسارة التعقيد، التي توضح أن الأفراد الذين يعانون من الأمراض من مرض ديناميات سلوكية يمكن التنبؤ بها بشكل مدهش، وقد لوحظ في مجموعة متنوعة من النظم الفسيولوجية البشرية والحيوانية. يعرض ظهور العلاج المستند عبر الإنترنت حديثا فرصة جديدة ل تحليل مفارقة فقدان التعقيد في التشغيل الجديد: فقدان التعقيد اللغوي في محادثات العلاج بالنصوص. في هذه الورقة، نقوم بتحليل التعقيد اللغوي يرتبط بالصحة العقلية في رسائل العلاج عبر الإنترنت المرسلة بين المعالجين و 7170 عملاء قدموا 30،437 ردود للمسح المقابلة على قلقهم. وجدنا أنه عندما أبلغ العملاء المزيد من القلق، أظهروا انخفاض التنوع المعجمي على النحو الذي يقدر بمتوسط نسبة TECE-TECEN المتوسطة. يستخدم المعالجون، من ناحية أخرى، لغة صعوبة في القراءة، التعقيد النحوي، وعمر الاستحواذ عندما كان العملاء أكثر قلقا. أخيرا، وجدنا أن العملاء، وإلى حد كبير، المعالجين، عرضوا مستويات متسقة من العديد من تدابير التعقيد اللغوي. توضح هذه النتائج كيفية الاستفادة من التحليل اللغوي للاتصالات القائمة على النص كعلامة للقلق، وهو احتمال مثير في وقت زيادة الاتصال عبر الإنترنت وزيادة قضايا الصحة العقلية.

complexity loss complexity loss paradox linguistic complexity loss خسارة التعقيد مفارقة فقدان التعقيد فقدان التعقيد اللغوي صناعة حمض الفوسفور المزيد..

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد