ترغب بنشر مسار تعليمي؟ اضغط هنا

العثور على المفتاح الاصطلاحية بيرت

Finding BERT's Idiomatic Key

349   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تضمين الجملة تشفير المعلومات المتعلقة باستخدام التعابير في جملة.تقارير هذه الورقة مجموعة من التجارب التي تجمع بين المنهجية التحقيق مع اخفاء المدخلات لتحليل مكان وجود هذه المعلومات الاصطلاحية هذه، وما شكله.تشير نتائجنا إلى أن المفتاح الاصطلاعي لمصدر بيرت موجود في المقام الأول داخل تعبير اصطلاحي، ولكنه يرسم أيضا معلومات من السياق المحيط.أيضا، يستطيع بيرت التمييز بين الاضطراب في جملة ناتجة عن الكلمات المفقودة والتعارض الناتج عن الاستخدام الاصطلاعي.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تلعب التعبيرات الاصطلاحية (IE) دورا مهما باللغة الطبيعية، وكانت منذ فترة طويلة ألم في الرقبة "لأنظمة NLP.على الرغم من ذلك، تظل مهام توليد النص المتعلقة بالفئرات التي تم استكشافها إلى حد كبير.في هذه الورقة، نقترح اثنين من المهام الجديدة لتوليد الجملة الاصطلاحية وتعويضات لملء هذه الفجوة البحثية.نقدم مجموعة بيانات رائعة من 823 منشأة، وجزعة موازية مع جمل تحتوي عليها ونفس الجمل حيث تم استبدال المنشأ بصلاحياتها الحرفية كمورد أساسي لمهامنا.نقوم بقيادة نماذج التعلم العميق الموجودة، والتي لها أداء حديثة على المهام ذات الصلة باستخدام التقييم الآلي واليدوي مع مجموعة بياناتنا لإلهام المزيد من الأبحاث حول مهامنا المقترحة.من خلال إنشاء نماذج خط الأساس، نحن تمهد الطريق لمزيد من النمذجة الأكثر شمولا ودقيقة من المنشأ، سواء من أجل جيل ومعادلات إعادة الصياغة.
تحتوي الوثائق العلمية على درجة كبيرة من الاختلاف، سواء من حيث المحتوى (الدلالات) والهيكل (البراغماتية). تؤكد العمل المسبق في الوثيقة العلمية التفاهم على دلالات من خلال تلخيص المستندات ونمذجة موضوع Corpus ولكن تميل إلى حذف البراغماتية مثل تنظيم الوثائ ق وتدفقها. باستخدام مجموعة من الوثائق العلمية عبر 19 تخصصات وتقنيات النمذجة باللغة الحديثة، نتعلم مجموعة ثابتة من واصفات المجال الأذرع لمقاطع المستندات وإعادة التحديث "" The Corpus إلى هذه الواصفات (يشار إليها أيضا باسم "التطبيع" '). بعد ذلك، نقوم بتحليل موقف وطلب هذه الواصفات عبر المستندات لفهم العلاقة بين الانضباط والهيكل. نبلغ عن ضمنيات الأنماط الهيكلية داخل الانضباط، وتقليل التباينات، وبين الإصابة، ودعم الفرضية التي تشترك فيها المجتمعات العلمية، على الرغم من حجمها، وتنوعها، واتساعها، مشترك في طرق مماثلة للتعبير عن عملها. تضع نتائجنا الأساس للعمل في المستقبل في تقييم جودة البحث ونقل نمط المجال، وعمليات التحليل العملي.
تتمثل النهج المهيمن في التحقيق في الشبكات العصبية للعقارات اللغوية في تدريب Perceptron متعدد الطبقات الضحلة (MLP) على رأس التمثيلات الداخلية للنموذج. يمكن لهذا النهج اكتشاف الخصائص المشفرة في النموذج، ولكن بتكلفة إضافة معلمات جديدة قد تتعلم المهمة مب اشرة. نقترح بدلا من ذلك، حيث نقترح مسبارا شبه جذاب، حيث نجد شبكة فرعية حالية تؤدي المهمة اللغوية المصالحة. بالمقارنة مع MLP، تحقق مسبار الشبكة الفرعية كلتا الدقة العليا على النماذج المدربة مسبقا ودقة منخفضة على النماذج العشوائية، لذلك فهي أفضل في العثور على خصائص ذات أهمية وأسوأ من التعلم بمفردها. بعد ذلك، من خلال اختلاف تعقيد كل مسبار، نوضح أن التحقيق في الشبكة الفرعية التي يسيطر عليها البريتو - يحقق في تحقيق الدقة العليا التي تحقق أي ميزانية تعقيد التحقيق. أخيرا، نقوم بتحليل شبكات فرعية الناتجة الناتجة في مختلف المهام لتحديد مكان ترميز كل مهمة، ونتجد أن المهام ذات المستوى الأدنى يتم التقاطها في طبقات أقل، إعادة إنتاج نتائج مماثلة في العمل الماضي.
التقييم البشري لمهام التلخيص موثوقة ولكن يجلب قضايا التكاثر والتكاليف العالية. المقاييس التلقائية رخيصة وغير قابلة للتكرار ولكن في بعض الأحيان ترتبط بشكل سيء بحكمات بشرية. في هذا العمل، نقترح Nemiautomatic مرنة لمقاييس التقييم الموجز التلقائي، بعد طر يقة التقييم البشري الهرم. يحتفظ Lite2Pyramid شبه التلقائي بوحدات المحتوى الموجزة ذات العلامة البشرية القابلة لإعادة الاستخدام (SCU) للإشارة (SCU)، لكنها تحل محل العمل اليدوي للحكم على وجود قاضم في ملخصات النظام مع نموذج استنتاج اللغة الطبيعية (NLI). تستبدل Lite3pyramid التلقائي بالكامل مزيد من البدائل SCUS مع الوحدات الثلاثية الدلالية المستخرجة تلقائيا (STUS) عبر نموذج العلامات الدلالية (SRL). أخيرا، نقترح مقاييس، Lite2.xpyramid، حيث نستخدم نموذجا بسيطا للتنبؤ بمدى محاكاة STUS محاكاة SCUS والاحتفاظ ب SCUs الأكثر صعوبة في محاكاة، والتي توفر عملية انتقال سلسة وتوازن بين الأتمتة والتقييم اليدوي وبعد مقارنة 15 مقاييس موجودة، نقوم بتقييم الارتباطات المترية البشرية على 3 مجموعات بيانات تقييم التلوث الحالية و Pyrxsum التي تم جمعها حديثا (مع أمثلة / أنظمة / أنظمة 100/10 XSUM). يظهر أن Lite2Pyramid لديها باستمرار أفضل الارتباطات على مستوى الملخص؛ يعمل Lite3pyramid بشكل أفضل من أو قابلة للمقارنة مع مقاييس أوتوماتيكية أخرى؛ يتداول Lite2.XPyramID قبالة قطرات الارتباط الصغيرة لخفض الجهد اليدوي الأكبر، والتي يمكن أن تقلل من تكاليف جمع البيانات المستقبلية.
أصبح انتشار خطاب الكراهية والتضليل في وسائل التواصل الاجتماعي سريعا للخطر للمجتمع.في مجاملة، تصبح نشر الرسائل الواعدة والنشرة الواعدة وغير القمعية بديلا فريدا.لسوء الحظ، نظرا لطبيعتها المعقدة وكذلك المظهر المحدود نسبيا بالمقارنة مع المحتوى المعادي وا لمحايد، يصبح تحديد خطاب الأمل تحديا.يدور هذا العمل حول اكتشاف خطاب الأمل في تعليقات يوتيوب، للمهمة المشتركة على الكشف عن الكلام على الأمل للمساواة والتنوع والإدماج.نحن نحقق درجة F 0.93، ترتيب 1ST على المتصدرين للتعليقات الإنجليزية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا