بحث متقدم مدعوم من الذكاء الصنعي

مساحة جديدة

اشترك بالحزمة الذهبية واحصل على وصول غير محدود شمرا أكاديميا

تسجيل مستخدم جديد

السيوف: معيار للاستبدال المعجمي مع تحسين تغطية البيانات والجودة

Swords: A Benchmark for Lexical Substitution with Improved Data Coverage and Quality

409 0 0 0.0 ( 0 )

تحميل البحث استخدام كمرجع

نشر من قبل جمعية اللغويات الحاسوبية ACL مقالة

تاريخ النشر 2021

مجال البحث الذكاء الاصناعي

والبحث باللغة English

تمت اﻹضافة من قبل Shamra Editor

قم بزيارة صفحتنا على فيسبوك

‎Shamra Academia - شمرا أكاديميا‎

اسأل ChatGPT حول البحث

الملخص بالعربية الملخص بالإنكليزية

نطلق سراح معيار جديد لاستبدال المعجمات، ومهمة العثور على بدائل مناسبة لكلمة مستهدفة في سياق. للكتابة، يمكن أن أنظمة بدائل معجمية مساعدة البشر من خلال اقتراح الكلمات التي لا يستطيع البشر التفكير فيها بسهولة. ومع ذلك، تعتمد المعايير الحالية على التذكير البشري باعتبارها المصدر الوحيد للبيانات، وبالتالي تفتقر إلى تغطية البدائل التي ستكون مفيدة للبشر. علاوة على ذلك، غالبا ما توفر المحن المعلقون بدائل منخفضة الجودة، والتي ليست مناسبة بالفعل في السياق المحدد. نقوم بجمع التغطية المرتفعة والبيانات ذات الجودة العالية عن طريق تأطير الاستبدال المعجمي كمشكلة تصنيف، تسترشد بالحزانة أنه من الأسهل بالنسبة للبشر الحكم على مدى ملاءمة بدائل المرشحين من الذاكرة. تحقيقا لهذه الغاية، نستخدم المرادفات الخالية من السياق لإنتاج المرشحين والاعتماد على الحكم الإنساني لتحديد مدى ملاءمة السياق. مقارنة بأكبر مؤشر سابق، فإن معيار سيوفنا يحتوي على 3X أكبر عدد ممكن من البدائل لكل كلمة مستهدفة لنفس المستوى من الجودة، وبدائلها أكثر ملاءمة (استنادا إلى الحكم الإنساني) لنفس العدد من البدائل.

المراجع المستخدمة

https://aclanthology.org/

قيم البحث

706 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نماذج التلخيص الحديثة تولد بطلاقة للغاية ولكن في كثير من الأحيان مخرجات غير موثوق بها في كثير من الأحيان.هذه الدافع الطفرة من المقاييس التي تحاول قياس واقعية الملخصات التي تم إنشاؤها تلقائيا.نظرا لعدم وجود معايير مشتركة، لا يمكن مقارنة هذه المقاييس.ع لاوة على ذلك، فإن كل هذه الطرق تعالج الواقعية كمفهوم ثنائي وفشل في توفير رؤى أعمق على أنواع التناقضات التي أدلى بها أنظمة مختلفة.لمعالجة هذه القيود، نرتند نماذج من الأخطاء الواقعية واستخدامها لجمع التعليقات التوضيحية الإنسانية من الملخصات التي تم إنشاؤها من أنظمة التلخيص الحديثة عن البيانات الخاصة ب CNN / DM و XSUM.من خلال هذه التعليقات التوضيحية، نحدد نسبة الفئات المختلفة للأخطاء الواقعية ومقاييس التقويمات القياسية، والتي تبين ارتباطها بالحكم البشري بالإضافة إلى نقاط القوة والضعف المحددة.

تلخيص المستشفى بالطبع summarization with frank understanding factuality تلخيص مع فرانك فهم التوظيف صناعة حمض الفوسفور

PHOMT: مجموعة بيانات معيار عالية الجودة وعالية المستوى للترجمة الفيتنامية-الإنجليزية

857 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

نقدم مجموعة بيانات موازية فيتنامية عالية الجودة ومقدمة على نطاق واسع من أزواج الجملة بنسبة 3.02m، والتي تبلغ 2.9 مليون أزواج أكبر من كوربوس الترجمة الآلية الفيتنامية-الإنجليزية الفيتنامية - IWSLT15.نقوم بإجراء تجارب تقارن خطوط الأساس العصبية القوية و محركات الترجمة الآلية المعروفة على مجموعة بياناتنا وتجد أنه في كل من التقييمات التلقائية والإنسانية: يتم الحصول على أفضل أداء من خلال ضبط التسلسل الدقيق للتسلسل المدرب مسبقاوبعدلدينا أفضل معارفنا، هذه هي أول دراسة الترجمة الفيتنامية على نطاق واسع النطاق.نأمل أن تكون مجموعة بياناتنا المتاحة للجمهور ودراستها نقطة انطلاق للبحث والتطبيقات في المستقبل على الترجمة الفيتنامية والترجمة الآلية الإنجليزية.نطلق سراح DataSet لدينا في: https://github.com/vinairesearch/phomt

vietnamese-english machine translation benchmark vietnamese-english machine الترجمة الفيتنامية-الإنجليزية القياس الفيتنامية الآلة الإنجليزية صناعة حمض الفوسفور

تطوير معيارا للحد من تحيز البيانات في إسناد التأليف

656 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

إسناد التأليف هو مهمة تعيين وثيقة غير معروفة إلى مؤلف من مجموعة من المرشحين.في الماضي، تستخدم الدراسات في هذا المجال مجموعات بيانات التقييم المختلفة لإظهار فعالية الخطوات والميزات والنماذج مسبقا.ومع ذلك، فإن جزء صغير فقط من الأعمال يستخدم أكثر من مجم وعة بيانات لإثبات المطالبات.في هذه الورقة، نقدم مجموعة من مجموعات بيانات إيسبت الأمعاء المتنوعة للغاية، والتي تعميم نتائج التقييم بشكل أفضل من أبحاث إسناد التأليف.علاوة على ذلك، نقوم بتنفيذ مجموعة واسعة من نماذج تعلم الآلات المستخدمة سابقا وإظهار أن العديد من النهج تظهر عروضا مختلفة بشكل كبير عند تطبيقها على مجموعات بيانات مختلفة.ندرج نماذج لغة مدربة مسبقا، لأول مرة اختبرها في هذا المجال بطريقة منهجية.أخيرا، نقترح مجموعة من الدرجات المجمعة لتقييم جوانب مختلفة من جمع البيانات.

reducing data bias benchmark for reducing reducing data تقليل تحيز البيانات معيار للحد من تقليل البيانات صناعة حمض الفوسفور المزيد..

حزمة للتعلم على البيانات الجداول والنصوص مع المحولات

668 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

أدت التقدم المحرز الأخير في معالجة اللغات الطبيعية إلى أن تصبح هياكل المحولات النموذجية السائدة المستخدمة لمهام اللغة الطبيعية.ومع ذلك، في العديد من مجموعات البيانات في العالم، يتم تضمين طرائق إضافية التي لا يستوفي المحول مباشرة.نقدم مجموعة أدوات متع ددة الوسائط، حزمة بيثون مفتوحة المصدر لتضمين بيانات النص والمجدول (القاطع والرقمي) مع المحولات لتطبيقات المصب.تدمج مجموعة أدواتنا جيدا مع تعانق واجهة برمجة التطبيقات الموجودة في وجه المعانقة مثل التوت والمركز النموذجي الذي يتيح تنزيل سهلة من مختلف النماذج المدربة مسبقا.

package for learning learning on tabular حزمة للتعلم التعلم على جدول صناعة حمض الفوسفور

Kilt: معيار لمهام لغة مكثفة المعرفة

543 - جمعية اللغويات الحاسوبية ACL 2021 مقالة

مشاكل صعبة مثل استجابة الأسئلة المفتوحة للنطاق الرد، وفحص الحقائق، وربط فتحة وملء الكيان تتطلب الوصول إلى مصادر المعرفة الكبيرة والخارجية. في حين أن بعض النماذج تعمل بشكل جيد على المهام الفردية، فإن النماذج العامة النامية صعبة لأن كل مهمة قد تتطلب فه رسة باهظة الثمن على حساب مصادر المعرفة المخصصة، بالإضافة إلى البنية التحتية المخصصة. لتحفيز البحث على النماذج التي تشرح معلومات محددة في موارد نصية كبيرة، نقدم معيارا للمهام اللغوية المكثفة المعرفة (KILT). ترتكز جميع المهام في Kilt في نفس لقطة Wikipedia، مما يقلل من تحول الهندسة من خلال إعادة استخدام المكونات، بالإضافة إلى تسريع البحوث في هياكل الذاكرة المرجعية المهمة. نحن نختبر كل من خطوط الأساس الخاصة ومجموعة العمل، وتقييم أداء المصب بالإضافة إلى قدرة النماذج على توفير الأصل. نجد أن مؤشر ناقلات كثيف مشترك مقترن بنموذج SEQ2SEQ هو خط أساس قوي، مما يتفوق على المزيد من الأساليب المصنوعة من الخياطة لفحص الحقائق، والإجابة على سؤال المجال المفتوح والحوار، وإنشاء نتائج تنافسية على ربط الكيان وملء الفتحة، عن طريق توليد disambigguated نص. تتوفر بيانات وكود Kilt في https://github.com/facebookresearch/kilt.

knowledge intensive language intensive language tasks knowledge intensive لغة مكثفة المعرفة مهام اللغة المكثفة صناعة حمض الفوسفور

الأسئلة المقترحة

شرح تقنية التعرف على الصوت Voice Recognition

2117 - 0 - - تم طرحه بمساحة (الذكاء الاصناعي)

التعرف على الصوت التعرف على الكلام التعرف على الكلام التلقائي

سجل دخول لتتمكن من نشر تعليقات

التعليقات

جاري جلب التعليقات

سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها

المعهد الوطني لإدارة الأعمال

تفاصيل إضافية المزيد من الجامعات

يمكنك البدء بجني المال وتحقيق ربح مادي من أبحاثك العلمية، المزيد

السيوف: معيار للاستبدال المعجمي مع تحسين تغطية البيانات والجودة

Swords: A Benchmark for Lexical Substitution with Improved Data Coverage and Quality

اسأل ChatGPT حول البحث

اقرأ أيضاً

الأسئلة المقترحة