ترغب بنشر مسار تعليمي؟ اضغط هنا

تبسيط نص قابل للتحكم مع إعادة الصياغة الصريحة

Controllable Text Simplification with Explicit Paraphrasing

642   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تحسن تبسيط النص قابلية قراءة الجمل من خلال العديد من تحويلات إعادة كتابة، مثل إعادة الصياغة المعجمية والحذف والتقشير. تعتبر أنظمة التبسيط الحالية في الغالب نماذج تسلسل التسلسل التي يتم تدريبها على نهاية إلى نهاية لأداء كل هذه العمليات في وقت واحد. ومع ذلك، فإن هذه الأنظمة تحد من نفسها لحذف الكلمات ويمكنها بسهولة التكيف مع متطلبات الجماهير المستهدفة المختلفة. في هذه الورقة، نقترح نهجا مختلطا هجينا رواية يرفع القواعد ذات الدوافع اللغوية لتقسيم وحذفها، والأزواج مع نموذج إعادة الصياغة العصبية لإنتاج أنماط إعادة كتابة متنوعة. نقدم طريقة جديدة لتعزيز البيانات لتحسين القدرة على إعادة صياغة نموذجنا. من خلال التقييمات التلقائية والدليلية، نوضح أن نموذجنا المقترح يحدد حالة جديدة من بين المهمة، أو إعادة صياغة أكثر من النظم الحالية، ويمكن أن تتحكم في درجة كل عملية تبسيط مطبقة على نصوص الإدخال.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في الآونة الأخيرة، حقق نموذج لغوي كبير مدرب مسبقا يسمى T5 (محول نقل النصوص الموحد للنصوص) أداء حديثة في العديد من مهام NLP.ومع ذلك، لم يتم العثور على أي دراسة باستخدام هذا النموذج المدرب مسبقا على تبسيط النص.لذلك في هذه الورقة، نستكشف استخدام T5 Bric k-Tuning على تبسيط النص الجمع بين آلية يمكن التحكم فيها لتنظيم مخرجات النظام التي يمكن أن تساعد في إنشاء نص مكيفات للجماهير المستهدفة المختلفة.تبين تجاربنا أن نموذجنا يحقق نتائج رائعة مع مكاسب بين +0.69 و +1.41 عبر أحدث الولاية الحالية (بارت + الوصول).نقول أن استخدام نموذج مدرب مسبقا مثل T5، المدربين على عدة مهام مع كميات كبيرة من البيانات، يمكن أن يساعد في تحسين تبسيط النص.
نقدم تقنية جديدة لتوليد الصفر عن إعادة صياغة الصفر.المساهمة الرئيسية هي طراز إعادة صياغة متعددة اللغات من طرف تم تدريبه على استخدام كورسرا المتوازي المترجمة لتوليد الصياغة في المساحات المعنى "- استبدال طبقة SoftMax النهائية مع Adgeddings Word.يتيح هذ ا التعديل المعماري، بالإضافة إلى إجراء تدريبي يشتمل على هدف AutoNCoding، مع المعلمة الفعالة تقاسم لغات لمزيد من إعادة كتابة أحادي الأبعاد بطلاقة، ويسهل الطلاقة والتنوع في المخرجات التي تم إنشاؤها.تتفوق نماذج توليد الناتج المستمر الناتج عن إعادة صياغة خطوط خطوط خطوط إعادة صياغة صفرية عند تقييم لغتين باستخدام بطارية من المقاييس الحسابية وكذلك في التقييم البشري.
في هذه الورقة، نقترح إطار جيل عصبي قابل للتحكم يمكن أن توجه بمرونة تلخيص الحوار مع تخطيط الكيانات المسماة الشخصية. يتم تعديل التسلسلات الشرطية لتحديد أنواع المعلومات أو منظور التركيز عند تشكيل ملخصات لمعالجة المشكلة الخاضعة للحدود في مهام التلخصات. ي دعم هذا الإطار نوعين من حالات الاستخدام: (1) منظور شامل، وهو حالة غرض لأغراض عامة مع عدم تحديد تفضيل المستخدم، بالنظر إلى نقاط موجزة من جميع محطات المحادثة والأشخاص المذكورين؛ (2) منظور التركيز، ضع الملخص بناء على كيان شخصي محدد من قبل المستخدم، والتي يمكن أن تكون واحدة من المحاورين أو أحد الأشخاص المذكورين في المحادثة. أثناء التدريب، استغلنا تخطيط حدوثها للكيانات المسماة الشخصية ومعلومات العناية الأساسية لتحسين الاتساق الزمني وتقليل الهلوسة في الجيل العصبي. تظهر النتائج التجريبية أن إطار عملنا المقترح يولد ملخصات بطلاقة ومتسقة في الواقع بموجب ضوابط التخطيط المختلفة باستخدام المقاييس الموضوعية والتقييمات البشرية.
إن جودة أنظمة تبسيط النص الآلي بالكامل ليست جيدة بما يكفي للاستخدام في إعدادات العالم الحقيقي؛بدلا من ذلك، يتم استخدام التبسيط البشري.في هذه الورقة، ندرس كيفية تحسين تكلفة وجودة التبسيط البشري من خلال الاستفادة من الجماعة الجماعية.نقدم نهج الانصهار ا لجملة في الرسم البياني لزيادة التبسيط البشري ونهج إعادة النشر لكل من تحديد المبسط عالية الجودة والسماح باستهداف التبسيط بمستويات متفاوتة من البساطة.باستخدام DataSet Newsela (XU et al.، 2015) نظهر تحسينات متسقة على الخبراء في مستويات تبسيط مختلفة وتجد أن تبسيط الانصهار الجملة الإضافية تسمح بإخراج أبسط من التبسيط البشري وحدها.
ينتج العمل الأخير بشأن تلخيص الرأي ملخصات عامة بناء على مجموعة من مراجعات المدخلات وشعبية الآراء المعبر بها فيها.في هذه الورقة، نقترح نهج يسمح بتوليد ملخصات مخصصة بناء على استفسارات الجانب (E.G.، ووصف موقع وغرفة فندق).باستخدام مراجعة Corpus، نقوم بإن شاء مجموعة بيانات تدريبية صناعية من (مراجعة، ملخص) أزواج مخصبة بوحدات التحكم في الارتفاع التي يسببها نموذج تعليمي متعدد الأمثلة يتنبأ بجوانب وثيقة على مستويات مختلفة من الحبيبية.نحن نغلق نموذج مسبق باستخدام مجموعة البيانات الاصطناعية لدينا وإنشاء ملخصات محددة من جانب جانب من خلال تعديل وحدات التحكم في الجانب.تشير التجارب في معيارين إلى أن نموذجنا يفوق على الحالة السابقة من الفن ويولد ملخصات شخصية عن طريق التحكم في عدد الجوانب التي تمت مناقشتها فيها.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا