ترغب بنشر مسار تعليمي؟ اضغط هنا

العقوبة القائمة على الخطاب تقسيم

Discourse-Based Sentence Splitting

356   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

ينطوي تقسيم الجملة تجزئة جملة إلى جملتين أقصرين أو أكثر. إنه مكون رئيسي لبسط الجملة، وقد ثبت أن تساعد الفهم البشري وهي خطوة مسبقة مسبقة مسبقة مفيدة لمهام NLP مثل استخراج التلخيص والعلاقات. في حين أن العديد من الطرق والجماعات البيانات المقترحة قد اقترحت لتطوير نماذج تقسيم الجملة، فقد تم إيلاء القليل من الاهتمام لكيفية تفاعل تقسيم الجملة مع هيكل الخطاب. في هذا العمل، نركز على الحالات التي يحتوي فيها نص الإدخال على اتصال خطاب، والتي نشير إليها كقامة عقوبة قائمة على الخطاب. نقوم بإنشاء مجموعات بيانات صناعية وعضوية لتقسيم الخطاب واستكشاف طرق مختلفة للجمع بين مجموعات البيانات هذه باستخدام بنية نموذجية مختلفة. نظهر أن نماذج خطوط الأنابيب التي تستخدم هيكل الخطاب للتوسط في جملة تقسيم النماذج المنفقة المناسبة في تعلم الطرق المختلفة للتعبير عن علاقة خطاب ولكن توليد نص أقل نحوية؛ توفر تلك البيانات الاصطناعية على نطاق واسع أساسا أفضل للتعلم من البيانات العضوية النطاق الصغيرة؛ وهذا التدريب على التركيز على الخطاب، وليس على بيانات تقسيم الجملة العامة يوفر أساسا أفضل لتقسيم الخطاب.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يشير العمل السابق إلى أن معلومات خطاب المعلومات المتعلقة بالتلخيص.في هذه الورقة، نستكشف ما إذا كان هذا التآزر بين الخطاب والتلخيص ثنائي الاتجاه، من خلال استنتاج أشجار الخطاب على مستوى المستند من الملخصات العصبية المدربة مسبقا.على وجه الخصوص، نولد أشج ار خطاب على الطراز الأول غير المسموح به من مصفوفات الانتباه الذاتي لنموذج المحول.تكشف التجارب عبر النماذج ومجموعات البيانات أن الملخصات تتعلم كل من معلومات الخطاب على حد سواء، والاعتماد على نمط الدوائر الانتخابية، والتي يتم ترميزها عادة في رأس واحد، تغطي تبعيات الخطاب طويلا وقصيرا.بشكل عام، تشير النتائج التجريبية إلى أن معلومات الخطاب المستفادة عامة ومباشرة قابلة للتحويل.
ركزت معظم الدراسات الحالية للاستخدام اللغوي في محتوى الوسائط الاجتماعية على الميزات اللغوية على مستوى السطح (على سبيل المثال، كلمات الوظائف وعلامات الترقيم) وجوانب المستوى الدلالي (على سبيل المثال، الموضوعات والمعنويات والعواطف) للتعليقات. لم يتم است كشاف استراتيجيات الكاتب لبناء وربط قطاعات النص على نطاق واسع على الرغم من أن هذه المعرفة من المتوقع أن تتخلص الضوء على كيفية سبب الناس في البيئات عبر الإنترنت. المساهمة في هذا الاتجاه التحليل لدراسات وسائل التواصل الاجتماعي، نبني نظام تحليل عصبي عصبي يمكن الوصول إليه علنا ​​يحلل علاقات الخطاب في تعليق عبر الإنترنت. توضح تجاربنا أن هذا النظام يحقق أداء مماثل بين جميع أنظمة التحليل العصبي العصبي. لإظهار استخدام هذه الأداة في تحليل وسائل التواصل الاجتماعي، فإننا نطبق عليه لتحديد علاقات الخطاب في تعليقات مقنعة وغير مقنعة وفحص العلاقات بين عمق شجرة الخطاب الثنائي، وعلاقات الخطاب، والإقناع المتصور للتعليقات عبر الإنترنت. يوضح عملنا إمكانية تحليل هياكل خطاب التعليقات عبر الإنترنت مع نظامنا وآثار هذه الهياكل لفهم الاتصالات عبر الإنترنت.
يمكن تصنيف نماذج ترتيب الجملة المهيمنة في طرازات طلب الزوجية ونماذج ضبط التسلسل. ومع ذلك، هناك محاولة قليلة للجمع بين هذين النوعين من النماذج، والتي تمتلك بمثابة مزايا تكميلية. في هذه الورقة، نقترح إطارا رواية ترتيب جملة جديدة يقدم اثنين من المصنفين لتحقيق استخدام أفضل لطلبات الزوجية لطلب الجملة القائمة على الرسم البياني (يين وآخرون 2019، 2021). خصيصا، بالنظر إلى الرسم البياني للكيان الجماعي الأولي، نقدم أولا مصنف في الرسم البياني للتنبؤ بأمر الزوج بين الجمل المرتبطة. بعد ذلك، بطريقة تكرارية، استنادا إلى الرسم البياني الذي تم تحديثه من قبل طلبات الزوجية عالية الواثقة مسبقا، يتم استخدام مصنف آخر للتنبؤ بأمر الزوج غير المؤكد. أخيرا، نحن نتكيف مع نموذج طلب جملة قائمة على أساس GRN (يين وآخرون 2019، 2021) على أساس الرسم البياني النهائي. تجارب على خمسة مجموعات بيانات شائعة الاستخدام توضح فعالية وعمل نموذجنا. خاصة، عند تزويد Bert (Devlin et al. 2019) و FHDecoder (يين وآخرون 2020)، ينص نموذجنا على أداء الحديث عن الفن. يتوفر الكود الخاص بنا في https://github.com/deeplearnxmu/irseg.
نحن نبحث كيف يمكن تعديل محولات مستوى الجملة في وضع علامات تسلسل فعالة على مستوى الرمز المميز دون أي إشراف مباشر.لا تؤدي الأساليب الموجودة إلى وضع العلامات على التسلسل الصفرية جيدا عند تطبيقها على الهندسة القائمة على المحولات.نظرا لأن المحولات تحتوي ع لى طبقات متعددة من اهتمام ذاتي متعدد الأطراف، فإن المعلومات الواردة في الجملة التي يتم توزيعها بين العديد من الرموز، مما يؤثر سلبا على أداء مستوى الرمز المميز من الصفر.نجد أن وحدة انتباه ناعمة تشجع صراحة على حدة الأوزان الاهتمام يمكن أن تتفوق بشكل كبير على الأساليب الحالية.
هدفت هذه الدراسة إلى استقصاء الخصائص البلاغية الرئيسة في خطاب الصحافة العربية. و لذلك اِختُبِرِت مقتطفات من صحيفتين أردنيتين من الصحف المشهورة في الأردن و حلَِّلت هذه النصوص و عولِجتْ. تبين نتائج هذه الدراسة أن إحدى الخصائص لهذا النوع من الخطاب هو التكرار أي تكرار المفردة اللغوية نفسها. و تظهر الدراسة أيضا خاصة أخرى و هي الاستخدام الواضح للعبارات التقييمية من أجل دعم وجهة نظر الكاتب. فضلاً عن ذلك تبين نتائج هذه الدراسة أن الخطاب الصحفي في العربية يوضح العلاقات القائمة بين أجزاء الجمل، و خصوصاً علاقة الأجزاء التابعة بالعبارة الرئيسية، و أن أدوات الخطاب الصحفي بالعربية تستخدم لتوضيح علاقات التباين في المعنى بين الجمل الخبرية في هذا النوع من الخطاب.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا