ترغب بنشر مسار تعليمي؟ اضغط هنا

تلخيص النصوص

Text Summarization

1591   3   31   0 ( 0 )
 تاريخ النشر 2018
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل Ahmad Ataya




اسأل ChatGPT حول البحث

تسببت الزيادة الكبيرة في كمية المعلومات المتاحة في الانترنت من مختلف المصادر في السنوات الأخيرة إلى صعوبة الوصول والبحث في النصوص الكبيرة عن المعلومة المطلوبة بسرعة وكفاءة وكان من الصعب جداً استخراج تلاخيص النصوص بشكل يدوي وذلك بسبب النمو الهائل للمعلومات بشكل يومي لذلك أصبح من الضروري استخراج التلاخيص تلقائياً من نص واحد أو عدة نصوص لذلك سنتطرق في بحثنا إلى أهم الأساليب والطرق في عمليات التلخيص في الأعوام السابق



المراجع المستخدمة
Text Summarization Techniques: A Brief Survey Mehdi Allahyari, Seyed Amin ouriyeh, +4 authors Krys J. Kochut (2017).
A survey on extractive text summarization N. Moratanch, S. Chitrakala (2017 ).
Your Easy Guide to Latent Dirichlet Allocation - medium.com (2018).
Text Summarization – medium.com (2018).
LATENT DIRICHLET LEARNING FOR DOCUMENT SUMMARIZATION (2015).
SURVEY ON TEXT SUMMARIZATIONMETHODS (2018).
Abstractive Text Summarization using Sequence-to-sequence RNNs andBeyond (2016).
Extractive Text Summarization using Neural Networks (2017).
Neural Summarization by Extracting Sentences and Words (2016).
قيم البحث

اقرأ أيضاً

العروض التقديمية مهمة للتواصل في جميع مجالات حياتنا، ومع ذلك فإن إنشاء الطوابق الشريحة غالبا ما تكون مملة وتستهلك الوقت.كان هناك بحث محدود يهدف إلى أتمتة عملية توليد المستندات إلى الشرائح وجميع مواجهة التحدي الحرج: لا توجد مجموعة بيانات متاحة للجمهور للتدريب والمعايير.في هذا العمل، فإننا نساهم أولا في مجموعة بيانات جديدة، Sciduet، تتكون من أزواج من الأوراق وحوابق الشرائح المقابلة من مؤتمرات NLP و ML الأخيرة (E.G.، ACL).ثانيا، نقدم D2S، وهو نظام جديد يتناول مهمة المستندات إلى الشرائح مع نهج من خطوتين: 1) استخدم عناوين الشريحة لاسترداد النص والأرقام والجشطة ذات الصلة والجاذبية؛2) لخص السياق المسترجع في نقاط رصاصة مع الإجابة على سؤال طويل الشكل.يشير تقييمنا إلى أن ضميز ضمنيا طويل النموذج يتفوق على خطوط الأساس الملخص لحدي الفن على كل من مقاييس الحمر التلقائي والتقييم البشري النوعي.
لقد ظهر التعلم الناقض كطريقة لتعلم التمثيل القوي ويسهل العديد من المهام المصب المختلفة خاصة عندما تكون البيانات الخاضعة للإشراف محدودة. كيفية بناء عينات مضاءة فعالة من خلال تكبير البيانات هي مفتاح نجاحها. على عكس مهام الرؤية، لم يتم التحقيق في طريقة تكبير البيانات للتعلم المتعاقل بما فيه الكفاية في مهام اللغة. في هذه الورقة، نقترح نهج رواية لبناء عينات صغيرة لمهام اللغة باستخدام تلخيص النص. نحن نستخدم هذه العينات للتعلم المتعاقل الخاضع للإشراف للحصول على تمثيلات نصية أفضل التي تنفصل إلى حد كبير مهام تصنيف النص بشراحي محدود. لمزيد من تحسين الطريقة، نخلط عينات من فئات مختلفة وإضافة تنظيم إضافي، يدعى Mixsum، بالإضافة إلى فقدان الانتروبيا. توضح التجارب في مجموعات بيانات تصنيف النص العالمي الحقيقي (Amazon-5، YELP-5، AG News، IMDB) فعالية إطار التعلم المقاوم للضبط المقترح مع تكبير البيانات القائمة على التلخصات وانتظام Mixsum.
يمكن أن تكون كمية المعلومات المتاحة عبر الإنترنت ساحقة للمستخدمين من هضمها، خاصة عند التعامل مع تعليقات المستخدمين الآخرين عند اتخاذ قرار بشأن شراء منتج أو خدمة. في هذا السياق، تكون أنظمة تلخيص الرأي ذات قيمة كبيرة، واستخراج معلومات مهمة من النصوص وت قديمها للمستخدم بطريقة أكثر فهمة. من المعروف أيضا أن استخدام التمثيلات الدلالية يمكن أن يفيدن جودة الملخصات التي تم إنشاؤها. تهدف هذه الورقة إلى تطوير أساليب تلخيص الرأي بناء على مجردة معنى تمثيل النصوص في اللغة البرتغالية البرازيلية. تم التحقيق في أربع طرق مختلفة، إلى جانب بعض مناهج الأدب. تظهر النتائج أن الأسلوب المستند إلى جهاز التعلم الآلي أنتج ملخصات ذات جودة أعلى، مما يتفوق على تقنيات الأدب الأخرى على الرسوم البيانية الدلالية المصنوعة يدويا. نعرض أيضا أن استخدام الرسوم البيانية المحيطة بها أكثر من تلك المشروح يدويا ضرر بالإخراج. أخيرا، يشير تحليل مدى أهمية أنواع المعلومات المختلفة لعملية التلخيص إلى أن استخدام ميزات تحليل المعرفات لم يحسن جودة ملخص.
عادة ما يتم تغريم الصلة في التلخيص بناء على معلومات نصية وحدها، دون دمج الأفكار حول قرار معين. نتيجة لذلك، لدعم تحليل المخاطر لسرطان البنكرياس، قد تشمل ملخصات الملاحظات الطبية معلومات غير ذات صلة مثل إصابة الركبة. نقترح مشكلة جديدة، ويلخص تركز في الق رار، حيث الهدف هو تلخيص المعلومات ذات الصلة لاتخاذ قرار. نستفيد من نموذج تنبؤي يتخذ القرار بناء على النص الكامل لتوفير رؤى قيمة حول كيفية استنتاج القرار من النص. لبناء ملخص، ثم حدد جمل تمثيلية تؤدي إلى قرارات نموذجية مماثلة مثل استخدام النص الكامل أثناء المحاسبة عن عدم التكرار النصي. لتقييم طريقةنا (Decsum)، نبني اختبار المهمة لتلخيص المراجعات العشرة الأولى لمطعم لدعم التنبؤ بتصنيفها في المستقبل على Yelp. تفوق Decsum بشكل كبير على أساليب تلخيص النص فقط وأساليب التفسير القائمة على النماذج في الإخلاص والتمثيل. نوضح كذلك أن Decsum هو الطريقة الوحيدة التي تمكن البشر من تفوق فرصة عشوائية في التنبؤ بالمطعم الذي سيتم تصنيفه بشكل أفضل في المستقبل.
تكتسب المحادثات التي تلخيصها عبر النهج العصبية الجر أبحث في الآونة الأخيرة، ومع ذلك، لا تزال تحديا للحصول على حلول عملية. وتشمل أمثلة مثل هذه التحديات تبادل المعلومات غير منظم في الحوارات والتفاعلات غير الرسمية بين المتحدثين والتغيرات الديناميكية للم تكلمين كما يتطور الحوار. العديد من هذه التحديات تؤدي إلى روابط كوراسة المعقد. لذلك، في هذا العمل، يمكننا التحقيق في نهج مختلفة لإدماج معلومات Aquerfery بشكل صريح في نماذج تلخيص الحوار المبادرة العصبية لمعالجة التحديات المذكورة أعلاه. تظهر النتائج التجريبية أن النهج المقترحة تحقق من الأداء الحديثة، مما يعني أنه من المفيد استخدام معلومات Aquerence في تلخيص الحوار. توصي نتائج التقييم على صحة واقعية تشير إلى أن هذه النماذج المفيدة هي أفضل في تتبع تدفق المعلومات بين المحاورين وربط الوضع / الإجراءات الدقيقة مع المحاورين المقابلين وذكر الشخص.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا