ترغب بنشر مسار تعليمي؟ اضغط هنا

قياس التشابه من الجمل تحمل الرأي

Measuring Similarity of Opinion-bearing Sentences

445   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

بالنسبة للعديد من تطبيقات NLP للمراجعات عبر الإنترنت، فإن مقارنة جملتين تحمل رأي هي مفتاح. نقول أنه، في حين تم تطبيق مقاييس تشابه النص العام للأغراض العامة لهذا الغرض، كان هناك استكشاف محدود من تطبيقه على نصوص الرأي. نحن نتطلع إلى هذه الفجوة في الأدبيات، الدراسة: (1) كيف يحكم البشر على تشابه أزواج من الجمل التي تحمل الرأي؛ و (2) الدرجة التي يتوافق فيها مقاييس التشابه النصية الحالية، ولا سيما المتكررين على أساس الأحكام البشرية. نحن علاجه التعليقات التوضيحية لأزواج عقوبة الرأي ونتائجنا الرئيسية هي: (1) المعلقون يميلون إلى الاتفاق على ما إذا كانت أحكام الرأي متشابهة أم لا بشكل مختلف؛ و (2) تضمين المقاييس القائم على الأحكام الإنسانية من تشابه الرأي "ولكن عدم وجود فرق الرأي". بناء على تحليلنا، نحدد المجالات التي ينبغي فيها تحسين المقاييس الحالية. نقترح مزيد من التعلم لتعلم مقياس التشابه من أجل تشابه الرأي من خلال ضبط شبكة تضمين عقوبة القصص الجماعية بناء على نص المراجعة والإشراف الضعيف عن طريق تقييمات المراجعة. تبين التجارب أن لدينا متري المستفادة تفوقت مقاييس التشابه النصية الحالية، وخاصة تظهر ارتباطا أعلى بكثير مع شروح بشرية لآراء مختلفة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تستخدم Word Embeddings على نطاق واسع في معالجة اللغة الطبيعية (NLP) لمجموعة واسعة من التطبيقات. ومع ذلك، فقد ثبت باستمرار أن هذه المدينات تعكس نفس التحيزات البشرية الموجودة في البيانات المستخدمة لتدريبها. معظم مؤشرات التحيز المنصوص عليها للكشف عن تحي ز Word Embeddings مؤشرات قائمة على أساس مقياس التشابه الجيبلي. في هذه الدراسة، ندرس آثار تدابير التشابه المختلفة وكذلك التقنيات الوصفية الأخرى أكثر من المتوسط ​​في قياس تحيزات تضمين الكلمات السياقية وغير السياقية. نظهر أن حجم التحيزات المكشوفة في Word Embeddings يعتمد على تدابير الإحصاءات الوصفية والتشابه المستخدمة لقياس التحيز. وجدنا أنه خلال الفئات العشرة من اختبارات جمعية تضمين Word، تكشف مسافة Mahalanobis عن أصغر التحيز، وتكشف مسافة Euclidean عن أكبر تحيز في Word Ageddings. بالإضافة إلى ذلك، تكشف النماذج السياقية عن تحيزات أقل حدة من نماذج تضمين الكلمة غير السياقية.
التشابه النّصي الدّلالي هو أساس عدد لا يحصى من التطبيقات ويلعب دوراً هاماً في مجالات متنوعة مثل استرجاع المعلومات ، والكشف عن السرقة الأدبية ، والترجمة الآلية ، وكشف الموضوع ، وتصنيف النص ، وتلخيص النص وغيرها. ويعتمد العثور على التشابه بين نصين أو فقرات أو جمل على قياس التشابه بين الكلمات بشكل مباشر أو غير مباشر. هناك نوعان معروفان للتشابه: معجمية(Lexicon) ودلالية.(Semantic) يتعامل الأوّل مع الكلمات على أنها مجموعة من الأحرف: الكلمات متشابهة معًا إذا كانت تتشارك في نفس الأحرف بنفس الترتيب(تمتلك نفس السلسلة من المحارف). يهدف النوع الثّاني إلى تحديد الدّرجة التي ترتبط بها كلمتين بشكل دلالي على سبيل المثال يمكن أن تكون المرادفات تمثل نفس الشيء أو يتم استخدامها في نفس السياق، ولذلك التّشابه الدّلالي بين الكلمات يجب أن يكون knowledge based وهذا يعني أنّ التشابه بين الكلمتين يعتمد على معلومات يمكن الحصول عليها من معاجم كبيرة.
في هذا البرنامج التعليمي، سنظهر أين نحن وأين سنكون في هؤلاء الباحثين المهتمين بهذا الموضوع.نقسم هذا البرنامج التعليمي في ثلاثة أجزاء، بما في ذلك تعدين الرأي المالي الخشبي، والتعدين الرأي المالي المحتلة الجميلة، والاتجاهات البحثية المحتملة.يبدأ هذا ال برنامج التعليمي بتقديم المكونات في الرأي المالي المقترح في جدول أعمالنا ويلخص دراساتها ذات الصلة.كما نسلط الضوء على مهمة تعني آراء العملاء تجاه الخدمات المالية في صناعة الاصطناعي، ومقارنتها بالآراء المعتادة.سيتم تناول العديد من الأسئلة البحوث المحتملة.نأمل أن تكتسب جمهور هذا البرنامج التعليمي لمحة عامة عن التعدين في الرأي المالي ومعرفة اتجاهات البحث الخاصة بهم.
أظهرت مؤخرا تقنيات محاذاة المستندات بناء على تمثيلات جملة متعددة اللغات في مؤخرا حالة النتائج الفنية.ومع ذلك، تعتمد هذه التقنيات على تقنيات قياس المسافة غير المزعجة، والتي لا يمكن تغريمها بالمهمة في متناول اليد.في هذه الورقة، بدلا من تقنيات قياس المس افة غير المركبات هذه، فإننا نوظف التعلم المتري لاستخلاص قياسات المسافة الخاصة بالمهام.يتم إشراف هذه القياسات، مما يعني أن متري قياس المسافة يتم تدريبه باستخدام مجموعة بيانات متوازية.باستخدام مجموعة بيانات تنتمي إلى اللغة الإنجليزية، سنهالا، والتاميل، والتي تنتمي إلى ثلاث أسر لغوية مختلفة، نظهر أن مقاييس التعلم الخاصة بمهام المهام التي أشرفت على الفعالة تفوقت نظرائهم غير المعروضين، لمحاذاة المستندات.
يمكن أن تكون كمية المعلومات المتاحة عبر الإنترنت ساحقة للمستخدمين من هضمها، خاصة عند التعامل مع تعليقات المستخدمين الآخرين عند اتخاذ قرار بشأن شراء منتج أو خدمة. في هذا السياق، تكون أنظمة تلخيص الرأي ذات قيمة كبيرة، واستخراج معلومات مهمة من النصوص وت قديمها للمستخدم بطريقة أكثر فهمة. من المعروف أيضا أن استخدام التمثيلات الدلالية يمكن أن يفيدن جودة الملخصات التي تم إنشاؤها. تهدف هذه الورقة إلى تطوير أساليب تلخيص الرأي بناء على مجردة معنى تمثيل النصوص في اللغة البرتغالية البرازيلية. تم التحقيق في أربع طرق مختلفة، إلى جانب بعض مناهج الأدب. تظهر النتائج أن الأسلوب المستند إلى جهاز التعلم الآلي أنتج ملخصات ذات جودة أعلى، مما يتفوق على تقنيات الأدب الأخرى على الرسوم البيانية الدلالية المصنوعة يدويا. نعرض أيضا أن استخدام الرسوم البيانية المحيطة بها أكثر من تلك المشروح يدويا ضرر بالإخراج. أخيرا، يشير تحليل مدى أهمية أنواع المعلومات المختلفة لعملية التلخيص إلى أن استخدام ميزات تحليل المعرفات لم يحسن جودة ملخص.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا