ترغب بنشر مسار تعليمي؟ اضغط هنا

Textessence: أداة للتحليل التفاعلي للتحولات الدلالية بين كوربورا

TextEssence: A Tool for Interactive Analysis of Semantic Shifts Between Corpora

293   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تضمين الكلمات والمفاهيم التقاط الانتظام النحوية والدلالة للغة؛ومع ذلك، فقد شهدوا استخداما محدودا كأدوات لدراسة خصائص Corpora المختلفة وكيف تتعلق ببعضها البعض.نقدم TECTESSENCE، نظام تفاعلي مصمم لتمكين التحليل المقارن لشركة Corpora باستخدام AdmEdings.يشمل Textessence أوضاع مرئية ومقرها الجوار والمشاكل في تضمين التحليل في واجهة خفيفة الوزن واستنادا على الويب.نقترح مزيدا من الإجراءات الجديدة لتضمين الثقة بناء على أقرب تداخل حي، للمساعدة في تحديد المدينات عالية الجودة لتحليل Corpus.توضح دراسة حالة عن الأدبيات العلمية Covid-19 فائدة النظام.يمكن العثور على Textessence في https://textessence.github.io.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

اكتشاف التغيير الدلالي المعجمي في مجموعات بيانات أصغر، على سبيل المثالفي اللغويات التاريخية والعلوم الإنسانية الرقمية، تحديا بسبب نقص القوة الإحصائية.يتم تفاقم هذه المشكلة عن طريق نماذج التضمين غير السياقية التي تنتج واحدة من التضمين لكل كلمة، وبالتا لي، قم بإخفاء التباين الحاضر في البيانات.في هذه المقالة، نقترح نهجا لتقدير التحول الدلالي من خلال الجمع بين تضمين الكلمات السياقية مع الاختبارات الإحصائية القائمة على التقاطات.نحن نستخدم إجراء معدل الاكتشاف الخاطئ لمعالجة العدد الكبير من اختبارات الفرضيات التي يجري تنفيذها في وقت واحد.نوضح أداء هذا النهج في المحاكاة حيث تحقق بدقة عالية باستمرار عن طريق قمع إيجابيات كاذبة.كلفنا تحليل بيانات العالم الحقيقي من مهمة Semeval-2020 1 و Liverpool FC SubRedDit Corpus.نظرا لأنه من خلال أخذ التباين العينة في الاعتبار، يمكننا تحسين متانة تقديرات التحول الدلالي الفردي دون مهينة الأداء العام.
في الآونة الأخيرة، يركز غالبية الباحثين تحليل المعنويات على تحليل المعنويات المستندة إلى الهدف لأنه يوفر تحليلا متعمقا بنتائج أكثر دقة بالمقارنة مع تحليل المعنويات التقليدية.في هذه الورقة، نقترح نهجا تعليميا تفاعليا لمعالجة مهمة تحليل المعنويات المست ندة إلى الهدف للغة العربية.يستخدم نموذج IA-LSTM المقترح آلية تفاعلية تعتمد على الانتباه لإجبار النموذج على التركيز على أجزاء مختلفة (أهداف) من الجملة.نحن نبحث في القدرة على استخدام الأهداف والحق الأيمن والأيسر، ونموذجها بشكل منفصل لتعلم تمثيلاتهم الخاصة عبر النمذجة التفاعلية.قمنا بتقييم نموذجنا على مجموعة بيانات مختلفة: مراجعة الفنادق العربية ومجموعات بيانات مراجعة الكتاب العربية.توضح النتائج فعالية استخدام هذه التقنية النمذجة التفاعلية للمهمة القائمة على الأهداف العربية.حصلت النموذج على قيم دقة 83.10 مقارنة بنماذج Sota مثل AB-LSTM-PC والتي حصلت على 82.60 لنفس مجموعة البيانات.
القدرة على توليد محاذاة كلمة دقيقة مفيدة لمجموعة متنوعة من المهام.في حين أن محاذاة الكلمة الإحصائية يمكن أن تعمل بشكل جيد، خاصة عندما تكون بيانات التدريب الموازية وفيرة، فقد تبين مؤخرا نماذج تضمين متعددة اللغات نتائج جيدة في سيناريوهات غير مخالفة.نقي م طريقة فرقة لمحاذاة الكلمات على أربع أزواج لغوية وإظهار ذلك من خلال الجمع بين أدوات متعددة، والاستفادة من نهجها المختلفة، يمكن إجراء مكاسب كبيرة.هذا يحمل للإعدادات التي تتراوح من الموارد المنخفضة جدا إلى المورد العالي.علاوة على ذلك، نقدم اختبار محاذاة ذهبي جديد مجموعة أيسلندية وأداة جديدة سهلة الاستخدام لإنشاء محاذاة Word يدوية.
تقوم هذه الورقة بتحقيق تحديثات Treebanks التبعيات العالمية (UD) في 23 لغة وتأثيرها على تطبيق المصب.يشارك العديد من الأشخاص في تحديث المبادئ التوجيهية لشروح UD وشجرة Treebanks بلغات مختلفة.ومع ذلك، ليس من السهل التحقق مما إذا كانت الموارد المحدثة تحتف ظ بالعالمية بموارد لغة أخرى.وبالتالي، ينبغي اختبار صلاحية واتساق وتناسقه متعدد اللغات من خلال مهام التطبيق التي تنطوي على هياكل النحوية مع علامات نقاط البيع، وعلامات التبعية، والميزات العالمية.نحن نطبق المحللين النحامين المدربين على UD Treebanks من إصدارات متعددة (2.0 إلى 2.7) مستخرج معنويات على مستوى البند.ثم نحلل العلاقات بين درجات المرفقات من محلل التبعية والأداء في مهام التطبيق.لتطورات UD المستقبلية، نعرض أمثلة على المخرجات التي تختلف حسب الإصدار.
يهدف التبسيط المعجمي (LS) إلى استبدال الكلمات التي تعتبر مجمعا في جملة من قبل معادلات أبسط.في هذه الورقة، نقدم أول خدمة LS أوتوماتيكية للفرنسية، والحصوية، والتي تقدم تقنيات مختلفة لتوليد واختيار ودائل الرتبة.تصف الورقة الطرق المختلفة التي اقترحتها أد اةنا، والتي تشمل كلتا الأساليب الكلاسيكية (مثل توليد المرشحين من الموارد المعجمية، ومرشح التردد، وما إلى ذلك) ونهج أكثر ابتكارا مثل استغلال كاممبرت، وهو نموذج للفرنسية القائمة على روبرتاهندسة معمارية.لتقييم الطرق المختلفة، يتم تقديم مجموعة بيانات تقييم جديدة للفرنسية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا