ترغب بنشر مسار تعليمي؟ اضغط هنا

محاذاة معنى كلمة أحادية الأحادية كمشكلة التصنيف

Monolingual Word Sense Alignment as a Classification Problem

215   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

يتم تعريف الكلمات بناء على معانيها بطرق مختلفة في موارد مختلفة.يزيد محاذاة حواس الكلمات عبر الموارد المعجمية أحادية العمل، مما يزيد من تغطية المجال وتمكن تكامل البيانات وإدماجها.في هذه الورقة، نستكشف تطبيق أساليب التصنيف باستخدام الميزات المستخرجة يدويا جنبا إلى جنب مع تقنيات تعليم التمثيل في مهمة محاذاة معنى النصوص والكشف عن العلاقة الدلالية.نوضح أن أداء أساليب التصنيف يختلف بشكل كبير بناء على نوع العلاقات الدلالية بسبب طبيعة المهمة ولكنه يتفوق على التجارب السابقة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

أصبحت الأنظمة الخاضعة للإشراف في الوقت الحاضر وصفة قياسية ل disambiguation شعور النصوص (WSD)، مع طرازات اللغة القائمة على المحولات كعنصرها الأساسي. ومع ذلك، في حين أن هذه الأنظمة قد تحققت بالتأكيد عروض غير مسبوقة، فإن جميعها تعمل تقريبا في ظل افتراض التقييد، بالنظر إلى سياق، يمكن إزالة كل كلمة بشكل فردي دون أي حساب من الخيارات الأخرى بالمعنى. لمعالجة هذا القيد وإسقاط هذا الافتراض، نقترح الفهم المعنى المستمر (CONSEC)، ونهج جديد في WSD: الاستفادة من إعادة تأكيد مؤخرا لهذه المهمة كمحالة استخراج النص، نحن نتكيافقها على صياغةنا وإدخال حلقة ردود الفعل الاستراتيجية التي تسمح بالغزانة للكلمة المستهدفة لا تتضمن فقط في سياقها ولكن أيضا على الحواس الصريحة المخصصة للكلمات القريبة. نقيم Consec وفحص كيف تقود مكوناتها إلى تجاوز جميع منافسيها وتحديد حالة من الفن الجديد على WSD الإنجليزية. نستكشف أيضا كيفية فرايس Consec في الإعداد المتبادل اللغوي، مع التركيز على 8 لغات مع درجات مختلفة من توفر الموارد، وإبلاغ تحسينات كبيرة على النظم السابقة. نطلق سردنا في https://github.com/sapienzanlp/consec.
يميل مؤلفو النص إلى استخدام إحساس واحد في الغالب ل Lemma التي يمكن أن تختلف بين المؤلفين المختلفين.قد لا يتم التقاط هذا بنموذج Disambiguation Sense (WSD) المعذر (WSD) الذي تم تدريبه على المؤلفين المتعددين.يجد عملنا أن الحواس الأولى في WordNet، والحوا س السائدة من نوع DataSet الخاص بنا، والاستحواذ السائدة للمؤلف يمكن أن تكون مختلفة، وبالتالي، يمكن أن تؤدي النماذج المؤلف للأذرع بشكل جيد على مجموعة البيانات بأكملها، ولكن بشكل سيء على المؤلفين الأفراد.في هذا العمل، نستكشف أساليب تخصيص نماذج WSD عن طريق خياطة النماذج الموجودة من أحدث النماذج نحو الفرد من خلال استغلال توزيعات معنى المؤلف.نقترح مجموعة بيانات WSD الجديدة وإظهار أن تخصيص نظام WSD مع معرفة توزيعات معنى المؤلف أو الحواس السائدة يمكن أن تزيد بشكل كبير أدائها.
القدرة على توليد محاذاة كلمة دقيقة مفيدة لمجموعة متنوعة من المهام.في حين أن محاذاة الكلمة الإحصائية يمكن أن تعمل بشكل جيد، خاصة عندما تكون بيانات التدريب الموازية وفيرة، فقد تبين مؤخرا نماذج تضمين متعددة اللغات نتائج جيدة في سيناريوهات غير مخالفة.نقي م طريقة فرقة لمحاذاة الكلمات على أربع أزواج لغوية وإظهار ذلك من خلال الجمع بين أدوات متعددة، والاستفادة من نهجها المختلفة، يمكن إجراء مكاسب كبيرة.هذا يحمل للإعدادات التي تتراوح من الموارد المنخفضة جدا إلى المورد العالي.علاوة على ذلك، نقدم اختبار محاذاة ذهبي جديد مجموعة أيسلندية وأداة جديدة سهلة الاستخدام لإنشاء محاذاة Word يدوية.
عادة ما تحقق الأساليب الخاضعة للإشراف أفضل أداء في مشكلة غموض معنى الكلمة.ومع ذلك، فإن عدم توفر إحساس كبير مشروح بالنسبة للعديد من اللغات منخفضة الموارد يجعل هذه الأساليب غير قابل للتطبيق لها في الممارسة العملية.في هذه الورقة، نقوم بتخفيف هذه المشكلة باللغة الفارسية من خلال اقتراح نهج أوتوماتيكي بالكامل للحصول على فارسية الفارسية (Bredemcor)، ككائن مشروح من كيس الفارسية (القوس).قمنا بتقييم الصرص على حد سواء بشكل جوهري ودخله وأظهر أنه يمكن استخدامه بفعالية كمجموعات تدريبية لأنظمة WSD الإشرافية الفارسية.لتشجيع البحث في المستقبل على الغموض في مجال الإحساس بالكلمة الفارسية، فإننا نطلق الولادة في http://nlp.sbu.ac.ir.
تبسيط النص هو حقل متزايد مع العديد من التطبيقات المفيدة المحتملة.تتطلب خوارزميات تبسيط النص التدريب عموما الكثير من البيانات المشروحة، ومع ذلك لا توجد العديد من الشركات المناسبة لهذه المهمة.نقترح طريقة جديدة غير مخالفة لمحاذاة النص بناء على تضمين Doc 2vec وخوارزمية محاذاة جديدة، قادرة على محاذاة النصوص على مستويات مختلفة.يوضح التقييم الأولي نتائج واعدة للنهج الجديد.استخدمنا النهج المطور الذي تم تطويره حديثا لإنشاء كوربلا متوازيا أحادية طيور أحادية جديدة تتألف من أعمال الفلاسفة الحديث الإنجليزي وإصداراتهم المبسطة المقابلة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا