ترغب بنشر مسار تعليمي؟ اضغط هنا

الاستفادة من المعرفة تكوين الكلمة ل disambigation الكلمة الصينية

Leveraging Word-Formation Knowledge for Chinese Word Sense Disambiguation

486   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في لغات parataxis مثل الصينية، يتم بناء معاني الكلمات باستخدام تكوينات كلمات محددة، والتي يمكن أن تساعد في إزالة حواس الكلمات.ومع ذلك، نادرا ما يتم استكشاف هذه المعرفة في أساليب Disambiguation Sense (WSD) السابقة.في هذه الورقة، نقترح نفايات المعرفة بتكوين النصوص لتعزيز WSD الصيني.نحن أولا بناء مجموعة بيانات WSD الصينية على نطاق واسع مع تكوينات الكلمات.بعد ذلك، نقترح نموذج صيغة نموذجية لإدماج تكوين الكلمات بشكل صريح في حالة إزالة الغموض.لتعزيز التعميم، نقوم بتصميم وحدة تنقية تكوين كلمة في حالة تعويض تكوين كلمة غير متوفرة.تظهر النتائج التجريبية أن طريقتنا تجلب تحسن كبير في الأداء على خطوط خطوط خطوط خطوط طويلة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تظهر الأبحاث الحديثة أن النماذج المدربة مسبقا (PTMS) مفيدة تجزئة الكلمات الصينية (CWS).ومع ذلك، فإن PTMS المستخدمة في الأعمال السابقة عادة ما تعتمد نمذجة اللغة كامرأة تدريبية مسبقا، تفتقر إلى معرفة تجزئة مسبقة خاصة بمهام المهام وتجاهل التناقض بين مها م ما قبل التدريب ومهام CWS المصب.في هذه الورقة، نقترح MetASE مطلقا مدربا مسبقا مسبقا CWS، والذي توظف هندسة موحدة ويشمل خوارزمية التعلم المعتوية في مهمة ما قبل التدريب متعدد المعايير.تظهر النتائج التجريبية أن METASEG يمكن أن تستخدم معرفة تجزئة مسبقة مشتركة من المعايير الحالية المختلفة وتخفيف التناقض بين النماذج المدربة مسبقا ومهام CWS المصب.علاوة على ذلك، يمكن أن يحقق MetASEG أداء جديدا على أحدث بيانات CWS المستخدمة على نطاق واسع وتحسين أداء النموذج بشكل كبير في إعدادات الموارد المنخفضة.
عادة ما تحقق الأساليب الخاضعة للإشراف أفضل أداء في مشكلة غموض معنى الكلمة.ومع ذلك، فإن عدم توفر إحساس كبير مشروح بالنسبة للعديد من اللغات منخفضة الموارد يجعل هذه الأساليب غير قابل للتطبيق لها في الممارسة العملية.في هذه الورقة، نقوم بتخفيف هذه المشكلة باللغة الفارسية من خلال اقتراح نهج أوتوماتيكي بالكامل للحصول على فارسية الفارسية (Bredemcor)، ككائن مشروح من كيس الفارسية (القوس).قمنا بتقييم الصرص على حد سواء بشكل جوهري ودخله وأظهر أنه يمكن استخدامه بفعالية كمجموعات تدريبية لأنظمة WSD الإشرافية الفارسية.لتشجيع البحث في المستقبل على الغموض في مجال الإحساس بالكلمة الفارسية، فإننا نطلق الولادة في http://nlp.sbu.ac.ir.
التحديد التركيز هو مهمة مقترحة حديثا تركز على اختيار الكلمات للتأكيد في جمل قصيرة.الطريقة التقليدية تنظر فقط في معلومات التسلسل من الجملة مع تجاهل هيكل الجملة الغنية ومعلومات علاقة الكلمة.في هذه الورقة، نقترح إطارا جديدا يعتبر هيكل الجملة عبر رسم بيا ني هيكل الجملة وعلاقة كلمة عبر الرسم البياني للكلمة التشابه.يتم اشتقاق الرسم البياني هيكل الجملة من شجرة التحليل من الجملة.يسمح الرسم البياني للكلمة التشابه العقد بمشاركة المعلومات مع جيرانها لأننا نقول أنه في التركيز على التحديد، من المرجح أن يتم التأكيد على كلمات مماثلة معا.يتم استخدام الشبكات العصبية الرسم البياني لتعلم تمثيل كل عقدة لهذين الرسوم البيانية.تظهر النتائج التجريبية أن إطارنا يمكن أن يحقق أداء متفوقا.
أصبحت الأنظمة الخاضعة للإشراف في الوقت الحاضر وصفة قياسية ل disambiguation شعور النصوص (WSD)، مع طرازات اللغة القائمة على المحولات كعنصرها الأساسي. ومع ذلك، في حين أن هذه الأنظمة قد تحققت بالتأكيد عروض غير مسبوقة، فإن جميعها تعمل تقريبا في ظل افتراض التقييد، بالنظر إلى سياق، يمكن إزالة كل كلمة بشكل فردي دون أي حساب من الخيارات الأخرى بالمعنى. لمعالجة هذا القيد وإسقاط هذا الافتراض، نقترح الفهم المعنى المستمر (CONSEC)، ونهج جديد في WSD: الاستفادة من إعادة تأكيد مؤخرا لهذه المهمة كمحالة استخراج النص، نحن نتكيافقها على صياغةنا وإدخال حلقة ردود الفعل الاستراتيجية التي تسمح بالغزانة للكلمة المستهدفة لا تتضمن فقط في سياقها ولكن أيضا على الحواس الصريحة المخصصة للكلمات القريبة. نقيم Consec وفحص كيف تقود مكوناتها إلى تجاوز جميع منافسيها وتحديد حالة من الفن الجديد على WSD الإنجليزية. نستكشف أيضا كيفية فرايس Consec في الإعداد المتبادل اللغوي، مع التركيز على 8 لغات مع درجات مختلفة من توفر الموارد، وإبلاغ تحسينات كبيرة على النظم السابقة. نطلق سردنا في https://github.com/sapienzanlp/consec.
التحيز بين الجنسين في Adgeddings تصبح تدريجيا حقل بحثي حية في السنوات الأخيرة.تهدف معظم الدراسات في هذا المجال إلى أساليب القياس والدولي مع اللغة الإنجليزية كلغة الهدف.تحقق هذه الورقة في التحيز بين الجنسين في تضيير كلمة ثابتة من منظور فريد من منظور ص يني.من خلال التدريب على تمثيلات الكلمات مع نماذج مختلفة، يتم تقييم التحيز بين الجنسين وراء ناقلات الصفات.من خلال مقارنة بين النتائج المنتجة ومجموعة بيانات مسجلة بشرية، نوضح كيف يميز التحيز بين الجنسين المشفرة في AdmBeddings من مواقف الناس.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا