ترغب بنشر مسار تعليمي؟ اضغط هنا

التعامل مع المكشفي النشط: بالمعنى دمج في BTB-WN

Handling synset overgeneration: Sense Merging in BTB-WN

216   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تقارير الورقة عن جهد لإعادة النظر في تمثيل بعض حالات أنماط النموذج المشتق في البلغارية.العلاج الجديد المنفذ داخل Bultreebank-Wordnet (BTB-WN)، Wordnet for Bulgarian، هو التجمع معا من الكلمات ذات الصلة التي لها معنى رئيسي مشترك في نفس المكامنة بينما يتم ترميز الفروق الدقيقة بالمعنى داخل Synetوظائف التعديل على المعنى الرئيسي.وبهذه الطريقة، يمكننا حل التحديات التالية: (1) لتجنب تمييز تأثير مركبات Wordnet (EWN) الإنجليزية على البلغارية التي كانت نتيجة لترجمة بعض التملك من Wordnet الأساسية؛(2) تمثيل المعنى المشترك لمثل هذه الأنماط الاشتقاق مرة واحدة فقط وتحسين إدارة BTB-WN، و (3) لتشفير استخدامات التصوير المعنيين محليا إلى التخلف المقابل بدلا من إدخال علاقات دلالية جديدة.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

في حين أن مقاييس الأداء الكلية يمكن أن تولد رؤى قيمة على نطاق واسع، إلا أن هيمنتها تعني ظاهرة أكثر تعقيدا وشغنا، مثل الغموض، قد يتم التغاضي عنها.التركيز على الشروط الغامضة (على سبيل المثال مشمس، غائم، شاب، إلخ) نحن تفحص سلوك النماذج المدرجة بشكل مريئ ي والنصوص فقط، وإيجاد الاختلافات المنهجية من الأحكام الإنسانية حتى عندما يكون الأداء العام للنموذج مرتفعا.للمساعدة في تفسير هذا التباين، نحدد افتراضين أدلى به مجموعات البيانات والنماذج التي تم فحصها، وتسترشد بفلسفة الغموض، عزل الحالات التي لا تعقد فيها.
تقدم هذه الورقة WN، مكتبة بيثون جديدة للعمل مع WordNets.على عكس المكتبات السابقة، تم بناء WN من البداية لاستيعاب الألعاب المتعددة --- لغات متعددة أو إصدارات متعددة من نفس Wordnet --- أثناء الاحتفاظ بالقدرة على الاستعلام واجتيازهم بشكل مستقل.كما أنه ق ادر أيضا على تنزيل وتشمل WordNets المنشورة عبر الإنترنت.تم إجراء هذه الميزات من خلال اعتماد WN للتنسيقات والأساليب القياسية مقابل التشغيل البيني، وهي مخطط WN-LMF (فوسين وآخرون، 2013؛ بوند وآخرون، 2020) ومؤشر الانترلينج التعاوني (السندات وآخرون، 2016)وبعدWN مفتوح المصدر، المتاحة بسهولة، وثقاع جيدا.
أصبحت الأنظمة الخاضعة للإشراف في الوقت الحاضر وصفة قياسية ل disambiguation شعور النصوص (WSD)، مع طرازات اللغة القائمة على المحولات كعنصرها الأساسي. ومع ذلك، في حين أن هذه الأنظمة قد تحققت بالتأكيد عروض غير مسبوقة، فإن جميعها تعمل تقريبا في ظل افتراض التقييد، بالنظر إلى سياق، يمكن إزالة كل كلمة بشكل فردي دون أي حساب من الخيارات الأخرى بالمعنى. لمعالجة هذا القيد وإسقاط هذا الافتراض، نقترح الفهم المعنى المستمر (CONSEC)، ونهج جديد في WSD: الاستفادة من إعادة تأكيد مؤخرا لهذه المهمة كمحالة استخراج النص، نحن نتكيافقها على صياغةنا وإدخال حلقة ردود الفعل الاستراتيجية التي تسمح بالغزانة للكلمة المستهدفة لا تتضمن فقط في سياقها ولكن أيضا على الحواس الصريحة المخصصة للكلمات القريبة. نقيم Consec وفحص كيف تقود مكوناتها إلى تجاوز جميع منافسيها وتحديد حالة من الفن الجديد على WSD الإنجليزية. نستكشف أيضا كيفية فرايس Consec في الإعداد المتبادل اللغوي، مع التركيز على 8 لغات مع درجات مختلفة من توفر الموارد، وإبلاغ تحسينات كبيرة على النظم السابقة. نطلق سردنا في https://github.com/sapienzanlp/consec.
في هذه الورقة، نقوم بتحليل المدى الذي يتطلع إليه المعنى السياقي، أي شعور بمعنى تم حسابه على أساس مدمج الكلمات السياقية، قابلة للتحويل عبر اللغات. في هذه الغاية، جمعنا معيارا موحدا عبر اللغات ل Disambiguation Sense.بعد ذلك نقترح استراتيجيتين بسيطة لنق ل المعرفة الخاصة بالمعنى بالمعنى بين اللغات واختبرها على النتائج المعدية-portform unolingual تمثيلات mernessnfrom البيانات الخاصة باللغة الحالية.
في تقدير الجودة (QE)، يمكن التنبؤ بجودة الترجمة بالرجوع إلى الجملة المصدر وإخراج الترجمة الآلية (MT) دون الوصول إلى الجملة المرجعية. ومع ذلك، هناك مفارقة في أن بناء مجموعة بيانات لإنشاء نموذج QE يتطلب عمالة إنسانية غير تافهة ووقت، وقد يتطلب جهدا إضاف يا مقارنة بتكلفة بناء كائن موازي. في هذه الدراسة، لمعالجة هذه المفارقة واستخدام تطبيقات QE المختلفة، حتى في لغات الموارد المنخفضة (LRLS)، نقترح طريقة لإنشاء مجموعة بيانات Pseudo-QE الخاصة دون استخدام العمل البشري. نقوم بإجراء تحليل مقارن على مجموعة بيانات الزائفة QE باستخدام نماذج لغة متعددة اللغات مسبقا. نظرا لأننا نولد مجموعة بيانات الزائفة، فإننا نقوم بإجراء تجارب باستخدام مختلف المترجمين الأجهزة الخارجية كمجموعات اختبار للتحقق من دقة النتائج بموضوعية. أيضا، تظهر النتائج التجريبية أن البارت المتعدد اللغات يوضح أفضل أداء، ونؤكد تطبيق QE في LRLS باستخدام طرق البناء Pseudo-QE DataSet.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا