ترغب بنشر مسار تعليمي؟ اضغط هنا

التصنيف التلقائي للسمات في عبارات الأسماء الألمانية

Automatic Classification of Attributes in German Adjective-Noun Phrases

208   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

قدم الصفات مثل الثقيلة (كما هو الحال في الأمطار الغزيرة) والرياح (كما في يوم عاصف) القيم المحتملة لشدة السمات ومناخها على التوالي. لا تتحقق السمات نفسها بشكل علني وهناها هذه المنطقة الضالة. في حين يمكن استنتاج هذه السمات بسهولة من قبل البشر، فإن تصنيفهم التلقائي يشكل مهمة صعبة للنماذج الحسابية. نقدم المساهمات التالية: (1) نكتسب رؤى جديدة في مهمة اختيار السمات للألمانية. وبشكل أكثر تحديدا، نطور نماذج حسابية لهذه المهمة التي يمكن أن تعميم البيانات غير المرئية. علاوة على ذلك، نوضح أن دقة التصنيف تعتمد، في جملة أمور، على درجة Polysemy في Lexemes المعنية، على إمكانات تعميم البيانات التدريبية وعلى درجة الشفافية الدلالية في أزواج صفة الأسماء المعنية. (2) نحن نقدم الموارد الأولى للتجارب الحسابية واللغوية مع أزواج الأسماء المصرفية الألمانية التي يمكن استخدامها في اختيار السمات والمهام ذات الصلة. من أجل حماية آثار الحفظ غير المرغوب فيه، نقدم طريقة تكبير البيانات التلقائي استنادا إلى مورد معجمي يمكن أن يزيد من حجم بيانات التدريب إلى حد كبير.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

إن التنبؤ بصعوبة المفردات الخاصة بالمجال هي مهمة مهمة نحو فهم أفضل للنطاق، وتعزيز التواصل بين الأشخاص الخبراء والخبراء.نقوم بالتحقيق في مركبات الأسماء المغلقة الألمانية والتركيز على تفاعل الميزات المعجمية القائمة على المركب (مثل التردد والإنتاجية) وا لميزات المستندة إلى المصطلحات (المتناقضة لغة خاصة بالمجال واللغة العامة) عبر تمثيلات الكلمات والصفوفات المصنفة.تكمل تجارب التنبؤ لدينا رؤى من التصنيف باستخدام (أ) ميزات مصممة يدويا لتوصيف الوالدين وتشكيل المركب و (ب) مجمعات Word Adgentdings.نجد أنه بالنسبة للتمييز الثنائي الواسع في التردد المركزي باللغة العامة "VS. الصعب الصعب" كافية، ولكن بالنسبة للتمييز الأكثر غرامة من أربعة فئات من الدرجة الأولى، فمن الأهمية بمكان تضمين ميزات الحد من الناحية المتعاوية والمركب والميزات المكونة.
تقنيات التحييد، على سبيل المثالإن رفض المسؤولية والحرمان من الضحية، يتم استخدامه في سرد شكوك تغير المناخ لتبرير عدم العمل أو تعزيز وجهة نظر بديلة.نسترحب أولا بالعلوم الاجتماعية لإدخال المشكلة في مجتمع NLP، وتقديم حبيبتي مخطط الترميز، ثم جمع التعليقات التوضيحية اليدوية من التقنيات المحايدة في النص فيما يتعلق بتغير المناخ، وتجربة النماذج القائمة على برت تحت إشراف وشبه الإشرافوبعد
نقدم مجموعة بيانات تتكون من مقالات إخبارية ألمانية تسمى التحيز السياسي على مقياس من خمس نقاط في طريقة نصف إشراف.في حين أن العمل المبكر على الكشف عن الأخبار Hyperpartisan يستخدم التصنيف الثنائي (أي Hyperpartisan أو لا) وبيانات اللغة الإنجليزية، فإننا نقول للحصول على تصنيف أكثر غرامة، تغطي الطيف السياسي الكامل (أي بعيدا، اليسار، اليسار، المركز، اليمين، بعيدا- رايت) ولمنس البحث إلى البيانات الألمانية.فهم التحيز السياسي يساعد بدقة في اكتشاف خطاب الكراهية وإساءة الاستخدام عبر الإنترنت.نقوم بتجربة أساليب تصنيف مختلفة للكشف عن التحيز السياسي.تؤكد أدائها المنخفض نسبيا (ماكرو-F1 من 43 من أفضل إعداد لدينا، مقارنة ب Macro-F1 من 79 بمهمة التصنيف الثنائية) إلى الحاجة إلى بيانات أكثر (متوازنة) المشروح بطريقة محترمة بشكل جيد.
تقتصر مقاييس تقييم سؤال الفيديو (VIDQA) على إجابة كلمة واحدة أو اختيار عبارة من مجموعة ثابتة من العبارات.هذه المقاييس تحد من سيناريو تطبيق نماذج VIDQA.في هذا العمل، نستفيد الأدوار الدلالية المستمدة من أوصاف الفيديو لإخفاء عبارات معينة، لإدخال VIDQAP الذي يطرح VIDQA كامرأة تعبئة العبارة.لتمكين تقييم الجمل الإجابة، نحسب التحسين النسبي للإجابة المتوقعة مقارنة بسلسلة فارغة.لتقليل تأثير التحيز اللغوي في مجموعات بيانات VIDQA، نسترجع شريط فيديو له إجابة مختلفة لنفس السؤال.لتسهيل البحث، نقوم ببناء AttactNet-SRL-QA و Charads-SRL-QA ومقاييسهم عن طريق تمديد ثلاث نماذج لغة رؤية.نحن نقوم بإجراء تحليل مكثف ودراسات ablative لتوجيه العمل في المستقبل.الرمز والبيانات عامة.
نماذج اللغة المحددة مسبقا (PTLMS) تسفر عن الأداء الحديث في العديد من مهام معالجة اللغة الطبيعية، بما في ذلك بناء الجملة والدلالات والعموم.في هذه الورقة، نركز على التعرف على أي مدى تلتقط PTLMS السمات الدلالية وقيمها، على سبيل المثال، الارتباط بين القي مة الغنية والعالية الصافية.نستخدم ptlms للتنبؤ الرموز الملثمين باستخدام أنماط وقوائم العناصر من Wikidata من أجل التحقق من مدى احتمال ترميز PTLMS السمات الدلالية جنبا إلى جنب مع قيمها.مثل هذه الاستنتاجات القائمة على دلالات بديهية للبشر كجزء من فهم لغتنا.نظرا لأن PTLMS يتم تدريبها على كمية كبيرة من بيانات ويكيبيديا، فسوف نفترض أنها يمكن أن تولد تنبؤات مماثلة، ومع ذلك تكشف نتائجنا أن PTLMS لا تزال أسوأ بكثير من البشر في هذه المهمة.نوضح الأدلة والتحليل في شرح كيفية استغلال منهجيةنا لدمج سياق ودواني أفضل في PTLMS باستخدام قواعد المعرفة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا