نقدم المهمة الجديدة لحل النزاعات اسم النطاق (DNDR)، والذي يتنبأ بنتيجة عملية لحل النزاعات حول استحقاق قانوني لاسم النطاق.يحدد TheICann UDRP عملية تحكيم إلزامية للنزاع بين مالك العلامة التجارية وسجل اسم النطاق المتعلق باسم مجال كبير المستوى (GTLD) (GTLD) (واحد ينتهي في .com، .org، .NET، إلخ).يؤدي طبيعة المشكلة إلى مجموعة بيانات متحفة للغاية، والتي تنبع من القدرة على تسجيل اسم مجال مع سهولة شديدة، ومصروفات قليلة للغاية، ولا حاجة لإثبات استحقاقها.في هذه الورقة، نحن تصف ثيتاسك ومجموعة البيانات المرتبطة بها.ونحن نقدم أيضا نتائج مرجعية بناء على مجموعة من MOD-ELS، والتي تظهر أن خطوط الأساس البسيطة بشكل عام صعبة التغلب عليها بسبب توزيع البيانات المنحرفة، ولكن في حالة المستفتى المحددة التي قدمت استجابة، برت ضبط صقليقدم النموذج تحسينات كبيرة على نموذج فئة الأغلبية
We introduce the new task of domain name dispute resolution (DNDR), that predicts the outcome of a process for resolving disputes about legal entitlement to a domain name. TheICANN UDRP establishes a mandatory arbitration process for a dispute between a trade-mark owner and a domain name registrant pertaining to a generic Top-Level Domain (gTLD) name (one ending in .COM, .ORG, .NET, etc). The nature of the problem leads to a very skewed data set, which stems from being able to register a domain name with extreme ease, very little expense, and no need to prove an entitlement to it. In this paper, we describe thetask and associated data set. We also present benchmarking results based on a range of mod-els, which show that simple baselines are in general difficult to beat due to the skewed data distribution, but in the specific case of the respondent having submitted a response, a fine-tuned BERT model offers considerable improvements over a majority-class model
المراجع المستخدمة
https://aclanthology.org/
البيانات القوية وبأسعار معقولة في المجال هي أصل مرغوب فيه عند نقل المحللين الدلاليين المدربين إلى مجالات جديدة.نظرا لأن الأساليب السابقة لإنشاء مثل هذه البيانات نصف تلقائيا لا يمكن أن تتعامل مع تعقيد استفسارات SQL الواقعية، نقترح بناء استفسارات SQL ع
ريبية المهمة، و الجديدة و التي تهدف إلى إيجاد حل للمنازعة الضريبية – التي تنشأ بين المكلف و الإدارة الضريبية في معرض تطبيق أحكام التشريع الضريبي – قبل وصولها إلى القضاء بهدف تخفيف العبء عن القضاء من خلال حلها من قبل اللجان الإدارية التي تم تشكيلها له
تقدم هذه الورقة مجموعة بيانات مسؤولة متعددة الخيارات متعددة المدى (QA)، بناء على نصوص كتاب الخيال الكامل الطول. يتم صياغة الأسئلة كأسئلة متعددة الخيارات ذات 10 اتجاهين، حيث تتمثل المهمة في تحديد اسم الحرف الصحيح مع إعطاء وصف حرفي أو نائبا للعكس. يتم
في هذه الورقة، نقدم مصنف صاعقة صعبة عصرية عربية (MSA) الحديثة، والذي يتوقع صعوبة الجمل المتعلمين في اللغة باستخدام مستويات الكفاءة CEFR أو التصنيف الثنائي بصورة بسيطة أو معقدة.نحن نقارن استخدام تضمين الجملة من أنواع مختلفة (fastlext، mbert، xlm-r وال
عادة ما تعتبر التشفير العصبي للأسماء الطبية الحيوية قوية إذا تم استغلال التمثيلات بشكل فعال لمختلف مهام NLP المصب المختلفة. لتحقيق ذلك، تحتاج المشفر إلى نموذج الدلالات الطبية الحيوية خاصة بالمجال مع تنافس التطبيق العالمي للتطبيق العالمي للإشراف على ا