تقدم هذه الورقة وصف نظام فريق المحور، الذي يفسر العمل ذي الصلة والنتائج التجريبية لمشاركة فريقنا في مهمة Semeval 2021: الغموض المتعدد اللغات والتبلغة في السياق (MCL-WIC). بيانات هذه المهمة المشتركة هي أساسا بعض الزوجات الزوجية عبر اللغة أو متعددة اللغات. اللغات المشمولة في Corpus تشمل اللغة الإنجليزية والصينية والفرنسية والروسية والعربية. الهدف المهمة هو الحكم على ما إذا كانت الكلمات نفسها في أزواج هذه الجملة لها نفس المعنى في الجملة. يمكن اعتبار ذلك مهمة التصنيف الثنائي لأزواج الجملة. ما نحتاج إليه هو استخدام طريقتنا لتحديد بدقة قدر الإمكان معنى الكلمات في زوج الجملة هي نفسها أو مختلفة. يتكون النموذج المستخدم من قبل فريقنا بشكل أساسي من خوارزميات روبرتا و TF-IDF. مؤشر تقييم النتائج لتقديم المهمة هو درجة F1. شاركنا فقط في مهمة اللغة الإنجليزية. وكانت النتيجة النهائية لنتائج التنبؤ بمجموعة الاختبار المقدمة من فريقنا 84.60.
This paper introduces the system description of the hub team, which explains the related work and experimental results of our team's participation in SemEval 2021 Task 2: Multilingual and Cross-lingual Word-in-Context Disambiguation (MCL-WiC). The data of this shared task is mainly some cross-language or multi-language sentence pair corpus. The languages covered in the corpus include English, Chinese, French, Russian, and Arabic. The task goal is to judge whether the same words in these sentence pairs have the same meaning in the sentence. This can be seen as a task of binary classification of sentence pairs. What we need to do is to use our method to determine as accurately as possible the meaning of the words in a sentence pair are the same or different. The model used by our team is mainly composed of RoBERTa and Tf-Idf algorithms. The result evaluation index of task submission is the F1 score. We only participated in the English language task. The final score of the test set prediction results submitted by our team was 84.60.
المراجع المستخدمة
https://aclanthology.org/
تقدم هذه المقالة وصف نظام فريق المحور، الذي يفسر العمل ذي الصلة والنتائج التجريبية لمشاركة فريقنا في مهمة Semeval 2021 5: الكشف السام يمتد.تأتي بيانات هذه المهمة المشتركة من بعض المشاركات على الإنترنت.الهدف المهمة هو تحديد المحتوى السام الوارد في هذه
تقدم هذه الورقة وصف نظام فريق المحور، الذي يفسر العمل ذي الصلة والنتائج التجريبية لمشاركة فريقنا في مهمة Semeval 2021 7: Hahackathon: الكشف عن الفكاهة والجريمة. لقد نجحنا بنجاح في نتائج التنبؤ بنتائج الاختبار للمجموعة الفرعية في المهمة. الهدف من المه
في هذه الورقة، نقترح طريقة لاستدادتها معلومات جملة المعلومات ومعلومات تردد الكلمات الخاصة بمهمة التعقيد ذات التعقيد 1-LCP (LCP). في نظامنا، تأتي معلومات الجملة من نموذج روبرتا، وتأتي معلومات تردد الكلمات من خوارزمية TF-IDF. استخدم Black Block كطبقة م
في هذه الورقة، نصف أساليبنا المقترحة لمهمة الغموض المتعددة اللغات في السياق في Semeval-2021.في هذه المهمة، يجب أن تحدد الأنظمة ما إذا كانت الكلمة التي تحدث في جملتين مختلفة يتم استخدامها بنفس المعنى أم لا.اقترحنا عدة طرق باستخدام نموذج بيرت المدرب مس
تحديد ما إذا كانت الكلمة تحمل نفس المعنى أو المعنى المختلف في سياقتين هي منطقة بحثية مهمة في معالجة اللغة الطبيعية تلعب دورا مهما في العديد من التطبيقات مثل الإجابة على الأسئلة، وملخص الوثائق، واسترجاع المعلومات واستخراج المعلومات واستخراج المعلومات.