يمكن أن تساعد ردود الفعل التصحيحية التلقائية التلقائي على تعلم اللغة من خلفيات مختلفة اكتساب لغة جديدة بشكل أفضل.تقدم هذه الورقة مجموعة بيانات متعلمة باللغة الإنجليزية التي يرافقها أخطاء المتعلمين معلومات حول مصادر الأخطاء المحتملة.تحتوي مجموعة البيانات هذه على خطأ مشروح يدويا أسباب أخطاء كتابة المتعلم.هذه تسبب ربط أخطاء المتعلم بالهياكل من لغاتهم الأولى، عندما تتباعد القواعد باللغة الإنجليزية وفي اللغة الأولى.ستمكن هذه البيانات البيانات الجديدة من استحواذ الباحثين الاستحواذين باللغة الثانية على تحليل كمية كبيرة من أخطاء المتعلمين المرتبطة بنقل اللغة من اللغة الأولى من المتعلمين.يمكن أيضا تطبيق DataSet أيضا في تخصيص أنظمة تصحيح الأخطاء النحوية وفقا للغة الأولى للمتعلمين وفي تقديم ملاحظات مستنيرة عن طريق الخطأ.
Automatic personalized corrective feedback can help language learners from different backgrounds better acquire a new language. This paper introduces a learner English dataset in which learner errors are accompanied by information about possible error sources. This dataset contains manually annotated error causes for learner writing errors. These causes tie learner mistakes to structures from their first languages, when the rules in English and in the first language diverge. This new dataset will enable second language acquisition researchers to computationally analyze a large quantity of learner errors that are related to language transfer from the learners' first language. The dataset can also be applied in personalizing grammatical error correction systems according to the learners' first language and in providing feedback that is informed by the cause of an error.
References used
https://aclanthology.org/
Reviewing contracts is a time-consuming procedure that incurs large expenses to companies and social inequality to those who cannot afford it. In this work, we propose document-level natural language inference (NLI) for contracts'', a novel, real-wor
The paper introduces a new resource, CoDeRooMor, for studying the morphology of modern Swedish word formation. The approximately 16.000 lexical items in the resource have been manually segmented into word-formation morphemes, and labeled for their ca
How difficult is it for English-as-a-second language (ESL) learners to read noisy English texts? Do ESL learners need lexical normalization to read noisy English texts? These questions may also affect community formation on social networking sites wh
A text retrieval system for language learning returns reading materials at the appropriate difficulty level for the user. The system typically maintains a learner model on the user's vocabulary knowledge, and identifies texts that best fit the model.
We introduce a high-quality and large-scale Vietnamese-English parallel dataset of 3.02M sentence pairs, which is 2.9M pairs larger than the benchmark Vietnamese-English machine translation corpus IWSLT15. We conduct experiments comparing strong neur