ترغب بنشر مسار تعليمي؟ اضغط هنا

محلل بيولوجيا معقولة

A Biologically Plausible Parser

207   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

الملخص، نحن نصف محلل اللغة الإنجليزية التي تقوم بها الخلايا العصبية المعقولة بيولوجيا ونقل الأخطات، وتنفيذها من خلال حساب التفاضل والتكامل الجمعية، إطارا حسابيا اقترح مؤخرا للوظيفة المعرفية.نوضح أن هذا الجهاز قادر على تحليل الجمل غير المعقولة بشكل معقول .1 بينما تنطيب تجاربنا جمل بسيطة إلى اللغة الإنجليزية، تشير نتائجنا إلى أن المحلل يمكن تمديده بعد ما نفذناه، إلى عدة اتجاهات تشمل الكثير من اللغة.على سبيل المثال، نقدم نسخة روسية بسيطة من المحلل، ومناقشة كيفية التعامل مع العودية والضمان والبوليزمي.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

منطق episodic: نموذج منطقي غير مشدود '' (el-elf) هو تمثيل دلالي يلتقط بنية حجة المسنون وكذلك جوانب أكثر تحديا للغة داخل الشكليات المنطقية الباردة.نقدم النهج المستفاد الأول لأول مرة لتحليل الجمل إلى ULFS، باستخدام مجموعة متزايدة من الأمثلة المشروحة.تو فر النتائج خط أساس قوي للتحسين في المستقبل.تتعلم طريقتنا نموذج تسلسل إلى تسلسل للتنبؤ بتسلسل إجراء الانتقال داخل نظام انتقال ذاكرة التخزين المؤقت المعدلة.نقوم بتقييم فعالية القيود القائمة على القواعد، معجم من كلمة إلى رمز، وميزات ولاية نظام الانتقال في هذه المهمة.نظامنا متاح في https://github.com/genelkim/ulf-transition-parser.ونحن نقدم أيضا بيانات Oulf Oullf الرسمية الأولى في HTTPS://www.cs.rochester.edu/u/gkim21/ulf/resources/.
تركز معالجة اللغة الطبيعية الحالية بقوة على زيادة الدقة.يأتي التقدم بتكلفة نماذج فائقة الثقيلة مع مئات الملايين أو حتى مليارات المعلمات.ومع ذلك، فإن المهام النحوية البسيطة مثل وضع العلامات على جزء من الكلام (POS) أو تحليل التبعية أو التعرف على الكيان المسمى (NER) لا تحتاج إلى أكبر النماذج لتحقيق نتائج مقبولة.تمشيا مع هذا الافتراض، نحاول تقليل حجم النموذج الذي ينفذ بشكل مشترك جميع المهام الثلاثة.نقدم Comboner: أداة خفيفة الوزن، أوامر ذات حجم أصغر من المحولات الحديثة.يعتمد على مدمج الكلمات الفرعية المدربة مسبقا بنية الشبكة العصبية المتكررة.يعمل COMBONER على بيانات اللغة البولندية.يحتوي النموذج على مخرجات لوضع العلامات على نقاط البيع والتحليل التبعية و NER.تحتوي ورقةنا على بعض الأفكار من ضبط النموذج الدقيق والتقارير عن نتائجها الإجمالية.
المهمة الأساسية في استخراج المعلومات هي اكتشاف الحدث الذي يحدد مشغلات الحدث في الجمل التي يتم تصنيفها عادة في أنواع الأحداث. في هذه الدراسة، يعتبر الحدث وحدة لقياس التنوع والتشابه في مقالات إخبارية في إطار نظام أخبار التوصية. فشلت نهج اكتشاف الحدث ال مستندة إلى التصنيف الحالي في التعامل مع مجموعة متنوعة من الأحداث المعبر عنها في مواقف العالم الحقيقي. للتغلب على ذلك، نهدف إلى أداء تصنيف حفلات الأحداث واستكشاف ما إذا كان نموذج محول قادر على تصنيف معلومات جديدة في فصول بروز أقل وأكثر عمومية. بعد مقارنة خط الأساس من آلة ناقلات الدعم (SVM) وعروض التصنيف القائم على المحولات لدينا في العديد من تنسيقات سبين الأحداث، فقد تم تصميمنا حدث متعدد الكلام يمتد كشروط سليمة. يتم تغذية تلك الموجودة في تصنيفنا البرز الذي يتم ضبطه بشكل جيد على Adgeddings الهولندية المدربة مسبقا. علاوة على ذلك، نحن نتفوق على خط أنابيب لنهج حقل عشوائي مشروط (CRF) في اكتشاف كلمة الزناد في الأحداث والتصنيف المستند إلى BERT. إلى حد ما من معرفتنا، نقدم أول نهج استخراج الأحداث الذي يجمع بين محلل نصلي مقصورات مقره الخبراء مع مصنف تحويل محول للهولندية.
نحن تصف تقديم DCU-EPFL إلى مهمة مشتركة IWPT 2021: من النص الخام لتعزيز التبعيات العالمية. تتضمن المهمة تحليل الرسوم البيانية UD المحسنة، والتي تعد امتدادا لأشجار التبعية الأساسية المصممة لتكون أكثر تسهيلا نحو تمثيل الهيكل الدلالي. يتم التقييم على 29 شجرة Treebanks في 17 لغة ومطلوبة للمشاركين لتحليل البيانات من كل لغة تبدأ من السلاسل الخام. يستخدم نهجنا خط أنابيب Stanza لمعالجة الملفات النصية، XLM-Roberta للحصول على تمثيلات رمزية في السياق، ونموذج تسجيل الحافة والعلامات للتنبؤ الرسم البياني المحسن. أخيرا، ندير نص PostProcessing لضمان جميع مخرجاتنا هي الرسوم البيانية UD المحسنة سارية المفعول. يضع نظامنا السادس من أصل 9 مشاركا مع درجة مرفق محسنة خشنة (ELAS) 83.57. نقوم بإجراء تجارب إضافية بعد الموعد النهائي والتي تشمل استخدام Trankit لمعالجة ما قبل المعالجة، XLM-Roberta Large Protectenation، وتعلم المتعدد التعلم بين محلل التبعية الأساسية والمعززة. جميع هذه التعديلات تحسن النتيجة الأولية ونظامنا النهائي لديه إيلاس خشن 88.04.
في حين أن العديد من خطوط أنابيب NLP تفترض أن النصوص النظيفة النظيفة، فإن العديد من النصوص التي نواجهها في البرية، بما في ذلك الغالبية العظمى من المستندات القانونية، ليست نظيفة للغاية، حيث يجري العديد منهم وثائق منظم بصريا (VSDS) مثل PDF. تقوم الأدوات المعالجة التقليدية ل VSDS تركز بشكل أساسي على تجزئة الكلمات وتحليل التخطيط الخشن، في حين أن تحليل الهيكل المنطقي المحلقات الدقيقة (مثل تحديد حدود الفقرة وهرميها) من VSDS هي غير متكسدة. تحقيقا لهذه الغاية، اقترحنا صياغة المهمة كتنبؤ بملميات الانتقال "بين شظايا الرسائل النصية التي تعرض الشظايا إلى شجرة، وتطوير نظام لتعلم الماكينات المستندة إلى ميزة يمبرص إشارات مرئية ونصية ودلية. يتم تخصيص نظامنا بسهولة إلى أنواع مختلفة من VSDS وكانت خطوط الأساس بشكل كبير في تحديد الهياكل المختلفة في VSDS. على سبيل المثال، حصل نظامنا على درجة الكشف عن حدود الفقرة 0.953 أفضل بكثير من أداة PDF-To-to-todly ذات درجة كبيرة مع درجة F1 من 0.739.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا