ترغب بنشر مسار تعليمي؟ اضغط هنا

توسيع اختصار منظم في السياق

Structured abbreviation expansion in context

235   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

عادة ما توجد اختصارات مخصصة في قنوات الاتصال غير الرسمية التي تفضل رسائل أقصر.نحن نعتبر مهمة عكس هذه الاختصارات في السياق لاستعادة الإصدارات الموسعة والموسعة من الرسائل المختصرة.ترتبط المشكلة، ولكنها متميزة من التصحيح الإملائي، باعتبارها اختصارات مخصصة متعمدة ويمكن أن تنطوي على اختلافات كبيرة من الكلمات الأصلية.كما يتم إنشاء اختصارات مخصصة بشكل منتجي على ذبابة، لذلك لا يمكن حلها فقط بواسطة بحث القاموس.نحن نولي مجموعة بيانات كبيرة ومفتوحة المصدر من اختصارات مخصصة.تستخدم هذه البيانات لدراسة استراتيجيات الاختصارات وتطوير خطين قويين للتوسع الاختصار.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

نظرا لتطوير التعلم العميق، حققت مهام معالجة اللغة الطبيعية تقدم كبيرا من خلال الاستفادة من تمثيل التشفير الثنائي الاتجاه من المحولات (بيرت). الهدف من استرجاع المعلومات هو البحث في أكثر النتائج ذات الصلة لاستعلام المستخدم من مجموعة كبيرة من المستندات. على الرغم من أن نماذج استرجاع مقرها بيرت أظهرت نتائج ممتازة في العديد من الدراسات، إلا أن هذه النماذج تعاني عادة من الحاجة إلى كميات كبيرة من الحسابات و / أو مسافات تخزين إضافية. في ضوء العيوب، يتم اقتراح نموذج استرجاع منظم في سيامي في بيرت (Bess) في هذه الورقة. لا يرث BESS فقط مزايا نماذج اللغة المدربة مسبقا، ولكن يمكن أيضا إنشاء معلومات إضافية لتعويض الاستعلام الأصلي تلقائيا. علاوة على ذلك، يتم تقديم استراتيجية تعليم التعزيز لجعل النموذج أكثر قوة. وفقا لذلك، نقيم BESS على ثلاثة كوربورا عامة المتاحة، وتتضح النتائج التجريبية كفاءة نموذج الاسترجاع المقترح.
العديد من النماذج العصبية الحديثة المصممة للمناسبة الروماتونية تؤدي بشكل سيء على الاستدلال النزولي.لمعالجة هذا القصور، قمنا بتطوير شبكة عصبية منظم بشجرة اليقظة.وهي تتألف من شبكة ذاكرة طويلة الأجل على المدى القصير (TREE-LSTM) مع اهتمام ناعم.تم تصميمه لنموذج معلومات شجرة التحليل النحوية من زوج الجملة من مهمة التفكير.يتم استخدام مجمع ذاتي اليقظة لمحاذاة تمثيلات الفرضية والفرضية.نقدم نموذجنا وتقييمه باستخدام DataSet EnteraTment Monoticity (MED).نعرض ونحاول شرح أن نموذجنا يفوق النماذج الحالية على ميد.
تعد التصنيفات موارد قيمة للعديد من التطبيقات، ولكن التغطية المحدودة بسبب عملية العمالة اليدوية باهظة الثمن تعوق إمكانية تطبيقها العام. محاولة Works السابقة لتوسيع تصنيفات الأدتصات الموجودة تلقائيا لتحسين تغطيتها من خلال تضمين التعلم بمشاركة مفهوم في الفضاء الإقليدية، في حين أن التصنيفات، التسلسل الهرمي بطبيعتها، محاذاة بشكل طبيعي مع الخصائص الهندسية للفضاء القطعي. في هذه الورقة، نقدم HyperExpan، خوارزمية توسيع تصنيفية تسعى إلى الحفاظ على هيكل التصنيف في مساحة أكثر تعبيرا معبرة وتتعلم أن تمثل المفاهيم وعلاقاتها مع شبكة عصبية خاطئة (HGNN). على وجه التحديد، ترفع Hyperexpan تضمينات الموضع لاستغلال هيكل التصنيفات الموجودة، وتميز معلومات ملف تعريف المفهوم لدعم الاستدلال على مفاهيم جديدة غير مرئية أثناء التدريب. تشير التجارب إلى أن Hyperexpan المقترح تفوق النماذج الأساسية بنماذج أساسية مع التعلم التمثيلي في مساحة ميزة Euclidean وتحقق أداء حديثة على معايير التوسع التصنيفية.
تتوفر كميات هائلة من البيانات في مجال الرعاية الصحية بتنسيق نص غير منظم، عادة باللغة المحلية للبلدان. تحتوي هذه المستندات على معلومات قيمة. الاستخدام الثانوي للسرد السريري واستخراج المعلومات من الحقائق والعلاقات الرئيسية منها حول تاريخ مرض المريض يمك ن أن تعزز الطب الوقائي وتحسين الرعاية الصحية. في هذه الورقة، نقترح طريقة هجينة للتحول التلقائي للنص السريري إلى تنسيق منظم. يتم التقسيم الوثائق تلقائيا في الأجزاء التالية: التشخيص، تاريخ المريض، حالة المريض، نتائج المختبرات. بالنسبة لقسم التشخيص "يتم تطبيق ترميز التعلم العميق النصي في رموز ICD-10 باستخدام MBG-Clinicalbert - نموذج Clinicalbert المصنف من الناعم للنص الطبي البلغاري. من قسم "تاريخ المريض"، نحدد أعراض المريض باستخدام نهج يستند إلى القواعد معززة مع بحث التشابه بناء على Adgeddings Word MBG-Clinicalbert. ونحن نحدد أيضا علاقات الأعراض مثل النفي. بالنسبة لوصف حالة المريض "" وصف، يتم استخدام التصنيف الثنائي لتحديد حالة كل عضو تشريحي. في هذه الورقة، نوضح طرق مختلفة لتكييف أدوات NLP للغة الإنجليزية واللغات الأخرى لغات موارد منخفضة مثل البلغارية.
تتيح العديد من أنظمة المراسلة الحديثة الاتصالات النصية سريعة ومتزامنة بين العديد من المستخدمين. تسلسل الرسائل الناتجة يخفي بنية أكثر تعقيدا في محادثات فرعية مستقلة متشابكة مع بعضها البعض. يشكل هذا تحديا لأي مهمة تهدف إلى فهم محتوى سجلات الدردشة أو جم ع المعلومات منها. تتمثل القدرة على فك هذه المحادثات بعد ذلك بمثابة نجاح العديد من المهام المصب مثل التلخيص والإجابة على الأسئلة. يتم استخدام المعلومات المهيكلة المصاحبة للنص مثل بدوره المستخدم، يذكر المستخدم، الطوابع الطوابع الطوابع الطوابع الطوابع الطوابع الطوابع الطوابع الطوابع الزمنية، كإجراء يقدم من قبل المشاركين أنفسهم الذين يحتاجون إلى اتباع المحادثة ويبضاهم مهمين للإجراءات. تعد DAG-LSTMS، وتعميم الأشجار LSTMS التي يمكن أن تتعامل مع تبعيات أنديكليكوس الموجهة، وسيلة طبيعية لإدماج هذه المعلومات وطبيعتها غير المتسلسلة. في هذه الورقة، نطبق DAG-LSTMS بمهمة محادثة محادثة المحادثة. نحن نقوم بإجراء تجاربنا على مجموعة بيانات أوبونتو IRC. نظرا لأن النموذج الجديد الذي نقترحه يحقق حالة الوضع الفني في مهمة استعادة العلاقات الردية وتنافسية على مقاييس المنظمات الأخرى.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا