ترغب بنشر مسار تعليمي؟ اضغط هنا

fuzzybio: اقتراح لتمثيل غامض للكيانات المتساقطة

FuzzyBIO: A Proposal for Fuzzy Representation of Discontinuous Entities

66   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تشكل الكيانات المتساقطة تحديا للتعرف على الكيان المسمى (NER). تحدث هذه الظواهر عادة في المجال الطبي الطبيعي. كحل، يتم استخدام توسعات مخطط التمثيل الحيوي الذي يمكنه التعامل مع أنواع هذه أنواع الكيان بشكل شائع (I.E. BIOHD). ومع ذلك، فإن أنواع العلامات الإضافية تجعل مهمة NER أكثر صعوبة في التعلم. في هذه الورقة نقترحنا بديلا؛ مخطط حيوي مستمر غامض (Fuzzybio). نحن نركز على مهمة استخراج استجابة المخدرات الضارة والتطبيع لمقارنة Fuzzybio إلى BIOHD. نجد أن Fuzzybio يحسن استدعاء NER لشخصين من ثلاثة مجموعات بيانات ونتائج أعلى نسبة أعلى من الكيانات المفككة والمركبة المحددة بشكل صحيح لجميع مجموعات البيانات. يؤدي استخدام FuzzyBio أيضا إلى تحسين الأداء المنتهي للكيانات المستمرة والمركبة في مجموعتين من مجموعات البيانات الثلاثة. نظرا لأن Fuzzybio يحسن الأداء لبعض مجموعات البيانات والتحويل من Biohd إلى Fuzzybio واضح، فإننا نوصي بالتحقيق الأكثر فعالية لأي مجموعة بيانات تحتوي على كيانات متقطعة.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

مجردة التعرف على الكيانات المسماة (NER) هي مهمة NLP الأساسية، والتي صاغها عادة كتصنيف على سلسلة من الرموز. تشكل اللغات الغنية المورفولوجية (MRLS) تحديا لهذه الصياغة الأساسية، حيث لا تتزامن حدود الكيانات المسماة بالضرورة مع حدود الرمز المميز، بل يحترم ون الحدود المورفولوجية. لمعالجة NER في MRLS، نحتاج إلى الإجابة عن أسئلتين أساسيتين، وهي، ما هي الوحدات الأساسية التي سيتم تسميةها، وكيف يمكن الكشف عن هذه الوحدات وتصنيفها في إعدادات واقعية (أي، حيث لا يتوفر مورفولوجيا ذهبية). نحن نحقق تجريبيا في هذه الأسئلة حول معيار NENT الجديد، مع الشروح النيرية المتوازية من المستوى المتوازي ومستوى مورفيم، والتي نطورنا للعبرية الحديثة، وهي لغة غنية بالغريات المورفولوجية. تظهر نتائجنا أن النمذجة الصرخة على حدود مورفولوجية تؤدي إلى تحسين الأداء النيري، وأن الهندسة المعمارية المختلطة الهجينة، التي يسبقها ner يسبقها التحلل المورفولوجي، تتفوق بشكل كبير على خط الأنابيب القياسي، حيث يسبق التحلل المورفولوجي بشكل صارم NER، وضع شريط أداء جديد لكليهما العبرية NER والعبرية المهام المورفولوجية.
الشبكات العصبية هي طريقة أحدثت لآلة التعلم للعديد من المشاكل في NLP.نجاحهم في الترجمة الآلية ومهام NLP الأخرى هي ظاهرة، لكن قابلية الترجمة الشفوية تحديا.نريد معرفة كيف تمثل الشبكات العصبية معنى.من أجل القيام بذلك، نقترح فحص توزيع المعنى في تمثيل المس احة المتجهة للكلمات في الشبكات العصبية المدربة لمهام NLP.علاوة على ذلك، نقترح النظر في نظريات المعنى المختلفة في فلسفة اللغة وإيجاد منهجية ستمكننا من توصيل هذه المجالات.
تحليل المدونات الصغيرة حيث ننشر ما نقوم بتمكيننا من أداء تطبيقات مختلفة مثل تحليل الاتجاه الاجتماعي وتوصية الكيان. لتتبع الاتجاهات الناشئة في مجموعة متنوعة من المجالات، نريد تصنيف المعلومات عن الكيانات الناشئة (على سبيل المثال، الصورة الرمزية 2) في م نشورات المدونات الصغيرة وفقا لأنواعها (على سبيل المثال، فيلم). وبالتالي، فإننا نقدم مهمة جديدة للكتابة كيان تقوم بتعيين نوعا غرامة على كل كيان ناشئ عند إجراء انفجار من المشاركات التي تحتوي على هذا الكيان لأول مرة في المدونات الصغيرة. التحدي هو إجراء الكتابة من منشورات المدونات الصغيرة الصاخبة دون الاعتماد على المعرفة السابقة للكيان المستهدف. لمعالجة هذه المهمة، نبني مجموعات بيانات Twitter واسعة النطاق للغة الإنجليزية واليابانية باستخدام الإشراف البعيد الحساسة للوقت. ثم نقترح نموذج الكتابة العصبي المعياري الذي لا ينفدي فقط الكيان وسياقاته ولكن أيضا معلومات المعتوه في مشاركات متعددة. لكتابة الكيانات الناشئة "الكتاني" تعني لغة البرمجة الناشئة ولعبة الألواح الكلاسيكية)، والسياقات الكلاسيكية صاخبة، ونطير محدد سياق يجد سياقات ذات صلة للكيان الهدف. تؤكد التجارب على مجموعات البيانات Twitter فعالية نموذج الكتابة لدينا ومنح السياق.
مجردة ⚠ تحتوي هذه الورقة على مطالبات ونواتج النماذج المسيئة في الطبيعة. عند التدريب على الزحف الكبيرة وغير المرفقة من الإنترنت، تلتقط نماذج اللغة وإعادة إنتاج جميع أنواع التحيزات غير المرغوب فيها التي يمكن العثور عليها في البيانات: أنها غالبا ما تولد لغة عنصرية أو جنسية أو عنيفة أو غير سامة. نظرا لأن النماذج الكبيرة تتطلب ملايين الأمثلة التدريبية لتحقيق أداء جيد، فمن الصعب منعها تماما من التعرض لمثل هذا المحتوى. في هذه الورقة، نوضح أولا في العثور على إيجاد مفاجئ: تعترف نماذج اللغة المحددة، إلى درجة كبيرة، تحيزاتهم غير المرغوب فيها وسمية المحتوى الذي ينتجونه. نشير إلى هذه القدرة كتشخيص الذاتي. بناء على هذا النتيجة، نقترح خوارزمية فك تشفير ذلك، بالنظر إلى وصف نصي فقط للسلوك غير المرغوب فيه، يقلل من احتمال إنتاج نموذج لغة ينتج نصا مشكلة. نشير إلى هذا النهج كدخل ذاتي. لا يعتمد الدخل الذاتي على قوائم Word يدويا يدويا، ولا يتطلب الأمر أي بيانات تدريبية أو تغييرات على معلمات النموذج. في حين أننا لا نقضاء بأي حال من الأحوال قضية نماذج اللغة التي تولد نص متحيز، فإننا نعتقد أن نهجنا خطوة مهمة في هذا الاتجاه
تهدف الملخصات الزمنية (TLS) إلى توليد قائمة موجزة من الأحداث الموضحة في مصادر مثل المقالات الإخبارية.ومع ذلك، فإن النظم الحالية لا توفر طريقة كافية للتكيف مع مجالات جديدة ولا تركز على جوانب الاهتمام لمستخدم معين.لذلك، نقترح طريقة للتعلم بشكل تفاعلي T LS abractive باستخدام التعزيز التعلم (RL).نحدد وظيفة المكافأة المركبة واستخدام RL Tune Tune Tune Tune Abstractive Multi-Document Summarisation (MDS)، والتي تتجنب الحاجة إلى التدريب باستخدام الملخصات المرجعية.سيتم تعلم أحد الوظائف الفرعية بشكل تفاعلي من ملاحظات المستخدم لضمان الاتساق بين مطالب المستخدمين والجدول الزمني الذي تم إنشاؤه.تساهم الوظائف الفرعية الأخرى في التماسك الموضعي والطلاقة اللغوية.نقول تجارب لتقييم ما إذا كان نهجنا قد يؤدي إلى توليد مواقع زمنية دقيقة ودقيقة مصممة لكل مستخدم.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا