ترغب بنشر مسار تعليمي؟ اضغط هنا

تمثيل وثيقة مناقصة التعلم مع شبكات انتباه الرسوم البيانية

Contrastive Document Representation Learning with Graph Attention Networks

162   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

أظهرت التقدم المحرز الأخير في نماذج اللغة المستندة إلى المحولات الاحترام نجاحا كبيرا في تعلم التمثيل السياقي للنص.ومع ذلك، نظرا لتعقيد الاهتمام من الدرجة الثانية، يمكن لمعظم نماذج المحولات مسبقا التعامل مع النص القصير نسبيا.لا يزال يمثل تحديا عندما يتعلق الأمر بنمذة مستندات طويلة جدا.في هذا العمل، نقترح استخدام شبكة انتباه الرسوم البيانية أعلى نموذج المحولات مسبقا متوفرة لتعلم تضمين الوثائق.تتيح لنا شبكة انتباه الرسم البياني هذه الاستفادة من الهيكل الدلالي الرفيع المستوى للوثيقة.بالإضافة إلى ذلك، استنادا إلى نموذج وثيقة الرسم البياني لدينا، نقوم بتصميم استراتيجية تعليمية بسيطة بسيطة للتعبير عن نماذجنا بمقدار كبير من الكائنات الكبيرة.تجريبيا، نوضح فعالية نهجنا في تصنيف الوثائق ومهام استرجاع المستندات.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

تركز أنظمة الكشف عن الساركاز الموجودة على استغلال العلامات اللغوية أو السياق أو البثور على مستوى المستخدم.ومع ذلك، تشير الدراسات الاجتماعية إلى أن العلاقة بين المؤلف والجمهور يمكن أن تكون ذات صلة بنفس القدر لاستخدام السخرية وتفسيرها.في هذا العمل، نقت رح إطارا بالاستفادة المشتركة (1) سياق مستخدم من تغريداتهم التاريخية مع (2) المعلومات الاجتماعية من الحي المحادثة للمستخدم في رسم بياني تفاعل، إلى السياق تفسير المنشور.نحن نستخدم شبكات انتباه الرسوم البيانية (GAT) عبر المستخدمين والتويت في مؤشر ترابط محادثة، جنبا إلى جنب مع تمثيلات سجل المستخدم الكثيفة.بصرف النظر عن تحقيق نتائج حديثة على مجموعة البيانات التي تم نشرها مؤخرا من مستخدمي Twitter الذي تم نشره مؤخرا مع تغريدات تسمية 30 ألفا، قم بإضافة تغريدات 10M Unabeled كسياق، تشير نتائجنا إلى أن النموذج يساهم في تفسير النوايا الساخرة للمؤلف أكثر منالتنبؤ بتصور السخرية من قبل الآخرين.
تم تجاهل المعلومات النحوية والدلية الخارجية إلى حد كبير من قبل نماذج حل النواة العصبية الحالية.في هذه الورقة، نقدم نموذجا مقرا له من الرسوم البيانية غير متجانسة لإدماج الهياكل النحوية والدلالية للجمل.يحتوي الرسم البياني المقترح على رسم بياني فرعي سنو ي حيث يتم توصيل الرموز الرائعة بناء على شجرة التبعية، ورسم إلكتروني فرعي دلالي يحتوي على حجج ويستند كمستلزمات دورا دالايا كحواف.من خلال تطبيق شبكة انتباه الرسوم البيانية، يمكننا الحصول على تمثيل كلمة معدنية من الناحية النحوية وغير المعزز، والتي يمكن دمجها باستخدام طبقة تكامل اليقظة وآلية Gating.تجارب في OnTonotes 5.0 معيار المعيار إظهار فعالية نموذجنا المقترح.
تحتاج العديد من مهام NLP إلى إصدارات فعالة من الوثائق النصية.Arora et al.، 2017 توضح أن الشيخوخة المرجحة المرجحة بسيطة لنماذج Word بشكل متكرر في كثير من الأحيان نماذج. SCDV (MEKALA et al.، 2017) يمتد هذا من الجمل إلى DoCu-Mets عن طريق توظيف مجموعة نا عمة ومتخرفة على مجلات الكلمات المحسوبة مسبقا. كيف على الإطلاق، كلتا التقنيتين تتجاهل الشخصية السياقية Polysemyand للكلمات. في هذا القبيل، نتعامل مع هذه المشكلة عن طريق اقتراح CTXDV + Bert (CTXD)، وهو تمثيل بسيط وفعال للأمم المتحدة الذي يشتمل على مزين بالقدمين النصي (ديفلين وآخرون)، 2019 . WEShow أن تضميننا تضميننا أوريجيز نال SCDV، برت قبل قطار، وعدة أخرى على العديد من مجموعات بيانات التصنيف. Wealso إظهار تضميننا فعالا - نيس على مهام أخرى، مثل مفهوم مباراة جي ومشاكل تشابه. في الإضافة، نعرض أن Bertv + Bertperformsfine-Tune-Tune Bert و AP-PROACHES المختلفة AP-PROACHES في السيناريوهات ذات البيانات المحدودة أمثلة لقطات.
تم استكشاف Adment Graph Graph (KIGS) بشكل مكثف في السنوات الأخيرة بسبب وعدهم بمجموعة واسعة من التطبيقات. ومع ذلك، تركز الدراسات الحالية على تحسين أداء النموذج النهائي دون الاعتراف بالتكلفة الحسابية للنهج المقترحة، من حيث التنفيذ والتأثير البيئي. تقتر ح هذه الورقة إطار KGE بسيط ولكنه فعال يمكن أن يقلل من وقت التدريب وبصمة الكربون عن طريق أوامر من الأقواس مقارنة مع النهج الحديثة، مع إنتاج أداء تنافسي. نسلط الضوء على ثلاثة ابتكارات تقنية: التعلم الدفاعي الكامل عبر المصفوفات العلائقية، وتحليل العوامة المتعامدة المغلقة للملابس، والتدريب غير السلبي للأخذ العينات. بالإضافة إلى ذلك، كأول طريقة KGE الأولى التي تخزنها تضمين كيانها أيضا معلومات العلاقة الكاملة، ترمز النماذج المدربة لدينا إلى دلالات غنية ويمكن تفسيرها للغاية. تجارب شاملة ودراسات الاجتثاثات التي تنطوي على 13 خطوط بيانات قوية ومجموعات بيانات قياسية تحقق من فعالية وكفاءة خوارزميةنا.
تصف هذه الورقة نظامنا للحصول على مهمة Semeval-2021 4: قراءة الفهم من معنى مجردة.لإنجاز هذه المهمة، نستخدم الهندسة المعمارية لشبكة إيلاءات الرسوم البيانية المعززة للمعرفة مع استراتيجية تحويل الفضاء الدلالي الردد.إنه يرفع المعرفة غير المتجانسة لتعلم ال أدلة الكافية، ويسعى للحصول على مساحة دلالية فعالة من المفاهيم المجردة لتحسين قدرة الجهاز بشكل أفضل على فهم المعنى التجريدي للغة الطبيعية.تظهر النتائج التجريبية أن نظامنا يحقق أداء قويا في هذه المهمة من حيث كلا من غير المحتملة وغير المعقدة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا