ترغب بنشر مسار تعليمي؟ اضغط هنا

توليد تسخير الهيكل المعزز

Structure-Augmented Keyphrase Generation

195   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

تدرس هذه الورقة مهمة جيل تسييس الهدسة (KG) للسيناريوهات التي يلعب فيها الهيكل دورا مهما. على سبيل المثال، يتكون المنشور العلمي من عنوان قصير وجسم طويل، حيث يمكن استخدام العنوان لإلغاء التأكيد على التفاصيل غير المهمة في الجسم. وبالمثل، لوظائف وسائل التواصل الاجتماعي القصيرة (، تغريدات)، يمكن زيادة السياق النادر من الألقاب، على الرغم من أن غالبا ما تكون مفقودة. مساهمتنا هي توليد / زيادة الهيكل ثم حقن هذه المعلومات في الترميز، باستخدام أجهزة الرماية الحالية للمستندات الأخرى، تكمل عناوين مفقودة / غير كاملة. نقترحون نهج ترميز وثيقة المعزز في الهيكل الجديد تتكون من المراحل التالية: المرحلة الأولى، وهي توليد الهيكل، تمتد المستند المحدد بمخططات الرماية ذات الصلة ولكن غائبة، وتعزيز السياق المفقود. المرحلة الثانية، وهيكل الترميز، تقوم ببناء رسم بياني للمخططات الرائقية والوثيقة المعينة للحصول على تمثيل الهيكل المدرك للنص المعزز. تحقق نتائج التجريبية الخاصة بنا أن تكبير هيكلنا المقترح والترميز / فك التشفير المعزز يمكن أن يحسن كجم لكل من السيناريوهات، مما يتفوق على أحدث من الفن.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

يكتب مطورو البرمجيات الكثير من التعليمات البرمجية المصدر والوثائق أثناء تطوير البرمجيات. جوهريا، غالبا ما يتذكر المطورون أجزاء من شفرة المصدر أو ملخصات التعليمات البرمجية التي كتبوها في الماضي أثناء تنفيذ البرامج أو توثيقها. لتقليل رمز المطور أو سلوك الجيل الموجز، نقترح إطارا معدليا استرجاعا، ريدكودر، الذي يسترد الكود أو الملخصات ذات الصلة من قاعدة بيانات استرجاع ويوفر لهم كملحق لجيل التعليمات أو نماذج التلخيص. ريدكودر لديه زوجين من التفرد. أولا، إنه يمتد تقنية استرجاع حديثة كثيفة الاستخدام للبحث عن التعليمات البرمجية أو الملخصات ذات الصلة. ثانيا، يمكن أن تعمل مع قواعد بيانات استرجاع تشمل Unimodal (رمز فقط أو وصف اللغة الطبيعية) أو مثيلات BIMODAL (أزواج الكود الوصف). نقوم بإجراء تجارب وتحليل مكثف على مجموعة بيانات قياسية لتوليد التعليمات البرمجية والتلخيص في جاوة وبيرثون، والنتائج الواعدة تؤيد فعالية الإطار المعزز المقترح لاسترجاعنا.
تظل تحفيز الرسوم البيانية المعرفة عالية الجودة عالية الجودة من مجموعة معينة من الوثائق مشكلة صعبة في منظمة العفو الدولية. تتمثل إحدى الطرق في إحدى الطرق في هذه المشكلة من خلال التقدم في مهمة ذات صلة تعرف باسم ملء الفتحة. في هذه المهمة، نظرا لاستعلام كيان في شكل [كيان أو فتحة، حاول الأعمال الأخيرة في الحقل حل هذه المهمة في أزياء نهاية إلى نهاية باستخدام نماذج اللغة المستندة إلى الاسترجاع. في هذه الورقة، نقدم نهجا جديدا لملء فتحة الصفر التي تستوعب الصفر الذي يمتد استرجاع المقطع الكثيف مع السلبيات الصعبة وإجراءات تدريب قوية لنماذج التوليد المعزز للاسترجاع. تقارير النموذج لدينا تحسينات كبيرة على كل من مجموعات بيانات ملء فتحة T-REX و ZSRE، وتحسين كلا من توليد استرجاع المقطع ونظام الفتحة، والترتيب في وضع أعلى 1 في لوحة المتصدرين KILT. علاوة على ذلك، نوضح متانة نظامنا في إظهار قدراته على تكيف نطاقه على متن عبارة عن مجموعة جديدة من مجموعة البيانات المشبوكة لملء الفتحة، من خلال مزيج من التعلم الصفر / قليل من الرصاص. نحن نفرج عن شفرة المصدر والنماذج المدربة مسبقا.
نستكشف استخدام مصنفات التدريب الذاتي والقبول مع النماذج المدربة مسبقا لتوليد اللغة الطبيعية في إعدادات هيكل إلى نص باستخدام ثلاث مجموعات بيانات GEM (E2E و WebNLG-EN و Schema-furdided).مع Dataset الحوار الموجهة للمخطط، نقوم أيضا بتجربة بما في ذلك المن عطفات المتعددة من السياق في المدخلات.نجد أن التدريب الذاتي مع مطابقة إعادة الإعمار مع تصفية مصنف القبول يمكن أن يحسن صحة دلالية، على الرغم من أن المكاسب محدودة في إعداد البيانات الكاملة.مع تكييف السياق، نجد أن بما في ذلك المنعطفات المتعددة في السياق يشجع النموذج على المحاذاة مع اختيارات كلمة المستخدم وصياغة وكذلك لتوليد المزيد من ردود متسقة ذاتية.في الإصدارات المستقبلية من تحدي GEM، نشجع إدراج مسارات قليلة لتشجيع البحث على كفاءة البيانات.
في هذه الورقة، ندرس تلخيص الجملة المبادرة.هناك ميزان معلومات أساسية يمكن أن تؤثر على جودة تلخيص الأخبار، والتي هي الكلمات الرئيسية للموضوع والهيكل المعرفي لنص الأخبار.علاوة على ذلك، فإن تشفير المعرفة الموجودة لديها أداء ضعيف في هيكل المعرفة بالقضاء ا لسريع.بالنظر إلى هذه، نقترح KAS، ومعرفة رواية وتحويل الكلمات الرئيسية المعزز بإطار تلخيص الجملة المبادرة.يتم استخدام Tri-Encoders لإدماج سياقات النص الأصلي وهيكل المعرفة وموضوع الكلمات الرئيسية في وقت واحد، مع بنية معرفة خطية خاصة.التقييمات التلقائية والبشرية تثبت أن KAS تحقق أفضل العروض.
تقترح هذه الورقة هندسة جديدة، والاهتمام المتقاطع محول المعزز (CAAT)، للحصول على ترجمة متزامنة.يهدف الإطار إلى تحسين نماذج السياسات والترجمة بشكل مشترك.للتفكير بشكل فعال في جميع مسارات عمل الترجمة المتزامنة للقراءة والكتابة، نقوم بتكييف طراز التعرف عل ى الكلام التلقائي عبر الإنترنت (ASR)، RNN-T، ولكن قم بإزالة القيود الخطية القوية، وهو أمر بالغ الأهمية لمهمة الترجمة للنظر في إعادة ترتيب.لجعل أعمال CAAT، نقدم خسارة زمنية جديدة يمكن تحسين توقعها بواسطة خوارزمية متخلفة للأمام.نقوم بتنفيذ CAAT مع محول بينما يمكن أيضا تنفيذ الهندسة المعمارية العامة CAAT مع أطر ترميز التشفير الأخرى القائمة على الانتباه.تشير التجارب على مهام الترجمة الفورية للكلمة إلى النص (S2T) والنصوص (T2T) إلى أن CAAT تحقق مفاضلات أفضل لجودة الكمون بشكل كبير مقارنة بنهج الترجمة المتزامنة التي من بين الفن.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا