ترغب بنشر مسار تعليمي؟ اضغط هنا

أدوار الأحرف النمطية المعروفة أيضا باسم Archetys أو Dramatis الشخصية - تلعب وظيفة مهمة في الروايات: إنها تسهل الاتصالات الفعالة مع حزم الخصائص والجمعيات الافتراضية وتخفيف فهم أدوار تلك الشخصيات في السرد الشامل. نقدم نهج تجميع K-Wi يعني غير المدعوم با لكامل للتعلم الأدوار النمطية التي تعطى معلومات مؤامرة هيكلة فقط. نوضح هذه التقنية في نظرية فلاديمير بروتب الهيكلية للفولكلتال الروسية (تم التقاطها في كوربوس فوندنر الموسعة، مع 46 حكايات)، والتي تبين أن نهجنا يمكن أن تحفز ستة من أصل سبعة من شخصيات الدكتور الدافعة مع تدابير F1 تصل إلى 0.70 (0.58 متوسط) مع فئة إضافية لشخصيات طفيفة. لقد استكشفنا مجموعات ميزة مختلفة وتغيرات طريقة تقييم الكتلة. تشتمل مجموعة الميزات الأفضل أداء على وظائف المؤامرة و Unigrams و TF-IDF الأوزان و Adgeddings على رؤوس سلسلة Aquerence. أدوار المذكورة في كثير من الأحيان (بطل أو شرير)، أو أنماط مؤامرة مميزة بوضوح (الأميرة) متباينة بقوة أكثر من أدوار أقل تواترا أو متميزة (المرسل، المساعد، المانح). يشير تحليل الأخطاء التفصيلي إلى أن جودة السلسلة الأساسية ووظائف المؤامرة تتكلم حاسمة لهذه المهمة. نحن نقدم جميع بياناتنا ورمزنا لاستنساخ.
في حين أن العديد من خطوط أنابيب NLP تفترض أن النصوص النظيفة النظيفة، فإن العديد من النصوص التي نواجهها في البرية، بما في ذلك الغالبية العظمى من المستندات القانونية، ليست نظيفة للغاية، حيث يجري العديد منهم وثائق منظم بصريا (VSDS) مثل PDF. تقوم الأدوات المعالجة التقليدية ل VSDS تركز بشكل أساسي على تجزئة الكلمات وتحليل التخطيط الخشن، في حين أن تحليل الهيكل المنطقي المحلقات الدقيقة (مثل تحديد حدود الفقرة وهرميها) من VSDS هي غير متكسدة. تحقيقا لهذه الغاية، اقترحنا صياغة المهمة كتنبؤ بملميات الانتقال "بين شظايا الرسائل النصية التي تعرض الشظايا إلى شجرة، وتطوير نظام لتعلم الماكينات المستندة إلى ميزة يمبرص إشارات مرئية ونصية ودلية. يتم تخصيص نظامنا بسهولة إلى أنواع مختلفة من VSDS وكانت خطوط الأساس بشكل كبير في تحديد الهياكل المختلفة في VSDS. على سبيل المثال، حصل نظامنا على درجة الكشف عن حدود الفقرة 0.953 أفضل بكثير من أداة PDF-To-to-todly ذات درجة كبيرة مع درجة F1 من 0.739.
في هذه الورقة، فإننا نطبق غير المدعومة غير المدعومة باعتبارها مهمة جديدة في تحريض الهيكل النحوي، والتي مفيدة لفهم الهياكل اللغوية للغات البشرية وكذلك معالجة لغات الموارد المنخفضة.نقترح اتباع نهج نقل المعرفة بأنه يسخر بشكل مسبق تسميات القطعة من نماذج التحليل غير المنصوص عليها في الحديث؛يتعلم الشبكة العصبية التسلسلية المتكررة (HRNN) من هذه الملصقات المستحثة من الفرق لتسليم ضجيج الاستدلال.تبين التجارب أن نهجنا يجسد إلى حد كبير الفجوة بين الكملات الخاضعة للإشراف وغير المدعوم.
تدرس هذه الورقة مهمة جيل تسييس الهدسة (KG) للسيناريوهات التي يلعب فيها الهيكل دورا مهما. على سبيل المثال، يتكون المنشور العلمي من عنوان قصير وجسم طويل، حيث يمكن استخدام العنوان لإلغاء التأكيد على التفاصيل غير المهمة في الجسم. وبالمثل، لوظائف وسائل ال تواصل الاجتماعي القصيرة (، تغريدات)، يمكن زيادة السياق النادر من الألقاب، على الرغم من أن غالبا ما تكون مفقودة. مساهمتنا هي توليد / زيادة الهيكل ثم حقن هذه المعلومات في الترميز، باستخدام أجهزة الرماية الحالية للمستندات الأخرى، تكمل عناوين مفقودة / غير كاملة. نقترحون نهج ترميز وثيقة المعزز في الهيكل الجديد تتكون من المراحل التالية: المرحلة الأولى، وهي توليد الهيكل، تمتد المستند المحدد بمخططات الرماية ذات الصلة ولكن غائبة، وتعزيز السياق المفقود. المرحلة الثانية، وهيكل الترميز، تقوم ببناء رسم بياني للمخططات الرائقية والوثيقة المعينة للحصول على تمثيل الهيكل المدرك للنص المعزز. تحقق نتائج التجريبية الخاصة بنا أن تكبير هيكلنا المقترح والترميز / فك التشفير المعزز يمكن أن يحسن كجم لكل من السيناريوهات، مما يتفوق على أحدث من الفن.
المحادثات غالبا ما تكون في المختبرات والشركات.ملخص أمر حيوي لفهم محتوى مناقشة للأشخاص الذين لم يحضروا المناقشة.إذا تم توضيح الملخص كهيكل وسيطة، فمن المفيد فهم أساسيات المناقشة على الفور.هدفنا في هذه الورقة هو التنبؤ بهيكل رابط بين العقد التي تتكون من الكلام في محادثة: تصنيف كل زوج عقدة إلى مرتبط "أو غير مرتبط." نهج واحد للتنبؤ به الهيكل هو استخدام نماذج تعلم الآلات.ومع ذلك، فإن النتيجة تميل إلى الإفراط في توليد روابط العقد.لحل هذه المشكلة، نقدم طريقة من خطوتين لمهمة التنبؤ الهيكل.نحن نستخدم نهج تعتمد على الجهاز كخطوة الأولى: مهمة تنبؤ الرابط.بعد ذلك، نطبق نهجا يستند إلى النتيجة كخطوة ثانية: مهمة اختيار الارتباط.تحسنت أساليبنا من خطوتين بشكل كبير الدقة مقارنة بطرق خطوة واحدة تستند إلى SVM و BERT.
تعتبر البيانات التي يتم إساءة فهمها عن قصد (أو التلاعب) باهتمام كبير للباحثين والحكومة والأمن والنظم المالية. وفقا لأدب الخداع، هناك إشارات موثوقة للكشف عن الخداع والاعتقاد بأن الكذابين يعطون العظة التي قد تشير إلى أن خداعها قريب عالمي. لذلك، بالنظر إلى أن الإجراءات الخادعة تتطلب التطور المعرفي المتقدمة التي لا تتطلب الصدق ببساطة، وكذلك الآليات المعرفية للناس توجيهات واعدة للكشف عن الخداع، في هذه الدكتوراه. البحث المستمر، نقترح فحص أنماط هيكل الخطاب في كورسيا الأخبار الخادعة متعددة اللغات باستخدام إطار نظرية الهيكل البوليكي. بالنظر إلى أن عملنا هو أول من استغلال استراتيجيات إعلانات متعددة اللغات للكشف عن الأخبار المزيفة، يفتقر مجتمع البحث حاليا إلى كورسا المزدحمة الخادعة متعددة اللغات. تبعا لذلك، تصف هذه الورقة التقدم الحالي في هذه الأطروحة، بما في ذلك (1) بناء أول لجنة خادعة متعددة اللغات، مشروح من قبل المتخصصين وفقا لإطار نظرية الهيكل البوليكي، و (2) إدخال اثنين من علاقات بلاطية جديدة : التدخل والحتمية، التي نفترض أن نكون ذات صلة بمهمة الكشف عن الأخبار المزيفة.
إن الانتعاش الدقيق لهيكل الوسائد الواسع من تحليل الاعتماد العالمي (UD) هو أساسي لمهام المصب مثل استخراج الأدوار الدلالية أو تمثيلات الأحداث. تقدم هذه الدراسة على المستحسن، تصنيف التسلسل الهرمي لعلاقات التبعية المستدلة الموجودة داخل تحليل UD. بمثابة د قة تصنيف Compchain بمثابة وكيل لقياس الانتعاش الدقيق لهيكل الوسائد المسند من الجمل مع التضمين. لقد قمنا بتحليل توزيع الملاحظة في Three Treebanks English English، EWT، اللثة والخطوط، وكشف أن هذه Treebanks متناثرة فيما يتعلق بالجمل مع هيكل الوسائد المسند يتضمن تضمين حجة مسند. قمنا بتقييم نماذج خط الأساس SPIPE (V1.2) Conll 2018 (V1.2) الأساس (COMPCHAIN) كمعقل كمبيوتر يعمل بنظام EWT و Gums and Lines UD Treebanks. تشير نتائجنا إلى أن هذه النماذج الأساسية الثلاثة تظهر الأداء الأكثر فقرا في الجمل مع هيكل الوسائد الواسع مع أكثر من مستوى من التضمين؛ استخدمنا Comprains لتوصيف الأخطاء التي تم إجراؤها بواسطة هذه المحللين وتقديم الأمثلة الحالية للضرائب الخاطئة التي تنتجها المحلل المحلل المحدد باستخدام المركبات. لقد قمنا أيضا بتحليل توزيع Comprains في 58 UDBanks UD UDBanks غير الإنجليزية ثم استخدمت Comprains لتقييم نموذج خط الأساس المشترك CONLL'18 لكل من هذه Treebanks. يوضح تحليلنا أن الأداء فيما يتعلق بتصنيف كمبيوتر يحترم ضعيفا ضعيفا فقط مع مقاييس التقييم الرسمية (LAS، MLAS و Blex). نحدد الثغرات في توزيع العقائد في العديد من UD Treebanks، وبالتالي توفير خارطة طريق لكيفية استكمال هذه Treebanks. نستنتج من خلال مناقشة كيفية توفر Comprains منظورا جديدا حول Sparsity بيانات التدريب لمحلل UD، وكذلك دقة تبييض UD الناتج.
آلة القراءة الفهم هي مهمة صعبة خاصة للاستعلام عن المستندات ذات السياقات العميقة والترابطية.أظهرت الطرق المستندة إلى المحولات عروضا متقدمة في هذه المهمة؛ومع ذلك، فإن معظمهم لا يزال يعاملون المستندات كمتسلسلة مسطحة من الرموز.يقترح هذا العمل طريقة جديدة قائمة على المحولات التي تقرأ مستند كشرائح شجرة.يحتوي على وحديتين لتحديد المزيد من مقاطع النص ذات الصلة وأفضل إجابة سبان على التوالي، والتي لا يتم تدريبها بشكل مشترك فقط ولكن أيضا تشاور بشكل مشترك في وقت الاستدلال.تظهر نتائج تقييمنا أن أسلوبنا المقترح تتفوق على العديد من النهج الأساسية التنافسية على مجموعة بيانات من مجالات متنوعة.
نقترح خلاصات الأخبار المفتوحة، ونحن مؤلف أخبار مفتوحة يدعم المهام المختلفة المتعلقة بنية الحاليات في الافتتاحيات الإخبارية، مع التركيز على اكتشاف المنظور التلقائي. أخبار الافتتاحية هي نوع من النص المقنع، حيث يكون بنية الحجة ضمنية عادة. ومع ذلك، فإن ا لحجج المقدمة في افتتاحية عادة مركز حول أطروحة موجزة مركزة، والتي نشير إليها كمنظورهم. تهدف Multioped إلى دعم دراسة مهام متعددة ذات صلة باكتشاف المنظور التلقائي، حيث من المتوقع أن ينتج النظام عبارة أطروحة واحدة الجملة التي تلخص الحجج المقدمة. نقول أن تحديد ومخلص من وجهات نظر اللغة الطبيعية من الافتتاحيات هو خطوة حاسمة نحو دراسة هيكل الجدال الضمني في الأخبار الافتتاحية. نناقش أولا التحديات وتحديد عدد قليل من المهام المفاهيمية تجاه هدفنا. لإظهار فائدة المهام متعددة المنصوص عليها، ندرس مشكلة تلخيص المنظور في بيئة تعليمية متعددة المهام، كدراسة حالة. نظرا لأنه، مع المهام المستحثة كامرأة مساعدة، يمكننا تحسين جودة ملخص المنظور الذي تم إنشاؤه. نأمل أن يكون multiopeded موردا مفيدا للدراسات المستقبلية عن الجدال في مجال تحرير الأخبار.
تلقى تلخيص محادثة الجماع اهتماما كبيرا مؤخرا.ومع ذلك، غالبا ما تعاني هذه الملخصات التي تم إنشاؤها من محتوى غير كاف أو زائد أو غير صحيح، ويعزى ذلك إلى حد كبير إلى الخصائص غير المنظمة والمعقدة للتفاعلات البشرية البشرية.تحقيقا لهذه الغاية، نقترح نموذجا صراحة الهياكل الغنية في محادثات للحصول على تلخيص محادثة أكثر دقة ودقيقة، من خلال إدراج علاقات الخطاب الأولى بين الكلام والأربع من الليئات (WHO - ما ") في كلام من خلال الرسوم البيانية المنظمة لتشفير المحادثات بشكل أفضلثم تصميم وحدة فك ترميز متعددة الحبيبات لتوليد ملخصات من خلال الجمع بين جميع مستويات المعلومات.تشير التجارب إلى أن نماذجنا المقترحة تفوقت على الطرق الحديثة والتعميم بشكل جيد في المجالات الأخرى من حيث التقييمات التلقائية والأحكام البشرية.لقد أصدرنا علنا رمزنا في https://github.com/gt-salt/sulture-aware-bart.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا