ترغب بنشر مسار تعليمي؟ اضغط هنا

أدوار الأحرف النمطية المعروفة أيضا باسم Archetys أو Dramatis الشخصية - تلعب وظيفة مهمة في الروايات: إنها تسهل الاتصالات الفعالة مع حزم الخصائص والجمعيات الافتراضية وتخفيف فهم أدوار تلك الشخصيات في السرد الشامل. نقدم نهج تجميع K-Wi يعني غير المدعوم با لكامل للتعلم الأدوار النمطية التي تعطى معلومات مؤامرة هيكلة فقط. نوضح هذه التقنية في نظرية فلاديمير بروتب الهيكلية للفولكلتال الروسية (تم التقاطها في كوربوس فوندنر الموسعة، مع 46 حكايات)، والتي تبين أن نهجنا يمكن أن تحفز ستة من أصل سبعة من شخصيات الدكتور الدافعة مع تدابير F1 تصل إلى 0.70 (0.58 متوسط) مع فئة إضافية لشخصيات طفيفة. لقد استكشفنا مجموعات ميزة مختلفة وتغيرات طريقة تقييم الكتلة. تشتمل مجموعة الميزات الأفضل أداء على وظائف المؤامرة و Unigrams و TF-IDF الأوزان و Adgeddings على رؤوس سلسلة Aquerence. أدوار المذكورة في كثير من الأحيان (بطل أو شرير)، أو أنماط مؤامرة مميزة بوضوح (الأميرة) متباينة بقوة أكثر من أدوار أقل تواترا أو متميزة (المرسل، المساعد، المانح). يشير تحليل الأخطاء التفصيلي إلى أن جودة السلسلة الأساسية ووظائف المؤامرة تتكلم حاسمة لهذه المهمة. نحن نقدم جميع بياناتنا ورمزنا لاستنساخ.
تعتمد أبحاث الكشف عن الشخصية القائمة على النصوص الموجودة في الغالب على النهج التي يحركها البيانات لالتقاط إشارات شخصية ضمنيا في الوظائف عبر الإنترنت، تفتقر إلى إرشادات المعرفة النفسية. يلعب الاستبيان النفسي، الذي يحتوي على سلسلة من الأسئلة المخصصة ال مرتبطة بشدة إلى سمات الشخصية، دورا حاسما في تقييم شخصية التقرير الذاتي. نقول أن المشاركات التي أنشأها المستخدم تحتوي على محتويات مهمة يمكن أن تساعد في الإجابة على الأسئلة في استبيان، مما أدى إلى تقييم لشخصيته من خلال ربط النصوص والاستبيان. تحقيقا لهذه الغاية، نقترح نموذجا جديدا باسم شبكة الاستبيان النفسي المحسن (PQ-NET) لتوجيه اكتشاف الشخصية عن طريق تتبع المعلومات الهامة في النصوص مع استبيان. على وجه التحديد، يحتوي PQ-NET على جاريان: دفق سياق لتشفير كل جزء من النص في تمثيل نص سياقي، وتيار استبيان لالتقاط المعلومات ذات الصلة في تمثيل النص السياقي لإنشاء تمثيلات إجابات محتملة للاستبيان. يتم استخدام تمثيل الإجابات المحتملة لتعزيز تمثيل النص السياقي وفائدة التنبؤ بالشخصية. تظهر النتائج التجريبية على مجموعة بيانات اثنين من تفوق PQ-NET في التقاط إشارات مفيدة من المشاركات للكشف عن الشخصية.
في حين أن مجال نقل النمط (ST) ينمو بسرعة، فقد أعاقه بعدم وجود ممارسات موحدة للتقييم التلقائي.في هذه الورقة، نقوم بتقييم المقاييس التلقائية الرائدة على المهمة التي تم بحثها عن نقل أسلوب الأشكال.على عكس التقييمات السابقة، التي تركز فقط على اللغة الإنجل يزية فقط، فإننا نوسع تركيزنا على البرتغالية البرازيلية والفرنسية والإيطالية، مما يجعل هذا العمل أول تقييم متعدد اللغات للمقاييس في القديس.نحن نخوض أفضل الممارسات للتقييم التلقائي في نقل النمط (الشكلية) وتحديد العديد من النماذج التي ترتبط بشكل جيد مع الأحكام البشرية وهي قوية عبر اللغات.نأمل أن يساعد هذا العمل في تسريع التطوير في القديس، حيث يكون التقييم البشري غالبا ما يكون تحديا لجمعه.
تقدم هذه الورقة مجموعة بيانات مسؤولة متعددة الخيارات متعددة المدى (QA)، بناء على نصوص كتاب الخيال الكامل الطول. يتم صياغة الأسئلة كأسئلة متعددة الخيارات ذات 10 اتجاهين، حيث تتمثل المهمة في تحديد اسم الحرف الصحيح مع إعطاء وصف حرفي أو نائبا للعكس. يتم صياغة كل وصف حرف في النص الطبيعي وغالبا ما يحتوي على معلومات من عدة أقسام في جميع أنحاء الكتاب. نحن نقدم 20،000 سؤال تم إنشاؤه من 10،000 أوصاف مشروح يدويا من الشخصيات من 177 كتابا تحتوي على 152،917 كلمة في المتوسط. نحن نتطلع إلى الخطاب الحالي فيما يتعلق بتحيز DataSet والتسرب بواسطة إجراء مجهول بسيط، مما يتيح بدوره إمكانيات التحقيق المثيرة للاهتمام. أخيرا، نظهر أن خوارزميات الأساس المناسبة تؤدي بشكل سيء للغاية في هذه المهمة، مع حجم الكتاب نفسه مما يجعله غير تافهة لمحاولة حل ضمان الجودة القائم على المحولات. هذا يترك مجالا واسعا للتحسين في المستقبل، وتلميحات في الحاجة إلى نوع مختلف تماما من الحل.
يتم تعريف Sememes على أنها الوحدات الذرية لوصف المعنى الدلالي للمفاهيم.نظرا لصعوبة التعليق يدويا في التسجيل يدويا واستنادا إلى التعليق بين الخبراء، فقد تم اقتراح مهمة تنبؤات النظرة المعجمية.ومع ذلك، فإن الأساليب السابقة تعتمد بشدة على Word أو Artters dings، وتجاهل المعلومات المحبوسة الدقيقة.في هذه الورقة، نقترح طريقة رواية ما قبل التدريب والتي تم تصميمها لتحسين دمج المعلومات الداخلية للشخصية الصينية.يتم استخدام تمثيل الأحرف الصيني المحسنة Glyph (دول مجلس التعاون الخليجي) لمساعدة تنبؤة النظر.نقوم بتجربة وتقييم النموذج لدينا على HOWNET، وهو قاعدة المعرفة الشمالية الشهيرة.تظهر النتائج التجريبية أن أسلوبنا تتفوق على نماذج المعلومات غير الخارجية الموجودة.
عند قراءة قطعة أدبية، غالبا ما يصنع القراء استنتاجات حول أدوار الشخصيات والشخصيات والعلاقات والمهالية والإجراءات، وما إلى ذلك بينما يمكن للبشر السحب بسهولة على تجاربهم السابقة لبناء مثل هذه النظرة التي تركز على الطابع للسرد، فهم الشخصياتيمكن أن تكون الروايات مهمة صعبة للأجهزة.لتشجيع البحث في هذا المجال من فهم السرد المركزي بالشخصية، نقدم LCSU - مجموعة بيانات جديدة من القطع الأدبية وملخصاتها مقترن بأوصاف الشخصيات التي تظهر فيها.نقدم أيضا مهام جديدة على LCCU: تحديد الأحرف وتوليد وصف الشخصيات.تجاربنا مع العديد من النماذج اللغوية المدربة مسبقا مكيفة لهذه المهام توضح أن هناك حاجة إلى نماذج أفضل من الفهم السردي.
يمكن أن نطاقات اللغة العصبية التي تدركها القبض على العلاقة بين الكلمات من خلال استغلال معلومات مستوى الطابع وهي فعالة بشكل خاص للغات مع التشكل الغني.ومع ذلك، عادة ما تكون هذه النماذج متحيزة باتجاه المعلومات من أشكال السطح.لتخفيف هذه المشكلة، نقترح طر يقة بسيطة وفعالة لتحسين نموذج اللغة العصبي على الحرف من خلال إجبار ترميز الأحرف لإنتاج شرائح قائمة على الكلمات تحت بنية Skip-Gram في خطوة الاحماء دون بيانات تدريب إضافية.نظرا لإيبربريكيا أن نموذج اللغة العصبي الإدراك على الطابع الناتج يحقق تحسينات واضحة لدرجات الحيرة على لغات متنوعة من النطبية، والتي تحتوي على العديد من الكلمات منخفضة التردد أو غير المرئي.
تكنولوجيات اللغة، مثل الترجمة الآلية (MT)، ولكن أيضا تطبيق الذكاء الاصطناعي بشكل عام ووفرة من أدوات القطط والمنصات لها تأثير متزايد على سوق الترجمة. تصبح التفاعل البشري مع هذه التقنيات أكثر أهمية على الإطلاق لأنها تؤثر على سير عمل المترجمين وبيئات ال عمل وملامح الوظائف. علاوة على ذلك، له آثار على تدريب المترجم. تتمثل إحدى المهام التي ظهرت مع تكنولوجيات اللغة بعد التحرير (PE) حيث يقوم المترجم البشري بتصحيح الناتج المترجم المترجم وفقا للمبادئ التوجيهية المعينة ومعايير الجودة (O'Brien، 2011: 197-198). تستخدم بالفعل على نطاق واسع في العديد من إعدادات الترجمة التقليدية، وقد دخل استخدامها في عمليات أكثر إبداعية مثل الترجمة الأدبية والترجمة السمعية البصرية (AVT) أيضا. مع دمج أنظمة MT، يجب أن تصبح عملية الترجمة أكثر كفاءة. تتأثر كل من العمليات الاقتصادية والمعرفية ومعها، حيث تتغير الكفاءات اللازمة لجميع أصحاب المصلحة. في هذه الورقة، نريد وصف ملفات تعريف الوظائف المحتملة المختلفة والكفاءات المعنية عند ترجمات ما بعد التحرير.
للحفاظ على جودة الكلام لنظام الحوار إدراك شخصي، يجب تصفية الكلام غير اللائقة للشخصية بدقة. عند تقييم مدى ملاءمة عدد كبير من الكلام التعسفي الذي سيتم تسجيله في قاعدة بيانات الكلام لنظام حوار استرجاع يستند إلى استرجاع، لا يمكن استخدام مقاييس التقييم ال تي تتطلب مرجعا (أو الكلام "الصحيح) لكل هدف تقييم. بالإضافة إلى ذلك، يتطلب تصفية الكلام العملي القدرة على اختيار الكلام بناء على شدة خصائص الشخص. لذلك، نقوم بتطوير مقاييس يمكن استخدامها لالتقاط شدة خصائص الشخص ويمكن حسابها دون مراجع مصممة على أهداف التقييم. تحقيقا لهذه الغاية، نستكشف المقاييس الموجودة واقتراح مقاييس جديدة: احتمال مكبر الصوت شخصيا وشخصية الشخص. تظهر النتائج التجريبية أن مقاييسنا المقترحة تظهر ضعيفة على الارتباطات المعتدلة بين عشرات خصائص الشخصية القائمة على الأحكام الإنسانية وتتفوق مقاييس أخرى بشكل عام في تصفية الكلام غير اللائق لشخصية معينة.
تستكشف هذه الورقة استمرار القصة التي يحركها الشخصية، حيث تظهر القصة من خلال سرد الشخصيات الأول والثاني بالإضافة إلى الحوار - - - - تتطلب النماذج لتحديد اللغة التي تتفق مع شخصيات الشخصية وعلاقاتها مع أحرف أخرى التالية وتقدم القصة. نحن نفترض أن نموذج م تعدد المهام الذي يتدرب على حوار الأحرف بالإضافة إلى معلومات علاقة الشخصية يحسن استمرار القصة المستندة إلى المحولات. تحقيقا لهذه الغاية، نقوم بتوسيع دور محصنة الدوران والتنين الحاسم (Rameshkumar و Bailey، 2020) --- تتكون من نصوص الحوار من الأشخاص الذين يخبرون بشكل تعاظم قصة أثناء لعب لعبة الأبراج المحصنة والتنينات --- مع العلاقات المستخرجة تلقائيا بين كل زوج من الشخصيات التفاعل وكذلك شخصياتهم. تقدم سلسلة من الوضوح دليلا على فرضيتنا، حيث أظهر أن نموذجنا متعدد المهام لدينا باستخدام علاقات الأحرف يحسن دقة استمرار القصة على خطوط خطوط خطوط خطوط خطوط طويلة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا