ترغب بنشر مسار تعليمي؟ اضغط هنا

حقق توليد الحوار المدرج في المعرفة أدائا واعدا بمشاركة مصادر المعرفة الخارجية. عادة ما تؤدي الأساليب النموذجية نحو هذه المهمة مهام فرعية مستقلة نسبيا، أي اختيار المعرفة وتوليد الاستجابة على علم المعرفة. في هذه الورقة، من أجل تحسين تنوع كل من مجموعة م ختارة المعرفة وتوليد الاستجابة على علم المعرفة، نقترح نموذجا متعاونا للمتغير الكامن (COLV) لدمج هذين الجانبين في وقت واحد في المساحات الكامنة المنفصلة والتعاونية، وذلك لالتقاط الأصيت الارتباط بين اختيار المعرفة وتوليد الاستجابة. أثناء الجيل، يرسم نموذجنا المقترح مرشح المعرفة أولا من المساحة الكامنة المكيفة في سياق الحوار، ثم عينات استجابة من مساحة كامنة تعاونية أخرى مشروطة بكل من السياق والمعرفة المختارة. تظهر النتائج التجريبية على مجموعات بيانات الحوار المستخدمة على نطاق واسع على نطاق واسع أن طرازنا يفوق على الأساليب السابقة على كل من اختيار المعرفة وتوليد الاستجابة.
النماذج التركيبية المنظمة جذابة لأنها تتحلل صراحة المشاكل وتوفير مخرجات متوسطة تفسير تفسر الثقة في أن النموذج ليس مجرد إزالته على القطع الأثرية للبيانات. ومع ذلك، فإن تعلم هذه النماذج صعبة، ومع ذلك، نظرا لأن الإشراف على المهمة النهائية يوفر فقط إشارة غير مباشرة ضعيفة حول القيم التي يجب أن تتخذ القرارات الكامنة. غالبا ما يؤدي ذلك إلى فشل النموذج في تعلم كيفية تنفيذ المهام الوسيطة بشكل صحيح. في هذا العمل، نقدم طريقة للاستفادة من الأمثلة المقترنة التي توفر إشارات أقوى لتعلم القرارات الكامنة. عندما تتخلى أمثلة تدريبية ذات صلة بالحرارة الداخلية، نضيف هدف تدريب إضافي لتشجيع الاتساق بين قراراتهم الكامنة. لا يتطلب مثل هذا الهدف إشراف خارجي لقيم الإخراج الكامن، أو حتى المهمة النهائية، حتى الآن يوفر إشارة تدريب إضافية إلى ذلك من خلال أمثلة تدريب فردية أنفسهم. نحن نطبق طريقتنا لتحسين سؤال التركيبي الرد باستخدام شبكات الوحدات النمطية العصبية على Dropet DataSet. نستكشف ثلاث طرق للحصول على أسئلة مقترنة في قطرة: (أ) اكتشاف أمثلة مقترنة بشكل طبيعي داخل DataSet، (ب) بناء أمثلة مقترنة باستخدام القوالب، و (ج) إنشاء أمثلة مقنعة باستخدام نموذج جيل سؤال. إننا نوضح تجريبيا أن نهجنا المقترح يحسن التعميم داخل التوزيع ويؤدي إلى تصحيح تنبؤات القرارات الكامنة.
نقترح نموذجا عاما عميقا يقوم بإجراء تحليل الطباعة وإعادة بناء الخط عن طريق تعلم أنواع DESENTANGLED من كل من نمط الخط وشكل الأحرف. يتيح لنمنا نهجنا على زيادة عدد أنواع الأحرف التي يمكننا النموذج بشكل فعال مقارنة بالطرق السابقة. على وجه التحديد، نستنتج المتغيرات الكامنة المنفصلة التي تمثل الشخصية والخط عبر زوج من شبكات الاستدلال التي تأخذ كمجموعات مدخلات من الحروفية التي تشترك كلها إما كوعي حرف، أو تنتمي إلى الخط نفسه. يتيح هذا التصميم طرازنا التعميم مع الشخصيات التي لم يتم ملاحظتها أثناء وقت التدريب، وهي مهمة مهمة في ضوء Sparsity النسبية لمعظم الخطوط. لقد طرحنا أيضا خسارة جديدة، مكيفة من العمل السابق التي تقيس احتمال استخدام توزيع متكيف في مساحة متوقعة، مما يؤدي إلى المزيد من الصور الطبيعية دون الحاجة إلى تمييز. نحن نقيم في مهمة إعادة بناء الخط على مجموعات البيانات المختلفة التي تمثل أنواع الأحرف من العديد من اللغات، ومقارنة إيجابية لأنظمة نقل النمط الحديث وفقا لمقاييس كل من المقاييس التلقائية والتقييم يدويا.
لأكثر من ثلاثين عاما، قام الباحثون بتطوير وتحليل طرق لتحريض الأشجار الكامنة كهدوث لنهج التحليل النحوي غير المقترح. ومع ذلك، لا تزال الأنظمة الحديثة لا تؤدي بشكل جيد بما فيه الكفاية مقارنة بنظيراتهم الخاضعة للإشراف للحصول على أي استخدام عملي باسم التع ليق الهيكلية للنص. في هذا العمل، نقدم تقنية تستخدم إشراف بعيد في شكل قيود سبعة (أي عبارة قوية) لتحسين الأداء في تحليل الدوائر الانتخابية غير المزدوجة. باستخدام عدد قليل نسبيا من قيود الأمان، يمكننا تحسين الإخراج بشكل كبير من Diora، وهو نظام تحليل غير مناسب بالفعل منافسة. بالمقارنة مع التعليق التوضيحي في شجرة التحليل الكامل، يمكن الحصول على قيود Span مع الحد الأدنى من الجهد، كما هو الحال مع معجم مشتق من ويكيبيديا، للعثور على مباريات نصية دقيقة. تجاربنا تظهر قيود الأمان على أساس الكيانات على تحسين تحليل الدوائر الانتخابية على بنك WSJ Penn TreeBank الإنجليزية بأكثر من 5 F1. علاوة على ذلك، تمتد طريقنا إلى أي مجال يتم فيه تحقيق قيود سبعة بسهولة، وكدراسة حالة نوضح فعاليتها من خلال تحليل النص الطبي الطبيعي من مجموعة بيانات الحرفية.
غالبا ما يتم استخدام مخصصات Dirichlet الكامنة (LDA)، وهو نموذج موضوع يستخدم على نطاق واسع كأداة أساسية لتحليل النص في التطبيقات المختلفة. ومع ذلك، فإن عملية التدريب لنموذج LDA عادة ما تتطلب بيانات كوربوس نصية ضخمة. من ناحية، قد تعرض هذه البيانات الضخ مة معلومات خاصة في بيانات التدريب، وبالتالي تكبد شواغل الخصوصية الهامة. من ناحية أخرى، قد تتأثر كفاءة التدريب لنموذج LDA، لأن تدريب LDA يحتاج غالبا إلى التعامل مع بيانات كوربوس النص الضخمة. لمعالجة مشكلات الخصوصية في التدريب النموذجي LDA، جمعت بعض الأعمال الحديثة خوارزميات تدريب LDA التي تستند إلى أخذ عينات Gibbs المنهارة (CGS) مع خصوصية تفاضلية. ومع ذلك، فإن هذه الأعمال عادة ما يكون لها ميزانية خصوصية تراكمية عالية بسبب التكرارات الشاسعة في CGS. علاوة على ذلك، فإن هذه الأعمال لديها دائما كفاءة منخفضة بسبب التعامل مع بيانات Corpus النص الضخمة. لتحسين ضمان الخصوصية والكفاءة، نجمع بين طريقة فرعية مع CGS واقتراح خوارزمية تدريب LDA الجديدة مع خصوصية تفاضلية، فرعية LDA. نجد أن التعيين في CGS يحسن بشكل طبيعي الكفاءة أثناء تضخيم الخصوصية. نقترح أداة متري جديدة، وكفاءة - وظيفة الخصوصية، لتقييم تحسينات ضمان الخصوصية والكفاءة. استنادا إلى طريقة فرعية تقليدية، نقترح طريقة عمل قضائية على التكيف لتحسين فائدة النموذج التي تنتجها فرعية LDA عندما تكون النسبة الفرعية صغيرة. نحن نقدم تحليلا شاملا ل Sub-LDA، وتقييم نتائج التجربة تحسيناتها وضمان خصوصيتها.
نما خطاب الكراهية بشكل كبير على وسائل التواصل الاجتماعي، مما تسبب في عواقب وخيمة على ضحايا جميع التركيبة السكانية.على الرغم من الاهتمام بالكثير من الاهتمام لتوصيف واكتشاف الكلام التمييزي، ركز معظم الأعمال على خطاب الكراهية الصريح أو الصريح، وفشل في م عالجة شكل أكثر انتشارا يستند إلى لغة مشفرة أو غير مباشرة.لملء هذه الفجوة، يقدم هذا العمل تصنيفا مبررا من الناحية النظرية لخطاب الكراهية الضمنية والجورتين القياسي مع ملصقات جيدة المحبوب لكل رسالة وتضليلها.نقدم تحليلات منهجية لمجموعة البيانات الخاصة بنا باستخدام خطوط الأساس المعاصرة للكشف عن خطاب الكراهية الضمني، ونناقش الميزات الرئيسية التي تحدي النماذج الحالية.ستستمر هذه البيانات في العمل بمثابة معيار مفيد لفهم هذه المشكلة متعددة الأوجه.
نلاحظ مثالا على التحيز المستحث بين الجنسين في تطبيق في النهر، على الرغم من عدم وجود كلمات جنسانية صريحة في حالات الاختبار.نحن نقدم مجموعة اختبار، Sowinobias، لغرض قياس مثل هذه التحيز الجنساني الكامن في أنظمة حل السلاسة.نقيم أداء أساليب الدخل الحالية على مجموعة اختبار Sowinobias، خاصة في إشارة إلى تصميم الطريقة وتغيير خصائص مساحة التضمين.انظر https://github.com/hillary-dawkins/sowinobias.
تعلم تمثيل كامن جيد ضروري لنقل نمط النص، والذي يولد جملة جديدة عن طريق تغيير سمات جملة معينة مع الحفاظ على محتواها.تعتمد معظم الأعمال السابقة تمثيل تمثيل كامن Disentangled تعلم تحقيق نقل النمط.نقترح خوارزمية نقل نمط النص الجديد مع تمثيل كامن متشابكا، وإدخال مصنف نمط يمكن أن ينظم الهيكل الكامن ونقل النقل.علاوة على ذلك، تنطبق خوارزمية لنقل النمط على كل من سمة واحدة ونقل السمة المتعددة.تظهر النتائج التجريبية الواسعة أن طريقتنا تتفوق بشكل عام على النهج الحديثة.
يتم استخدام AutoNCoders Varitional (VAES) على نطاق واسع للنمذجة المتغيرة الكامنة للنص.نركز على الاختلافات التي تتعلم توزيعات مسبقة معبرة على المتغير الكامن.نجد أن استراتيجيات التدريب الحالية ليست فعالة لتعلم البثور الغابات، لذلك نقترح أن نقترح إضافة احتمال هامشي لسجل الأهمية كشرطة ثانية إلى هدف VAE القياسي للمساعدة عند تعلم المقيم السابق.يؤدي القيام بذلك إلى تحسين النتائج لجميع البثور التي قامت بتقييمها، بما في ذلك اختيار جديد للجملة VAES بناء على تطبيع التدفقات (NF).لم تعد Priors المعلمة مع NF مقيدة لعائلة توزيع محددة، مما يتيح طريقة أكثر مرونة لترميز توزيع البيانات.يظهر نموذجنا، الذي نسميه FOLPRIOR، تحسنا كبيرا في مهام نمذجة اللغة مقارنة مع خطوط الأساس القوية.نحن نوضح أن flowprior يتعلم التعبير قبل التحليل والعديد من أشكال التقييم التي تنطوي على جيل.
تطبق هذه الورقة نمذجة الموضوع لفهم موضوعات صحة الأم والاهتمامات والأسئلة المعبرين عنها في المجتمعات عبر الإنترنت على مواقع الشبكات الاجتماعية.ندرس تحليل Dirichlet الكامن (LDA) وطريقين حديثين: نموذج موضوع عصبي مع تقطير المعرفة (KD) ونموذج الموضوع المد مج (ETM) على نصوص صحة الأم يتم جمعها من Reddit.يتم تقييم النماذج على جودة موضوع الاستدلال والموضوع، باستخدام مقاييس التقييم التلقائي والتقييم البشري.نحن نحلل قطع اتصال بين المقاييس التلقائية والتقييمات البشرية.في حين أن LDA يؤدي الأفضل بشكل عام مع مقاييس التقييم التلقائي NPMI والتماسك، فإن نموذج الموضوع العصبي مع تقطير المعرفة مواتية من خلال تقييم الخبراء.ونحن أيضا إنشاء خبير جديد جزئيا مشروح موضوع صحة الأم
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا