ترغب بنشر مسار تعليمي؟ اضغط هنا

غالبا ما تعوق التنبؤ القائم على التعلم في مجال خصائص المواد بسبب عدم وجود مجموعات بيانات تدريبية كبيرة بما فيه الكفاية. غالبية بيانات القياس هذه مضمنة في الأدبيات العلمية والقدرة على استخراج هذه البيانات تلقائيا ضرورية لدعم تطوير أساليب التنبؤ بالخصا ئص الموثوقة. في هذا العمل، نصف منهجية لتطوير إطار استخراج الممتلكات التلقائي باستخدام ذوبان المواد كخاصية الهدف. نخلق مجموعة بيانات تدريبية وتقييم تحتوي على علامات للكيانات المتعلقة بالذوبان باستخدام مزيج من التعبيرات العادية والعلامة اليدوية. ثم قارنا خمسة نماذج التعرف على الكيان الاستفادة من كلا من المعماريين على مستوى الرمز المميز ومضمون مهمة تصنيف أسماء المذابة وقيم الذوبان وحدات الذوبان. بالإضافة إلى ذلك، نستكشف نهج محاولات رواية يرفع أدوات استخراج الاسم الكيميائي والكمية الآلي لتوليد مجموعات بيانات كبيرة لا تعتمد على العلامات اليدوية المكثفة. أخيرا، نقوم بإجراء تحليل لتحديد أسباب أخطاء التصنيف.
مربع الحوار هو كتلة لبناء أساسية لتفاعلات اللغة البشرية البشرية.يحتوي على كلمات متعددة الأحزاب المستخدمة لنقل المعلومات من طرف إلى آخر بطريقة ديناميكية ومتطورة.إن القدرة على مقارنة الحوار هي مفيدة في العديد من حالات استخدام العالم الحقيقي، مثل تحليلا ت المحادثة لمكالمات مركز الاتصال وتصميم الوكيل الظاهري.نقترح تكيف جديد من أداة تحرير المسافة إلى سيناريو تشابه الحوار.يأخذ نهجنا في الاعتبار مختلف جوانب المحادثة مثل دلالات الكلام وتدفق المحادثة والمشاركين.نقيم هذا النهج الجديد ومقارنة مع تدابير التشابه الوثيقة الحالية على مجموعة من مجموعات البيانات الخاصة بالجملي.توضح النتائج أن أسلوبنا تتفوق على النهج الأخرى في اتخاذ تدفق حوار الاستسلام، ومن الأفضل أن يتماشى مع التصور البشري لمشاكل المحادثة.
كمية المنتج (PQ) هي تقنية واستخدامها على نطاق واسع لاسترجاع الإعلانات المخصصة. تقترح الدراسات الحديثة PQ خاضعة للإشراف، حيث يمكن تدريب نماذج التضمين والتجميل بشكل مشترك مع التعلم الخاضع للإشراف. ومع ذلك، هناك نقص في الصياغة المناسبة لهدف التدريب المش ترك؛ وبالتالي، فإن التحسينات حول الأساس غير المشرف السابق محدودة في الواقع. في هذا العمل، نقترح قياس كمية المنتج الموجهة نحو المطابقة (MOPQ)، حيث يتم صياغة فقدان MultioLli Outlastive MultioLli مهدفا. مع تقليل MCL، نحن قادرون على زيادة احتمال مطابقة الاستعلام ومفتاح الحقيقة الأرضية، مما يساهم في دقة الاسترجاع المثلى. بالنظر إلى أن الحساب الدقيق ل MCL مستعصرا بسبب طلب عينات متباينة واسعة، فإننا نقترح مزيد من أخذ العينات عبر الأجهزة المختلفة (DCS)، والذي يزيد بشكل كبير من العينات المقنعة لتقريب دقيق من MCL. نقوم بإجراء دراسات تجريبية واسعة النطاق على أربعة مجموعات بيانات حقيقية، والتي تحقق نتائجها من فعالية MOPQ. الرمز متاح في https://github.com/microsoft /mopq.
تحيز وسائل الإعلام هي ظاهرة سائدة موجودة في معظم أشكال الوسائط المطبوعة والإلكترونية مثل المقالات الإخبارية والمدونات أو التغريدات، وما إلى ذلك. نظرا لأن وسائل الإعلام تلعب دورا محوريا في تشكيل الرأي العام تجاه الأحداث السياسية، غالبا ما تستخدم كل من الأحزاب السياسية والإعلام في كثير من الأحيان هذه المصادركمنافذ لنشر التحيزات الخاصة بهم للجمهور.كانت هناك بعض الأبحاث حول الكشف عن التحيز السياسي في مقالات إخبارية.ومع ذلك، لا يحاول أي منه تحليل طبيعة التحيز أو تحديد حجم التحيز في نص معين.تقدم هذه الورقة تحيزا سياسيا مشروحا كوربوس بيز.POBICO-21، المشروح باستخدام مخطط مصمم خصيصا مع 10 ملصقات لالتقاط تقنيات مختلفة تستخدم لإنشاء تحيز سياسي في الأخبار.نخلق تصنيف هذه التقنيات بناء على مساهمتها في التحيز.بعد التحقق من صحة الترتيب، نقترح طرق لاستخدامها لتحديد حجم التحيز في المقالات الإخبارية السياسية.
غالبا ما يتم إجراء اعتدال المحتوى عن طريق التعاون بين البشر ونماذج التعلم الآلي. ومع ذلك، ليس من المفهوم جيدا كيفية تصميم العملية التعاونية لزيادة أداء نظام النموذج النموذجي المدمج. يقدم هذا العمل دراسة صارمة لهذه المشكلة، مع التركيز على نهج يتضمن عد م اليقين النموذجي في العملية التعاونية. أولا، نقدم مقاييس مبدئية لوصف أداء النظام التعاوني في ظل قيود القدرات على المشرف البشري، وقم بترتيب مدى كفاءة النظام المشترك يستخدم القرارات الإنسانية. باستخدام هذه المقاييس، نقوم بإجراء دراسة مرجعية كبيرة تقيم أداء نماذج عدم اليقين الحديثة في إطار استراتيجيات مراجعة تعاونية مختلفة. نجد أن الاستراتيجية القائمة على عدم اليقين تتفوق باستمرار على الاستراتيجية المستخدمة على نطاق واسع بناء على درجات السمية، وعلاوة على ذلك أن اختيار استراتيجية المراجعة يغير بشكل كبير أداء النظام الشامل. توضح نتائجنا أهمية مقاييس صارمة لفهم وتطوير أنظمة نماذج مشرف فعالة للاعتدال المحتوى، وكذلك فائدة تقدير عدم اليقين في هذا المجال.
تتناول الورقة الحالية تحليلا حسابيا للترجمات المهنية والطلاب الترجمات الإنجليزية إلى الألمانية التي تنتمي إلى سجلات مختلفة. بناء على النهج النظري للمعلومات، نقوم باختبار مطابقة الترجمة إلى المصدر واللغة المستهدفة من حيث حيرة نموذج اللغة العصبية على ج زء من تسلسل الكلام (نقاط البيع). ينصب تركيزنا الأساسي على تنويع التسجيل مقابل التقارب، ينعكس في استخدام الإنشاءات التي تنظر إلى درجة أعلى مقابل درجة حيرة أقل. تظهر نتائجنا أنه ضد توقعاتنا، تثير الترجمات المهنية درجات حيرة أعلى من نموذج لغة مستهدف من ترجمات الطلاب. يظهر تحليل لتوزيع أنماط نقاط البيع عبر السجلات أن هذه المفارقة الواضحة هي تأثير التنويع الأسلالي الأعلى وتسجيل الحساسية في الترجمات المهنية. نتائجنا تسهم في فهم الترجمة الإنسانية والنصية على الاختلاف في النصوص الناتجة عن مختلف المترجمين، والتي هي قيمة لدراسات الترجمة ومعالجة اللغة متعددة اللغات والترجمة الآلية.
نحن نعمل على تعميم فكرة قياس التحيزات الاجتماعية في Word Ageddings لإضاءة Word بصريا. الحياز موجودة في المدينات المتطرفة، ويبدو أنها بالفعل أكثر أهمية أو أكثر أهمية من المدمج غير المقصود. هذا على الرغم من حقيقة أن الرؤية واللغة يمكن أن تعاني من تحيزا ت مختلفة، والذي قد يأمل المرء أن يخفف من التحيزات في كليهما. توجد طرق متعددة لتعميم التحيز القياسي القياسي في Word Ageddings لهذا الإعداد الجديد. نقدم مساحة التعميمات (Weat-Weat-Weat and Grounded) وإظهار أن ثلاث تعميمات تجيب على أسئلة مختلفة لكنها مهمة حول كيفية تفاعل التحيزات واللغة والرؤية. يتم استخدام هذه المقاييس في مجموعة بيانات جديدة، الأول من أجل التحيز الأساسي، الذي تم إنشاؤه عن طريق زيادة معايير التحيز اللغوي القياسي مع 10228 صورة من كوكو، والتسمية التوضيحية المفاهيمية، وصور جوجل. بناء البيانات يتحدى لأن مجموعات بيانات الرؤية هي نفسها منحازة للغاية. سيبدأ وجود هذه التحيزات في الأنظمة في الحصول على عواقب عالمية حقيقية حيث يتم نشرها، مما يجعلها تقيس التحيز بعناية ثم تخفيفها بالغ الأهمية لبناء مجتمع عادل.
منذ فترة طويلة تم الاعتراف بأن اللاحقة أكثر شيوعا من البادئة بلغات العالم. هناك حاجة إلى إحصاءات أكثر تفصيلا حول هذا الاتجاه لشحذ التفسيرات المقترحة لهذا الاتجاه. والنهج الكلاسيكي لجمع البيانات حول تفضيل البادئة / لاحقة هو الإنسان لقراءة الأوصاف النح وية (948 لغة)، وهي تستغرق وقتا طويلا وتتضمن أحكاما تقديرا. في هذه الورقة، نستكشف مناهجا مدفوعة بالآتصاد لإحصائيات البادئة واللاحقة التي هي تقريبية من النفط الخام، ولكن لديها مزايا من حيث الوقت وتكرارها. يبحث أولا ببساطة مجموعة كبيرة من الأوصاف النحوية للحوادث المتعلقة بادئة المصطلحات واللاحقة "(4 287 لغة). ثاني تحسب السلاحيات من بيانات النص الخام بطريقة تعكس بشكل غير مباشر البقرات واللقب (1 030 لغة، باستخدام ترجمات العهد الجديد). تتفق الأساليب الثلاثة إلى حد كبير في قياساتها ولكن هناك اختلافات نظرية وعملية مهمة. في جميع القياسات، هناك تفضيلات شاملة للإقصاء، وإن كان ذلك فقط قليلا، على نسب تتراوح بين 0.51 و 0.68.
الملخص نقدم إطارا نظري لفهم وتوقع تعقيد مهام تصنيف التسلسل، باستخدام تمديد جديد لنظرية حساسية وظيفة المنطقية. حساسية الوظيفة، نظرا للتوزيع على تسلسل الإدخال، يحدد عدد الفك القصير من تسلسل الإدخال الذي يمكن تغيير كل منهما بشكل فردي لتغيير الإخراج. نقو ل أن أساليب تصنيف التسلسل القياسية متحيزة نحو تعلم وظائف الحساسية المنخفضة، بحيث تكون المهام التي تتطلب حساسية عالية أكثر صعوبة. تحقيقا لهذه الغاية، نظهر تحليليا أن المصنفات المعجمية البسيطة يمكن أن تعبر فقط عن وظائف الحساسية المحددة، ونظرا تجريبيا أن وظائف الحساسية المنخفضة هي أسهل للتعلم من أجل LSTMS. ثم نقدر الحساسية في 15 مهام NLP، ويجد أن الحساسية أعلى على المهام الصعبة التي تم جمعها في الغراء أكثر من مهام تصنيف النص البسيطة، وأن الحساسية تتنبأ بأداء كل من المصنفات المعجمية البسيطة والفانيليا BILSTMS دون إشارة إلى تضمينات محاط بأذى. في غضون مهمة، تتوقع الحساسية المدخلات من الصعب على هذه النماذج البسيطة. تشير نتائجنا إلى أن نجاح التمثيلات السياقية المسبقة بشكل كبير ينبع جزئيا لأنهم يقدمون تمثيلات يمكن استخراج المعلومات من خلال فك رموز حساسية منخفضة الحساسية.
يتناول هذا البحث دراسة نجم من نوع نجوم الغول (اسم عربي)، الذي تم اكتشافه من قبل المرصد الفلكي التابع لجامعة فريدريش شيللر في مدينة يينا في ألمانيا أثناء الرصد الفلكي لحقل من النجوم يقع على أطراف مجموعة نجوم الثريا المفتوحة خلال الفترة الممتدة من عام 2007م وحتى نهاية عام 2010م. قدم المرصد الفلكي صوراً فلكية حديثة بواسطة ثلاث كاميرات فلكية مركبة على تلسكوبين بقطر 0.25m و 0.9m. تم حساب الدور المداري لهذا النجم، الذي هو في الحقيقة عبارة عن نجم مضاعف، حيث بلغت قيمة هذا الدور . لقد لوحظ أن موقع النجم بالنسبة لمخطط هرتز شبرونغ-راسل (HRD) يتوافق مع عمر وبعد نجوم الثريا الموجودة في الحقل المدروس وفق المراجع العلمية ذات الصلة. تبين أيضاً أنه للنجم المركزي A طيف من النمط 9G وللثانوي B طيف من النمط 7K، ذلك استناداً إلى الألوان المحسوبة من الأطوال الموجية BVRIJHK. تم حساب كتلة ونصف قطر كلا النجمين المكونين لهذا النجم المضاعف مفترضين أن هذا النجم يقع على خط التشكل الأساسي، فكانت كتلة النجم المركزي ونصف قطره , في حين بلغت كتلة النجم الثانوي ونصف قطره . تشير إلى كتلة الشمس و إلى نصف قطرها.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا