ترغب بنشر مسار تعليمي؟ اضغط هنا

غالبا ما يمنح الباحثون الصحة والطب توصيات سريرية وسياساتية لإبلاغ الممارسة الصحية وسياسة الصحة العامة. ومع ذلك، لا يوجد نظام معلومات صحي حالي يدعم الاسترجاع المباشر للمشورة الصحية. يملأ هذه الدراسة الفجوة من خلال تطوير وتحقق من صحة نموذج التنبؤ القائ م على NLP لتحديد المشورة الصحية في المنشورات البحثية. نتشرحنا بإنشاء 6000 جمل مستخرج من الملخصات المنظمة في منشورات PubMed باعتبارها نصيحة قوية "أو نصيحة ضعيفة"، أو لا نصيحة "، أو طورت نموذجا يستند إلى بيرت يمكنه التنبؤ به، حيث بلغ متوسط ​​درجة الماكرو F1 من 0.93، ما إذا كانت الجملة تعطي نصيحة قوية أو نصيحة ضعيفة أم لا. طراز التنبؤ المعمم جيدا إلى الجمل في كل من ملخصات ومناقشات المناقشة غير المنظمة، حيث تظهر المشورة الصحية عادة. كما أجرينا دراسة حالة تطبق هذا النموذج التنبؤ هذا لاسترداد مشورة صحية محددة بشأن علاجات CovID-19 من Litcovid، وهي بوابة أدب أبحاث كوفي كبير، مما يدل على فائدة أحكام المشورة الصحية كدالة تنقل أبحاث متقدم للباحثين الصحيين عامة الناس.
تصف هذه الورقة نظام الترجمة من مختبر الأبحاث الجوية (AFRL) والتحسينات التي تم تطويرها خلال حملة تقييم WMT21.هذا العام، نستكشف أساليب مختلفة تكييف نماذج الأساس لدينا من WMT20 ومرة أخرى قياس التحسينات في الأداء على زوج اللغة الروسية - الإنجليزية.
نقوم بالإبلاغ عن تجربة اتفاقية مشتركة بين النقدية التي تنطوي على حالات إعادة استخدام النص التركيز على الحالة المعروفة في التقاطع التوراتي التوراتي في أدب القرون الوسطى. نحن نستهدف التطبيق استخدام حالة علماء الأدبيين هدفهم هو توثيق مثيلات المراجع التو راتية في جهاز فونيوم فونيوم "من الطبعة الرقمية المحتملة. نقوم بتطوير تنفيذ بايزي ل KAPPA في كوهين للحصول على محنصون متعددين يسمحون لنا بتقييم تأثير الآثار السياقية المختلفة على اتفاقية المعلقين المشترك بين المشتريات، مما يؤدي إلى تقديرات أكثر قوة لمؤشرات الاتفاق وكذلك رؤى في عملية التوضيحية التي تؤدي المؤشرات المقدرة. ونتيجة لذلك، نحن قادرون على إنتاج رواية وإحكام تقدير للاتفاقية المشتركة بين المنشطات في سياق intertextuality، واستكشاف التحديات التي تنشأ من إشراف بيانات مراجع الكتاب المقدس يدويا في كتابات برنارد كليرفو. من بين أمور أخرى، كانت طريقةنا قادرة على الكشف عن حقيقة أن الاتفاقية التي تم الحصول عليها تعتمد اعتمادا كبيرا على كتاب المصدر التوراتي المرجع المقترح، وكذلك الخوارزمية الأساسية المستخدمة لاسترداد مباراة المرشحين.
تقدم هذه الورقة النتائج الأولية للمشروع الجاري الذي يحلل الجسم المتنامي للبحث العلمي الذي نشر حول جائحة CovID-19.في هذا البحث، يتم استخدام نموذج دلالي للأغراض العامة لتعليق دفعة من 500 جمل تم اختيارها يدويا من Cord-19 Corpus.بعد ذلك، تم تصميم وتقييم خط أنابيب تعدين النص الأساسي من خلال مجموعة كبيرة من جمل 100،959.نقدم تحليلا نوعيا للحقائق الأكثر إثارة للاهتمام استخراجها تلقائيا وتسليط الضوء على خطوط التنمية المستقبلية المحتملة.تظهر النتائج الأولية أن النماذج الدلالية للأغراض العامة هي أداة مفيدة لاكتشاف معرفة غرامة المحبوس في كورسا الوثائق العلمية الكبيرة.
الاتصالات المكتوبة هي ذات أهمية قصوى لتقدم البحث العلمي. ومع ذلك، قد تتأثر سرعة التطوير من ندرة المراجعين للحكم على جودة المواد البحثية. في هذا السياق، أصبحت الأساليب التلقائية التي يمكنها الاستعلام عن القطاعات اللغوية في مساهمات مكتوبة من خلال اكتشا ف وجود أو عدم وجود أنماط الخطابية المشتركة أصبحت ضرورة. تهدف هذه الورقة إلى مقارنة تقنيات تعلم الآلات الخاضعة للإشراف التي تم اختبارها لإنجاز تحليل النوع في مقاطع مقدمة من مقالات هندسة البرمجيات. تم تنفيذ نهج شبه مشار إليه لزيادة عدد الجمل المشروح في اللوحات (المتاحة على: مجهول). تم إجراء نهجين إشرافين باستخدام الانحدار من SVM وانحدار لوجستي لتقييم درجة F- النتيجة لتحليل النوع في الجور. تم العثور على تقنية استنادا إلى الانحدار اللوجستي ونقلها لإجراء تحليل النوع بشكل مرض للغاية بمعدل 88.25 على درجة F عند استرداد الأنماط على المستوى العام.
أصبح الكشف والتحليلات الهجومية تحليلها مجالا رئيسيا للبحث في معالجة اللغة الطبيعية.تعرض حرية المشاركة في وسائل التواصل الاجتماعي مستخدمين عبر الإنترنت للمشاركات المصممة للتشويه أو إهانة أو تؤذيها وفقا للجنس أو العرق أو الدين أو الإيديولوجية أو الخصائ ص الشخصية الأخرى.مع التركيز على المصانعين الشباب من المنصات الاجتماعية المعروفة في Twitter، Instagram، و YouTube، قمنا بجمع كوربوس يتكون من 47،128 تعليقات إسبانية يدويا على الفئات المعروفة الهجومية.تعلق مجموعة فرعية من الجثة درجة من الثقة لكل ملصق، لذلك من الممكن أن كل من تصنيف متعدد الطبقات ودراسات الانحدار المتعدد الناتج ممكن.في هذه الورقة، نقدم كوربوس، ومناقشة عملية بناءها، والمستجدات، وبعض التجارب الأولية معها لتكون خطاس أساسي لمجتمع البحث.
تقدم هذه الورقة مساعينا لحل المهام 11، NLPContribeGraph، Semeval-2021. كان الغرض من المهمة استخراج ثلاث مرات من ورقة في مجال معالجة لغة الطبيعة لإنشاء رسم بياني لمعرفة بحث مفتوح. تتضمن المهمة ثلاثة مهام فرعية: اكتشاف أحكام المساهمة في الأوراق وتحديد العبارات العلمية والعبارات المسندة من أحكام المساهمة؛ واستنتاج ثلاث مرات في شكل (الموضوع، المسند، كائن) كبيانات لبناء الرسم البياني المعرفة. في هذه الورقة، نطبق مجموعة من مختلف نماذج اللغة المدربة مسبقا بشكل جيد (PLM) للمهام واحدة واثنين. بالإضافة إلى ذلك، يتم اعتماد أساليب التدريب الذاتي لمعالجة النقص في البيانات المشروح. للمهمة الثالثة، بدلا من استخدام هياكل استخراج المعلومات المفتوحة الكلاسيكية (OIE) الكلاسيكية، فإننا نولد ثلاث مرات محتملة عبر القواعد المصممة يدويا وتطوير مصنف ثنائي للتمييز بين الآخرين من الآخرين. تظهر النتائج الكمية أننا نحصل على المرتبة الرابعة والثانية والثانية في ثلاث مراحل تقييم.
يبذل الأبحاث في معالجة اللغة الطبيعية تطورات سريعة، مما يؤدي إلى نشر عدد كبير من الأوراق البحثية. العثور على أوراق بحثية ذات صلة ومساهمتها في المجال هي مشكلة صعبة. في هذه الورقة، نتعلم هذا التحدي عبر مهمة Semeval 2021 11: NLPConTributiongraph، من خلا ل تطوير نظام للحصول على الرسم البياني المعرفة المركزة للصفحة البحثية على أدب معالجة اللغة الطبيعية. تنقسم المهمة إلى ثلاث مهام فرعية: استخراج جمل المساهمة التي توضح مساهمات مهمة في المادة البحثية، واستخراج العبارات من أحكام المساهمة، والتنبؤ بالوحدات الإعلامية في المادة البحثية مع تكوين ثلاثي الأمراض من العبارات. النظام المقترح غير ملائم إلى مجال الموضوع ويمكن تطبيقه لبناء رسم بياني للمعرفة لأي منطقة. وجدنا أن نماذج اللغة القائمة على المحولات يمكن أن تحسن بشكل كبير التقنيات الحالية واستخدام النموذج المستند إلى Scibert. تستخدم المهمة الفرعية الأولى لدينا ثنائي الاتجاه LSTM (Bilstm) مكدسة أعلى طبقات نموذج Scibert، في حين أن المهمة الفرعية الثانية تستخدم مجال عشوائي مشروط (CRF) على رأس Scibert مع Bilstm. تستخدم المهمة الفرعية الثالثة نهجا عصبي مجتمعة مقرها مع الاستدلال لتنبؤ وحدة المعلومات وتشكيل ثلاثي الزيارة من العبارات. حقق نظامنا درجة F1 من 0.38، 0.63 و 0.76 في اختبار خط أنابيب نهاية إلى نهاية، اختبار استخراج العبارات واختبار استخراج ثلاث مرات.
توفر شرائح العرض التقديمية الناتجة عن أوراق البحث الأصلية نموذجا فعالا لتقديم ابتكارات بحثية.توليد شرائح العرض يدويا هي كثيفة العمالة.نقترح طريقة لإنشاء الشرائح تلقائيا للمقالات العلمية المستندة إلى كائن من 5000 من أزواج الشريحة الورقية التي تم تجميع ها من مواقع ويب إجراءات المؤتمرات.تستند وحدة وضع العلامات الخاصة بالحكم من طريقتنا إلى SummarUnner، نموذج التسلسل العصبي لتلخيص الاستخراج.بدلا من الترتيب الجمل بناء على أوجه التشابه الدلالي في المستند بأكمله، تقيس خوارزميةنا أهمية وحد الجمل عن طريق الجمع بين الميزات الدلالية والجنيات في إطار الجملة.تتفوق طريقةنا على العديد من الطرق الأساسية بما في ذلك SummarUnner بهامش مهم من حيث درجة Rouge.
قراء قراء أوراق البحث الأكاديمي غالبا ما يقرؤون بهدف الإجابة على أسئلة محددة. يمكن للإجابة على الأسئلة التي يمكن أن ترد على هذه الأسئلة إجراء استهلاك المحتوى أكثر كفاءة بكثير. ومع ذلك، فإن بناء هذه الأدوات يتطلب بيانات تعكس صعوبة المهمة الناشئة عن ال تفكير المعقد حول المطالبات المقدمة في أجزاء متعددة من الورقة. في المقابل، تحتوي الأسئلة الحالية على المعلومات المتعلقة بالمعلومات الرد على مجموعات البيانات عادة أسئلة حول المعلومات العامة من النوع العامل. لذلك نحن نقدم QASPER، مجموعة بيانات من 5049 سؤالا أكثر من 1585 ورقة معالجة اللغة الطبيعية. يتم كتابة كل سؤال بممارس NLP الذي قرأ فقط عنوان وإجراء ملخص للورقة المقابلة، والسؤال يسعى للحصول على معلومات موجودة في النص الكامل. ثم تتم الإجابة على الأسئلة من قبل مجموعة منفصلة من ممارسين NLP الذين يقدمون أيضا الأدلة الداعمة للإجابات. نجد أن النماذج الحالية التي تعمل بشكل جيد على مهام ضمان الجودة الأخرى لا تؤدي بشكل جيد في الإجابة على هذه الأسئلة، وأيضا الأد من البشر بنسبة 27 نقطة على الأقل عند الإجابة عليها من الأوراق بأكملها، تحفز المزيد من الأبحاث في الوثائق التي تأسست، حيث تسعى للحصول على المعلومات، والتي تم تصميم DataSet لدينا لتسهيل.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا