يُعدّ موضوع واجهة الدماغ والحاسوب BCI (Brain Computer Interface) وخاصةً أنظمة التعرف على الإشارات الدماغية باستخدام التعلم العميق بعد توصيف هذه الإشارات عن طريق مخطط كهربائية الدماغ EEG (Electroencephalography) من المواضيع البحثية الهامة التي تثير ا
هتمام الكثير من الباحثين في الوقت الراهن, وتعد الشبكات العصبونية الالتفافية CNN (Convolutional Neural Nets) من أهم مصنفات التعلم العميق المستخدمة في عملية التعرف هذه، إلا أنه لم يتم بعد تحديد بارامترات هذا المصنف بشكل دقيق بحيث يعطي أعلى نسبة تعرف ممكنة وبأقل زمن تدريب وزمن تعرف ممكن.
يقترح هذا البحث نظام تعرف على إشارات EEG باستخدام شبكة CNN مع دراسة تأثير تغيير بارامترات هذه الشبكة على نسبة التعرف وزمني التدريب والتعرف على الإشارات الدماغية, وبالنتيجة تم الحصول بواسطة نظام التعرف المقترح على نسبة تعرف 76.38 %, وانقاص زمن تدريب المصنف (3 seconds) باستخدام النمط المكاني المشترك CSP (Common Spatial Pattern) في عملية المعالجة المسبقة لقاعدة البيانات IV2b, كما تم الوصول لنسبة تعرف 76.533 % من خلال إضافة طبقة للمصنف المقترح.
تم تطبيق هذه الدراسة التجريبية على منصة غوغل كولاب السحابية، من خلال تنفيذ التعليمات البرمجية والمكتبات المتطورة في لغة البايثون، قمنا بإجراء المعالجة المسبقة لبيانات بحثنا لإعداد صور الحقيقة الأرضية، ثم تدريب النموذج، تطلبت عملية التدريب والتحقق (4)
فترات، بحجم دفعة للبيانات (4) صور، تناقصت دالة الخسارة إلى حدودها الدنيا بقيمة (0.025)، واستغرق زمن التدريب ثلاث ساعات وعشرة دقائق، وذلك بالاستعانة بـوحدة معالجة الرسومات المتطورة (GPU) وذاكرة وصول عشوائي إضافية. حققنا نتائج جيدة في تقييم الدقة في صحة تنبؤات النموذج المدرب بقيمة (التقاطع إلى الاتحاد=0.953)، فتم اختباره على منطقتين مختلفين إحداهما سكنية وأخرى زراعية في مدينة اللاذقية، أظهرت النتائج أن النموذج (+DeepLabv3) المدرب في بحثنا يمكنه استخراج شبكة الطرق بدقة وفعالية، لكن أداؤه ضعيف في بعض المناطق التي تحوي أشجار بسبب تأثير الظلال على حواف الطرق، وحيث تكون الخصائص الطيفية مشابهة للطرق كأسطح بعض المباني، وهو غير صالح لاستخراج الطرق الفرعية وغير المعبدة. قدم البحث عدة توصيات بتحسين أداء النموذج (+Deeplabv3) في استخراج الطرق من صور الأقمار الصناعية عالية الدقة، بما يفيد في تحديث خرائط الطرق وأعمال التخطيط الحضري.
يأتي تلخيص الحوار مع تحديات خاصة به على عكس تلخيص الأخبار أو المقالات العلمية. في هذا العمل، نستكشف أربعة تحديات مختلفة لهذه المهمة: التعامل مع أجزاء من الحوار والتمييز بين المتحدثين المتعددين، وفهم النفي، والمنطق حول الوضع، وفهم اللغة غير الرسمية.
باستخدام نموذج لغة متسلسل مدرب مسبقا، نستكشف محل استبدال اسم المتكلم، وإبراز نطاق النفي، والتعلم المتعدد المهام مع المهام ذات الصلة، وإحصاء البيانات داخل المجال.تظهر تجاربنا أن تقنياتنا المقترحة تحسن أداء الملخصات، وتتفوق على نظم أساسية قوية.
نحن نعتبر التمثيل الهرمي للوثائق كرسوم بيانية واستخدام التعلم العميق الهندسي لتصنيفها إلى فئات مختلفة.في حين أن الشبكات العصبية الرسم البيانية يمكن أن تتعامل مع الهيكل المتغير بشكل فعال للمستندات التسلسل الهرمية باستخدام عمليات تمرير رسالة ثابتة للصب
غ، فإننا نوضح أنه يمكننا الحصول على تحسينات إضافية على الأداء باستخدام عملية تجمع الرسوم البيانية الانتقائية المقترحة التي تنشأ من حقيقة أن بعض أجزاء التسلسل الهرمي ثابتةعبر وثائق مختلفة.طبقنا نموذجنا لتصنيف بروتوكولات التجريبية السريري (CT) إلى فئات كاملة وإنهاءها.نستخدم حقيبة من الكلمات القائمة على الأكياس، بالإضافة إلى تضيير مقرها المحولات مسبقا لفصل العقد الرسم البياني، وتحقيق F1 Squareesaround 0.85 على سجل CT واسع النطاق للجمهور حول بروتوكولات 360k.نوضح كذلك كيف يمكن للتجمع الانتقائي إضافة رؤى في التنبؤ بحالة إنهاء CT.نحن نجعل التعليمات البرمجية المصدرية والشقاقات DataSet يمكن الوصول إليها.
إن مهمة التشخيص التلقائي تشفيرها في التصنيفات الطبية القياسية والاتحاد، لها أهمية كبيرة في الطب - كلاهما لدعم المهام اليومية للأطباء في إعداد الوثائق السريرية والإبلاغ عن التقارير السريرية. في هذه الورقة، نحقق في تطبيق وأداء محولات التعلم العميق المخ
تلفة للترميز التلقائي في ICD-10 من النصوص السريرية في البلغارية. يحاول التحليل المقارن العثور على النهج الذي هو أكثر كفاءة لاستخدامه في ضبط محول الأسرة برت المحدود إلى التعامل مع مصطلحات مجال معين على لغة نادرة مثل البلغارية. على جانب واحد، تستخدم سلافيكبرت و Multirigualbert، والتي يتم الاحترام من أجل المفردات الشائعة في البلغارية، ولكن تفتقر إلى المصطلحات الطبية. من ناحية أخرى، يتم استخدام BioBert، Clinicalbert، Sapbert، Bluebert، والتي يتم الاحتراج بها للمصطلحات الطبية باللغة الإنجليزية، ولكنها تفتقر إلى التدريب لنماذج اللغة باللغة البلغارية، وأكثر من اللازم للمفردات في السيريلية. في دراسة الأبحاث الخاصة بنا، يتم ضبط جميع نماذج Bert بشكل جيد مع نصوص طبية إضافية في البلغارية ثم تطبق على مهمة التصنيف لترميز التشخيصات الطبية في البلغارية في رموز ICD-10. يستخدم Big Corpora للتشخيص في البلغاري المشروح مع رموز ICD-10 لمهمة التصنيف. يمنح مثل هذا التحليل فكرة جيدة عن النماذج مناسبة لمهام نوع مماثل ومجال. تظهر نتائج التجارب والتقييم أن كلا النهجتين لها دقة مماثلة.
يعتمد النمذجة وفهم الحوارات في محادثة على تحديد نية المستخدم من النص المحدد. كشف نية غير معروفة أو جديدة مهمة حاسمة، كما هو الحال في سيناريو واقعي قد يتغير نية المستخدم بشكل متكرر مع مرور الوقت وتحويله حتى إلى نية غير مرفدة. هذه المهمة المتمثلة في فص
ل عينات النية المجهولة من النوايا المعروفة واحدة صعبة حيث يمكن أن يتراوح نية المستخدم غير المعروفة من النوايا المشابهة للحالة المحددة مسبقا لشيء مختلف تماما. غالبا ما ينظر البحث المسبق في اكتشاف النية كهمة تصنيف حيث يمكن أن ينتمي نية غير معروفة إلى مجموعة محددة مسبقا من فئات النية المعروفة. في هذه الورقة، نتعامل مع مشكلة الكشف عن نية غير معروفة تماما دون أي تلميحات مسبقة حول نوع الطبقات التي تنتمي إلى نوايا غير معروفة. نقترح طريقة فعالة لما بعد المعالجة باستخدام التحسين متعدد الأهداف لضبط مصنف نوايا NEWRET NEWRET NEWELTION موجود وجعله قادر على اكتشاف حطاء غير معروف. نحن نقوم بإجراء تجارب باستخدام مصنفات النوايا الحالية الحالية واستخدام طريقةنا على رأسها لكشف نية غير معروفة. تظهر تجاربنا عبر المجالات المختلفة ومجموعات البيانات في العالم الحقيقي أن طريقتنا تعطي تحسينات كبيرة مقارنة بالطرق الحديثة للكشف عن النية غير معروفة.
يعد تطبيع المفهوم للنصوص السريرية للتصنيفات الطبية القياسية والاتجاهات مهمة ذات أهمية عالية للبحث الطبي للرعاية الصحية. نحاول حل هذه المشكلة من خلال ترميز CT التلقائي CT، حيث يعد CT Snomed CT أحد أونولوجيات المصطلحات السريرية الأكثر استخداما وشاملة ع
لى نطاق واسع. ومع ذلك، فإن تطبيق نماذج التعلم العميق الأساسية يؤدي إلى نتائج غير مرغوب فيها بسبب الطبيعة غير المتوازنة للبيانات والعدد المتطرف من الفصول الدراسية. نقترح إجراء التصنيف الذي يحتوي على سير عمل متعدد الخطوات يتكون من تجميع الملصقات، والتصنيف متعدد الكتلة، ورسم الخرائط عن المجموعات إلى الملصقات. بالنسبة للتصنيف متعدد المجموعات، BioBert يتم ضبطه بشكل جيد على مجموعة بياناتنا المخصصة. يتم إجراء تعيين مجموعات إلى التسميات من قبل A One-VS-All Mederifier (SVC) المطبق على كل كتلة واحدة. نقدم أيضا خطوات لتوليد البيانات التلقائي من الأوصاف النصية المشروحة مع رموز CT Conomed بناء على البيانات العامة والبيانات المفتوحة المرتبطة. من أجل التعامل مع المشكلة أن DataSet لدينا غير متوازنة للغاية، يتم تطبيق بعض طرق تكبير البيانات. تظهر النتائج من التجارب التي أجريت دقة عالية وموثوقية نهجنا للتنبؤ برموز CT Conomed ذات الصلة بنص سريري.
تعتمد أساليب نقل نمط النص الحالي (TST) على أسلوب الطبقات لتفكيك سمات محتوى النص والأناقة لنقل نمط النص. في حين أن المصنف الأسلوب يلعب دورا حاسما في طرق TST الحالية، لا يوجد تحقيق معروف على تأثيره على أساليب TST. في هذه الورقة، نقوم بإجراء دراسة تجريب
ية عن قيود أقراص الطبقات المستخدمة في طرق TST الحالية. لقد أظهرنا أن مصنفات النمط الموجودة لا يمكنهم تعلم بناء جملة الجملة بشكل فعال وفي نهاية المطاف أداء نماذج TST الحالية. لمعالجة هذه المشكلة، نقترح نموذجا جديدا للجيل القابل للتحكم في بناء الجملة، والذي يتضمن مصنف بنمط بناء بناء الجملة يضمن التمثيلات الكامنة المستفادة التي تم التعهد بها بفعالية برياحة هيكل الجملة ل TST. من خلال تجارب واسعة على مهام نقل نمط نصية شعبية، نوضح أن طريقةنا المقترحة تتفوق بشكل كبير على اثني عشر طريقا حديثة. أظهرت دراسات الحالة لدينا أيضا قدرة SACG على توليد جمل ذات أسلوب يستهدف بطلاقة حافظت على المحتوى الأصلي.
تقدم هذه الورقة وصف نظام فريق المحور، الذي يفسر العمل ذي الصلة والنتائج التجريبية لمشاركة فريقنا في مهمة Semeval 2021 7: Hahackathon: الكشف عن الفكاهة والجريمة. لقد نجحنا بنجاح في نتائج التنبؤ بنتائج الاختبار للمجموعة الفرعية في المهمة. الهدف من المه
مة هو إجراء الكشف عن الفكاهة، وتقييم الصف، والتقييم الهجومي على كل بيانات نصية إنجليزية في مجموعة البيانات. يمكن تقسيم المهام إلى نوعين من المهن الفرعية. واحد هو مهمة تصنيف النص، والآخر هو مهمة الانحدار النصي. ما نحتاج إليه هو استخدام طريقتنا للكشف عن المعلومات الفكاهة والهجومية من الجملة بدقة قدر الإمكان. تتكون الأساليب المستخدمة في النتائج المقدمة من فريقنا أساسا من خوارزميات ألبرت وشبك سي إن إن و TF-جيش الدفاع الإسرائيلي. إن مؤشرات تقييم النتائج المقدمة من مهمة التصنيف هي درجة ودقة F1. مؤشر تقييم النتائج لتقديم مهمة الانحدار هو RMSE. النتائج النهائية لنتائج التنبؤ لمجموعات الاختبار الفرعي المقدم من فريقنا هي Task1a 0.921 (F1)، TASK1A 0.9364 (الدقة)، TASK1B 0.6288 (RMSE)، TASK1C 0.5333 (F1)، TASK1C 0.0.5591 (الدقة)، و TASK2 0.5027 (RMSE) على التوالي.
أصبح الكشف عن الفكاهة موضوع اهتمام بالعديد من فرق البحث، وخاصة المشاركين في الدراسات الاجتماعية والنفسية، بهدف الكشف عن الفكاهة والأشجار السكانية المستهدفة (مثل مجتمع، مدينة، أي بلد، موظفوشركة معينة).قامت معظم الدراسات الحالية بصياغة مشكلة الكشف عن ا
لفكاهة باعتبارها مهمة تصنيف ثنائية، بينما تدور حول تعلم شعور الفكاهة من خلال تقييم درجاتها المختلفة.في هذه الورقة، نقترح نموذج التعلم العميق متعدد الإنهاء (MTL) للكشف عن الفكاهة والجريمة.وهي تتألف من ترميز محول مدرب مسبقا وطبقات اهتمام خاص بمهام المهام.يتم تدريب النموذج باستخدام وزن خسارة عدم اليقين MTL للجمع بين جميع الوظائف الموضوعية ذات المهام الفرعية.يتناول نموذج MTL الخاص بنا جميع المهام الفرعية لمهمة Semeval-2021-7 في نظام التعلم العميق في نهاية واحد ويظهر نتائج واعدة للغاية.