ترغب بنشر مسار تعليمي؟ اضغط هنا

Nnect Co-Nnect: إطار للكشف عن مسارات معرفة المنطقية كصفات عن المعرفة الضمنية في النصوص

CO-NNECT: A Framework for Revealing Commonsense Knowledge Paths as Explicitations of Implicit Knowledge in Texts

385   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذا العمل، نستفيد المعرفة المنوية في شكل مسارات المعرفة لإقامة صلات بين الجمل، كشكل من أشكال تفسير المعرفة الضمنية. يمكن أن تكون هذه الاتصالات مباشرة (مسارات مفردة) أو تتطلب مفاهيم وسيطة (مسارات Multihop). لبناء مثل هذه المسارات تجمع بين نوعين نموذجيين في إطار مشترك نسميه Nnect: مصنف علاقة يتنبأ بالاتصالات المباشرة بين المفاهيم؛ ونموذج التنبؤ المستهدف الذي يولد مفاهيم مستهدفة أو متوسطة بالنظر إلى مفهوم مصدر وعلاقة، والتي نستخدمها لإنشاء مسارات Multihop. على عكس العمل السابق الذي يعتمد بشكل حصري على مصادر المعرفة الثابتة، فإننا نستفيد من نماذج اللغة المصنعة للمعرفة المخزنة في Congalnet، لتوليد مسارات المعرفة بشكل حيوي، كشروح من المعرفة الضمنية التي تربط الجمل في النصوص. كمساهمة مركزية نقوم بتصميم إعدادات التقييم اليدوية والآلية لتقييم جودة المسارات التي تم إنشاؤها. نقوم بإجراء تقييمات على رقمين جدليين وإظهار أن هناك مزيج من النوعين النموذجيين يولد مسارات معارف ذات مغزى وعالية الجودة بين الجمل التي تكشف عن المعرفة الضمنية المنقولة في النص.



المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

أظهرت نماذج واسعة النطاق على نطاق واسع عروضا قوية على العديد من توليد اللغة الطبيعية وفهم المعايير.ومع ذلك، فإن إدخال العمولة فيها لتوليد نص أكثر واقعية يظل تحديا.مستوحاة من العمل السابق على جيل المعرفة المنطقي ومنطق العموم التوليد، نقدم طريقتين لإضا فة مهارات ومعرفة المنطق المنطقي إلى نماذج تلخيص مبادرة.فازت هذه الطريقة على خط الأساس على درجات الحمر، مما يدل على تفوق نماذجنا على أساس الأساس.تشير نتائج التقييم البشري إلى أن الملخصات الناتجة عن طريقتنا أكثر واقعية ولديها أخطاء معدلة أقل.
التعاطف هو الرابط بين الذات والآخرين.اكتشاف وفهم التعاطف هو عنصر أساسي لتحسين التفاعل بين الإنسان.ومع ذلك، فإن التعليق البيانات للكشف عن التعاطف على نطاق واسع هو مهمة صعبة.توظف هذه الورقة تدريبات متعددة المهام مع تقطير المعرفة لدمج المعرفة من الموارد المتاحة (العاطفة والشعور) للكشف عن التعاطف عن اللغة الطبيعية في مجالات مختلفة.يؤدي هذا النهج إلى تحقيق نتائج أفضل على مجموعة بيانات التعاطف ذات الصلة بالأخبار مقارنة مع خطوط الأساس القوية.بالإضافة إلى ذلك، نبني مجموعة بيانات جديدة للتنبؤ بالتعاطف مع اتجاه التعاطف المحبوب الجميل، أو البحث عن أو توفير التعاطف، من تويتر.نطلق سراح DataSet لدينا لأغراض البحث.
تدوين المعرفة المنطقية في الآلات هو هدف طويل الأطول من الذكاء الاصطناعي. في الآونة الأخيرة، تم إحراز تقدم كبير نحو هذا الهدف مع تقنيات بناء قاعدة المعرفة التلقائية (KB). ومع ذلك، فإن هذه التقنيات تركز في المقام الأول على اكتساب بيانات KB الإيجابية (T RUE)، على الرغم من أن البيانات السلبية (الخاطئة) غالبا ما تكون مهمة أيضا للمنطق التمييزي على متن العموم KBS. كخطوة أولى نحو الأخير، تقترح هذه الورقة NEGATER، وهو إطار يصنف السلبيات المحتملة في العمولة KBS باستخدام نموذج لغة سياقي (LM). الأهم من ذلك، حيث لا تحتوي معظم KBS على السلبيات، تعتمد Negater فقط على المعرفة الإيجابية في LM ولا تتطلب أمثلة سلبية للحقيقة. توضح التجارب أنه مقارنة بنهج تكبير البيانات المتعاقبة متعددة النزاع، فإن نطاط غلة السلبيات التي تعتبر أكثر حكما متماسكا ومفيدا --- تؤدي إلى تحسينات دقة ذات دلالة إحصائية في مهمة استكمال KB صعبة وتؤكد أن المعرفة الإيجابية في LMS يمكن إعادة -العرضة "لتوليد المعرفة السلبية.
الملخص لتطوير تطبيقات NLP المتطرفة المنطقية، وهو رسم بياني معرفي شامل ودقيق للعموم (CKG).إنها تستغرق وقتا طويلا لإنشاء CKGS يدويا والعديد من جهود البحثية التي تم تخصيصها للبناء التلقائي CKGS.تركز النهج السابقة على توليد المفاهيم التي لديها علاقات مبا شرة واضحة مع المفاهيم القائمة وتفتقر إلى القدرة على توليد مفاهيم غير واضحة.في هذا العمل، نهدف إلى سد هذه الفجوة.نقترح الإطار العام لإحاطاء بيئة الرسم البياني إلى مسارات يرفع هياكل مرتفعة في CKGS لالتقاط علاقات عالية الجودة بين المفاهيم.نحن إنشاء هذا الإطار العام إلى أربع حالات خاصة: المسار الطويل، المسار إلى المسار، جهاز التوجيه، ورأس الرسم البياني - مسار العقدة.تجارب على مجموعة بيانات اثنين تثبت فعالية أساليبنا.سيتم إصدار الرمز عبر مستودع GitHub العام.
يعد الكشف عن الموقف على Twitter تحديا بشكل خاص بسبب الطول القصير لكل سقسقة، والتعايش المستمر لمصطلحات جديدة وعلاج التصنيف، وانحراف هيكل الجملة من النثر القياسي.تم عرض نماذج لغة ذات ضبطها باستخدام بيانات داخل المجال على نطاق واسع لتكون الحالة الجديدة للعديد من مهام NLP، بما في ذلك اكتشاف الموقف.في هذه الورقة، نقترح طريقة رواية متناصة قائمة بذاتها تعزز نموذج اللغة الملثم للكشف عن الموقف.بدلا من إخفاء الرمز المميز العشوائي، نقترح استخدام نسبة مرجحة للأحكام المرجحة لتحديد الكلمات ذات الموقف العالي ومن ثم نموذج آلية الاهتمام التي تركز على هذه الكلمات.نظهر أن نهجنا المقترح يتفوق على حالة الفنية من أجل الكشف عن البيانات حول بيانات تويتر حول الانتخابات الرئاسية الأمريكية 2020.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا