ترغب بنشر مسار تعليمي؟ اضغط هنا

قدم النيكل و Kiela (2017) طريقة جديدة لتضمين عقد الأشجار في كرة الخشب، وتشير إلى أن هذه المدينات القطعي هي أكثر فعالية بكثير من Auclidean Admings في الرسوم البيانية الكبيرة الهيكلية بشكل كبير، مثل WordNet Nouns Trees Hypernymy Tree.هذا صحيح بشكل خاص في الأبعاد المنخفضة (النيكل وجيلا، 2017، الجدول 1).في هذا العمل، نسعى لإعادة إنتاج تجاربهم على تضمين وإعادة بناء الرسوم البيانية Hypernymy Nouns.عداد إلى ما تقاريره، نجد أن Auclidean Abbeddings قادرة على تمثيل هذه الشجرة على الأقل بالإضافة إلى تضمين المخيفات، عندما سمحت ب 50 أبعاد على الأقل.نلاحظ أن هذا لا يقلل من أهمية عملهم بالنظر إلى الأداء المثير للإعجاب من التضامن القطعي في إعدادات منخفضة الأبعاد للغاية.ومع ذلك، بالنظر إلى التأثير الواسع لعملهم، فإن هدفنا هنا هو تقديم مقارنة محدثة وأكثر دقة بين Euclidean و SuperBolic Elegbeddings.
تم تقديم تنسيقات Word GlobalNet لتمكين Wordnets للحصول على تمثيل مشترك يمكن دمجه من خلال شبكة WordNet العالمية.نتيجة لاعتمادها، تم تحديد عدد من أوجه القصور من التنسيق، وفي هذه الورقة تصف ملحقات التنسيقات التي تعالج هذه المشكلات.وتشمل هذه: ترتيب الحوا س والتبعية بين المصاصات والنطق والنمذجة النحوية والعلاقات ومفاتيح المعنى والبيانات الوصفية ودعم RDF.علاوة على ذلك، نحن نقدم بعض وجهات نظر حول كيفية مساعدة هذه التغييرات في دمج Wordnets.
تصف الورقة العمل قيد التقدم في مشروع Dannet2 الممول من مؤسسة Carlsberg. الهدف من المشروع هو تمديد Wordnet الدنماركي الأصلي، Dannet، بعدة طرق. التركيز الرئيسي على تمديد التغطية ووصف الصفات، وهو جزء من الكلام الذي تم وصفه بشكل ضئيل في Wordnet الأصلي. ن حن نصف المنهجية والعمل الأولي للصفات نصف تلقائيا من المرادفات الدنماركية إلى Wordnet بهدف توسيع التغطية بسهولة من 3000 إلى تقريبا. 13000 تمرين صفة. يتم إجراء النقل من خلال الترميز يدويا جميع الكلمات الدائمة الفعالية الفعالة في المفقودين من Thesaurus وبعد ذلك توظف إجراءات شبه تلقائية حيث يتم نقل الصفات من نفس القسم الفرعي إلى WordNet كإما 1) بالقرب من المرادفات إلى الكلمة الرئيسية للقسم، 2) الكلمة الرئيسية، أو 3) كأعضاء من نفس Synet ككلمة رئيسية. ونناقش أيضا كيفية التعامل مع مشكلة تمثيلات متعددة من نفس الشعور في المرادفات، وتقديم أنواع أخرى من المعلومات من المرادفات التي نخطط للاندماج، مثل معلومات مواضيعية ومشاعر.
تطبق الغالبية العظمى من الأساليب الحالية لتخصيص التصنيفات في تطبق Adgeddings Word لأنها أثبتت تجميع السياقات (بمعنى واسع) المستخرجة من النصوص التي تكفي إرفاق الكلمات الأيتام بالتصنيف.من ناحية أخرى، وبصرف النظر عن كونها الموارد الكبيرة المعجمية واللال لالية، فإن التصنيفات هي هياكل رسم بيانية.يمكن أن يكون الجمع بين تدمير Word مع هيكل الرسم البياني للتصنيف موضع التنبؤ بالتنبؤ بالعلاقات التصنيفية.في هذه الورقة، نقارن العديد من النهج لإرفاق كلمات جديدة بالتصنيف الموجود القائمة على تمثيلات الرسم البياني مع تلك التي تعتمد على ASTTEXT AGEDDINGS.نختبر جميع الأساليب على مجموعات البيانات الروسية والإنجليزية، ولكن يمكن تطبيقها أيضا على الكلمات واللغات الأخرى.
تقدم الورقة شبكة الدلالية المشروع مع مجموعة واسعة من العلاقات الدلالية وإنجازاتها الرئيسية.الهدف النهائي للمشروع هو توسيع Princeton Wordnet مع الإطارات المفاهيمية التي تحدد العلاقات الجزيئية من عمليات التملائم الفعل والفئات الدلالية من الأسماء المرسل ة للتجمع مع أفعال معينة.في هذه المرحلة من العمل: أ) تم تزويد أكثر من 5000 من عمليات تصعيد الفعل في WordNet مع إطارات FRAMENET الدلالية Framenet يدويا، ب) تم تعيين 253 نوعا دالايا يدويا إلى مفاهيم WordNet المناسبة التي توفر تمثيل مفصل للصفوف الدلالية من الأسماء الدلالية.
حاليا، هناك نوعان من الوصمات المتاحة للتركية: TR-Wordnet of Balkanet و Kenet.كما يتضمن Wordnet الأكثر شمولية للتركية، تشمل Kenet 76،757 عملية عملية.لدى Kenet العلاقات الدلالية المعدلة وترتبط ب Pwn من خلال العلاقات المتداخلة.في هذه الورقة، نقدم الإجرا ء الذي اعتمده في إنشاء Kenet، وإعطاء تفاصيل حول نهجنا في التعليق العلاقات الدلالية مثل ارتفاع ضغط الدم ويناقش المشكلات الخاصة باللغة التي تواجهها في هذه العمليات.
نقدم هنا نتائج تحليل المورفوسانسي لأزواج الفعل - Noun في Princeton Wordnet كما ينعكس في ملف المواجهة المحتوي على أزواج مشروحة بمجموعة من 14 علاقات دلالية. لقد تم تمييزنا تلقائيا عن اشتقاق الاشتقاق الصفر والالتقاط في البيانات وتحديد الملصقات وتم فحص ا لنتائج يدويا. تظهر البيانات أنه بالنسبة لكل علاقة دهالية سائدة Affix في إنشاء كلمات جديدة، على الرغم من أننا لا نستطيع التحدث عن خصوصيةهم فيما يتعلق بمثل هذه العلاقة. علاوة على ذلك، يتم تمثيل بعض أزواج من الأعمدة الدلالية الفعلية من الأبعاد الدلالية لكل علاقة دهالية، وتشكل بعض المجموعات الدلالية (في شكل الصفحات الفرعية WordNet) نتيجة لذلك. وبالتالي فإننا توظف تحليلا كبيرا من الدوافع التي يطاردها البيانات واسعة النطاق يتم توفيرها من قبل الوصف الغني المشتقات والمورفوسيمانتي في Wordnet إلى نهاية التقاط الأنسجة الدقيقة في عملية الاشتقاق على النحو الممثل في الخواص الدلالية للكلمات المعنية وتنعكس هيكل المعجم.
نماذج اللغة العصبية، بما في ذلك النماذج القائمة على المحولات، والتي تدرب مسبقا على كوربورا كبيرة جدا أصبحت وسيلة شائعة لتمثيل النص في مهام مختلفة، بما في ذلك الاعتراف بالعلاقات الدلالية النصية، على سبيل المثال نظرية هيكل الوثائق عبر المستندات. عادة م ا تكون النماذج المدربة مسبقا عادة ما يتم ضبطها على مهام المصب وتستخدم ناقلات تم الحصول عليها كمدخلات للصفين العصبي العميق. لا توجد معرفة لغوية تم الحصول عليها من الموارد والأدوات. في هذه الورقة، نقارن هذه النهج الشاملة بمجموعة من تمثيل الجملة الدوافع التي تعتمد على الرسم البياني الغني في الرسم البياني والشبكة العصبية النموذجية المطبقة على مهمة الاعتراف بعقود CST في البولندية. يصف التمثيل مستويات مختارة من هيكل الجملة بما في ذلك وصف المعاني المعجمية على أساس أجهزة WordNet (PLWOLNET) ومفاهيم Sumo المتصلة. تظهر النتائج التي تم الحصول عليها أنه في حالة العلاقات الصعبة والتدريب المتوسطة الحجم تمثيل النص المخصب من الناحية الدلوية يؤدي إلى نتائج أفضل بكثير.
تصف هذه الورقة تطوير مورد معجمي عبر الإنترنت للمساعدة في تنظيم أنظمة الكشف وكبح استخدام الكلمات الهجومية عبر الإنترنت.مع انتشار نمو منصات وسائل التواصل الاجتماعي، يتم الآن إجراء العديد من المحادثات عند الخط.أدت زيادة المحادثات عبر الإنترنت للترفيه وا لعمل والتواصل الاجتماعي إلى زيادة المضايقة.على وجه الخصوص، نقوم بإنشاء مفردات متخصصة في الإحساس بالكلمات الهجومية اليابانية للكلمات المفتوحة متعددة اللغات.يتوسع هذا المفردات على قائمة موجودة من الكلمات اليابانية الناتجة وتوفر التصنيف والربط السليم بالاتصالات داخل Wordnet متعددة اللغات.ثم تناقش هذه الورقة تقييم المفردات كمورد لتمثيل التصنيف والكلمات الهجومية وكخلاصا محتملا لاستخدام الكلمة الهجومية في وسائل التواصل الاجتماعي.
كلمة Wordnet هي عبارة سرية لديها قائمة منظم من الكلمات المنظمة حسب معانيها.تمثل WordNETS حواس الكلمات، وكل المعاني قد يكون ليممة واحدة، والعلاقات بين هذه الحواس، وتعاريفها.دراسة أخرى داخل مجال معالجة اللغة الطبيعية هي تحليل المعنويات.مع تحليل المعنوي ات، يمكن تسجيل مجموعات البيانات وفقا للعاطفة التي تحتوي عليها.في تحليل المعنويات، فعلنا بالبيانات التي تلقيناها على Wordnet السياحة، أجرينا دراسة تحليل المعنويات الخاصة بالمجال عن طريق التخلص من البيانات.في هذه الورقة، نقترح طريقة لتسهيل مهام معالجة اللغة الطبيعية مثل تحليل المعنويات التي يتم إجراؤها في مجالات محددة عبر إنشاء مجموعة فرعية مجال محددة من قاموس تركي أصلي.كدراسة أولية، أنشأنا Wordnet للمجال السياحي مع 14000 كلمة وتقوم بتحقق من صحةها في مهام بسيطة.
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا