تعاني رسوم الرسوم البيانية المعرفة من Sparsity والتي تتحلل من جودة التمثيلات الناتجة عن الطرق المختلفة. في حين أن هناك وفرة من المعلومات النصية في جميع أنحاء الويب والعديد من قواعد المعرفة الموجودة، فإن محاذاة المعلومات في جميع مصادر البيانات المتنوعة تظل تحديا في الأدبيات. وقد تناولت العمل السابق جزئيا هذه المشكلة عن طريق إثراء كيانات الرسم البياني المعرفي بناء على "حدوث كلمات" بجدية موجودة في كيانات الرسوم البيانية والنص الخارجي، بينما نحقق تكبير "" لينة "من خلال اقتراح إثراء الرسم البياني المعرفي وإطار التضمين اسمه الحافة. بالنظر إلى الرسم البياني المعرفي الأصلي، فإننا نقوم أولا بإنشاء رسم بياني معدني غني ولكن صاخبة يستخدم النصوص الخارجية في المستوى الدلالي والهيكل الهيكلية. لتقطير المعرفة ذات الصلة وقمع الضوضاء المقدمة، نقوم بتصميم مصطلح محاذاة رسم بياني في مساحة تضمين مشتركة بين الرسم البياني الأصلي والرسم البياني المعزز. لتعزيز التعلم التضمين في الرسم البياني المعزز، فإننا نتاجر مواصلة علاقة الموقع بالكيان المستهدف بناء على أخذ العينات السلبية. النتائج التجريبية على أربعة مجموعات بيانات قياسية تثبت متانة وفعالية الحافة في تبديد الارتباط وتصنيف العقدة.
Knowledge graphs suffer from sparsity which degrades the quality of representations generated by various methods. While there is an abundance of textual information throughout the web and many existing knowledge bases, aligning information across these diverse data sources remains a challenge in the literature. Previous work has partially addressed this issue by enriching knowledge graph entities based on hard'' co-occurrence of words present in the entities of the knowledge graphs and external text, while we achieve soft'' augmentation by proposing a knowledge graph enrichment and embedding framework named Edge. Given an original knowledge graph, we first generate a rich but noisy augmented graph using external texts in semantic and structural level. To distill the relevant knowledge and suppress the introduced noise, we design a graph alignment term in a shared embedding space between the original graph and augmented graph. To enhance the embedding learning on the augmented graph, we further regularize the locality relationship of target entity based on negative sampling. Experimental results on four benchmark datasets demonstrate the robustness and effectiveness of Edge in link prediction and node classification.
References used
https://aclanthology.org/
In the paper, we present the process of adding morphological information to the Polish WordNet (plWordNet). We describe the reasons for this connection and the intuitions behind it. We also draw attention to the specificity of the Polish morphology.
Introducing factors, that is to say, word features such as linguistic information referring to the source tokens, is known to improve the results of neural machine translation systems in certain settings, typically in recurrent architectures. This st
This study introduces an enriched version of the E2E dataset, one of the most popular language resources for data-to-text NLG. We extract intermediate representations for popular pipeline tasks such as discourse ordering, text structuring, lexicaliza
The style transfer task (here style is used in a broad authorial'' sense with many aspects including register, sentence structure, and vocabulary choice) takes text input and rewrites it in a specified target style preserving the meaning, but alterin
Extractive text summarization aims at extracting the most representative sentences from a given document as its summary. To extract a good summary from a long text document, sentence embedding plays an important role. Recent studies have leveraged gr