تهدف استخراج العلاقات القائم على الحوار (إعادة) إلى استخراج العلاقة بين الحججتين التي تظهر في حوار. نظرا لأن الحوارات لديها خصائص حوادث الضمير الشخصية العالية وكثافة المعلومات المنخفضة، وبما أن معظم الحقائق العلائقية في الحوارات لا تدعمها أي جملة واح
دة، فإن استخراج العلاقات القائمة على الحوار يتطلب فهم شامل للحوار. في هذه الورقة، نقترح Network Network Commany Commany Computal Network (Tucore-GCN) على غرار الاهتمام بالطريقة التي يفهم بها الناس الحوارات. بالإضافة إلى ذلك، نقترح نهج رواية يعامل مهمة الاعتراف بالمحادثات في المحادثات (ERC) كإعادة حوار قائما. تثبت التجارب في DataSet مقصورة الحوار وثلاث مجموعات بيانات ERC أن طرازنا فعال للغاية في مهام فهم اللغة الطبيعية القائمة على الحوار. في هذه التجارب، تتفوق Tucore-GCN على النماذج الحديثة على معظم مجموعات البيانات القياسية. يتوفر الكود الخاص بنا في https://github.com/blacknoodle/tucore-gcn.
تستخدم مصطلح خطط الترجغ على نطاق واسع في معالجة اللغة الطبيعية واسترجاع المعلومات. على وجه الخصوص، فإن وزن المصطلح هو الأساس لاستخراج الكلمات الرئيسية. ومع ذلك، هناك عدد قليل نسبيا دراسات التقييم التي ألقت الضوء على نقاط القوة وأوجه القصور في كل مخطط
للتوازن. في الواقع، في معظم الحالات، يلجأ الباحثون والممارسون في معظم الحالات إلى TF-IDF المعروفة بشكل افتراضي، على الرغم من وجود بدائل أخرى مناسبة، بما في ذلك النماذج القائمة على الرسم البياني. في هذه الورقة، نقوم بإجراء مقارنة تجريبية وشاملة واسعة النطاق من كل من أساليب الترجيح الإحصائية والرصاص القائمة على الرسم البياني في سياق استخراج الكلمات الرئيسية. يكشف تحليلنا عن بعض النتائج المثيرة للاهتمام مثل مزايا الخصوصية المعروفة الأقل شهرة فيما يتعلق ب TF-IDF، أو الاختلافات النوعية بين الأساليب الإحصائية والرصاص القائمة على الرسم البياني. وأخيرا، بناء على نتائجنا نناقشها واستنباد بعض الاقتراحات للممارسين. تعد شفرة المصدر لإعادة إنتاج نتائجنا التجريبية، بما في ذلك مكتبة استخراج الكلمات الرئيسية، متوفرة في المستودع التالي: https://github.com/asahi417/kex
تهدف مهمة التحقق من الحقائق القائمة على الطاولة إلى التحقق مما إذا كان البيان المحدد مدعوم من الجدول شبه المنظم المحدد. يلعب المنطق الرمزي مع العمليات المنطقية دورا حاسما في هذه المهمة. الأساليب الحالية الاستفادة من البرامج التي تحتوي على معلومات منط
قية غنية لتعزيز عملية التحقق. ومع ذلك، نظرا لعدم وجود إشارات خاضعة للإشراف بالكامل في عملية توليد البرنامج، يمكن استخلاص البرامج الزائفة وعملها، مما يؤدي إلى عدم قدرة النموذج على العمليات المنطقية المفيدة. لمعالجة المشكلات المذكورة أعلاه، في هذا العمل، نقوم بصياغة مهمة التحقق من الحقائق القائمة على الطاولة كإطار لاسترجاع الأدلة والتفكير، حيث اقترح شبكة التحقق من الأدلة على مستوى المنطق وشبكة التحقق القائمة على الرسم البياني (LERGV). على وجه التحديد، نقوم أولا باسترجئة الأدلة التي تشبه البرامج على مستوى المنطق من الجدول المعطى والبيان كدليل تكميلي على الطاولة. بعد ذلك، نقوم بإنشاء رسم بياني لمستوى منطقي لالتقاط العلاقات المنطقية بين الكيانات والوظائف في الأدلة المستردة، وتصميم شبكة التحقق القائمة على الرسم البياني لإجراء المنطق المستندة إلى الرسم البياني على مستوى المنطق بناء على الرسم البياني الذي تم إنشاؤه لتصنيف النهائي علاقة استقامة. النتائج التجريبية على Tabract Tabract القياسي على نطاق واسع تظهر فعالية النهج المقترح.
تحتاج الجيل القادم من أنظمة المحادثة AI إلى: (1) لغة العملية تدريجيا، يجب أن تكون الرمز المميز أكثر استجابة وتمكين التعامل مع ظواض المحادثة مثل توقف مؤقت وإعادة التشغيل والتصحيحات الذاتية؛ (2) السبب السماح بشكل تدريجي بالمعنى الذي سيتم إنشاؤه بعد ما
يقال؛ (3) أن تكون شفافة ويمكن التحكم فيها، مما يسمح للمصممين وكذلك النظام نفسه بوضع أسباب بسهولة لسلوك معين والخياط لمجموعات مستخدمين معينة، أو المجالات. في هذه الورقة القصيرة، نقدم العمل الأولي المستمر يجمع بين بناء الجملة الديناميكي (DS) - إطار Grammar التدريجي والدلي - مع إطار وصف الموارد (RDF). هذا يمهد الطريق لإنشاء المحللين الدلاليين التدريجيين الذين ينتجون تدريجيا الرسوم البيانية الدلالية RDF كصحة تتكشف في الوقت الفعلي. نحن أيضا الخطوط العريضة كيف يمكن دمج المحلل المحلل بمحرك التفكير تدريجي من خلال RDF. نقول أن DS-RDF Hybrid يرضي Desiderata المذكورة أعلاه، مما أسفر عن البنية التحتية الدلالية التي يمكن استخدامها لبناء مستجيب، في الوقت الفعلي، AI محادثة محادثة مفسورة يمكن تخصيصها بسرعة لتوفير مجموعات مستخدمين محددة مثل الأشخاص المصابين بالخرف.
نحن نراجع ميزتين من مزيج من نماذج الخبراء (MOE) التي نسميها وتأثيرات التجميع في سياق محلل التبعية القائمة على الرسوم البيانية المستفادة في إطار احتمامي إشراف. يتوافق المتوسط مع مزيج الفرقة من المحللين وهو مسؤول عن تخفيض التباين الذي يساعد على استقر
ار وتحسين دقة التحليل. يصف التجميع طاقة نماذج وزارة التعليم لتعطي المزيد من الائتمان للخبراء يعتقد أنه أكثر دقة بالنظر إلى المدخلات. على الرغم من الواعدة، يصعب تحقيق ذلك، خاصة دون بيانات إضافية. نقوم بتصميم إعداد تجريبي لدراسة تأثير هذه الآثار. في حين أن المتوسط مفيد دائما، فإن التجميع يتطلب تقنيات التهيئة والاستقرار جيدة، لكن مزاياها على مدى المتوسط يبدو أنها تختفي في نهاية المطاف عندما يوجد عدد كاف من الخبراء. كمنتج حسب المنتج، نوضح كيف يؤدي ذلك إلى نتائج أحدث النتائج على PTB و Conll09 Treebank الصينية، مع انخفاض التباين عبر التجارب.
يعمل العمل المسبق على جيل البيانات إلى النص، ومهمة تحويل الكلام الرسم البياني (KG) ثلاث مرات إلى نص طبيعي، يركز على مجموعات البيانات القياسية الخاصة بالمجال. ومع ذلك، في هذه الورقة، فإننا ننفذنا اللغة الإنجليزية بأكملها Wikidata KG، ومناقشة التحديات
الفريدة المرتبطة بمجال واسع ومجموع واسع النطاق. نوضح كذلك بأنه لفظي كجم شامل ومكون من كجم مثل Wikidata يمكن استخدامه لدمج KGS الهيكلية واللغات الطبيعية. على عكس العديد من البنيات التي تم تطويرها لدمج هاتين المصدرين، فإن نهجنا يحول كجم إلى نص طبيعي، مما يسمح له بالدمج بسلاسة في نماذج اللغة الحالية. إنه يحمل مزايا أخرى لتحسين الدقة الواقعية وتقليل السمية في نموذج اللغة الناتج. نقوم بتقييم هذا النهج عن طريق زيادة عملية استرجاع النموذج لغوي استرجاع وإظهار تحسينات كبيرة على مهام المعرفة المكثفة في المجال المفتوح وكثير المعرفة LAMA.
تم في هذا البحث بناء خوارزمية, لاستخلاص معالم ثلاثية البعد, ذات أشكال إسطوانية بالإضافة
إلى الجيوب و المجاري من نماذج CAD المخزنة بصيغة ملفات STL و ذلك بالاعتماد على منهج التمثيل البياني (graph-based method) و منهج القواعد (rule-based method).
كما
تم تصميم تطبيق باستخدام Visual Stduio C# كواجهة تخاطب مع المستخدم, يسمح له باستيراد نماذج CAD المخزنة بصيغة STL و استخلاص المعالم و عرض المعلومات الخاصة لكل منها (كقطر و ارتفاع و إحداثيات مركز الثقل للأسطوانات, و قيم العرض و الطول و الإرتفاع للجيوب و المجاري, بالإضافة إلى عرض السطوح المشكلة لها و احداثيات مركز ثقلها).
تم بناء الخوارزمية المقترحة من عدة مراحل هي: تقسيم النموذج المدروس إلى مجموعة من السطوح بالاعتماد على خوارزمية RegionGrowing, يليها استخلاص المعالم الأسطوانية بالاعتماد على منهج القواعد, و استخلاص الجيوب و المجاري بالاعتماد على منهج التمثيل البياني, ثم حساب المعلومات الهندسية الخاصة بكل معلم. تم اختبار الخوارزمية المقترحة على نماذج CAD تحتوي معالم أسطوانية و جيوب و مجاري بأشكال مختلفة. و قد أظهرت النتائج قدرة الخوارزمية المقترحة على استخلاص المعالم الإسطوانية و الجيوب و المجاري من نماذج CAD مختلفة مخزنة بصيغة ملفات STL بالإضافة إلى ايجاد المميزات الهندسية للمعالم المستخلصة مثل (احداثيات مركز الثقل بالنسبة لمركز النموذج, العرض, العمق, الارتفاع و قطر الأسطوانة .... الخ).
بسبب ازدياد انتشار البيانات والاستخدام الواسع لمواقع التواصل الاجتماعي والتطبيقات المختلفة والتي تعتمد بشكلٍ رئيسي على العلاقات المعقّدة والمترابطة بين العديد من الكيانات التي تحتاج لنماذج محددة من قواعد البيانات من أجل القدرة على تخزينها واسترجاعها
بكفاءة وسرعة، لذلك لم تعُد قواعد البيانات العلاقاتية (Relational Databases) تفي بالغرض أو تؤدّي جميع المتطلّبات التي تحتاجها العديد من الأنظمة الموزّعة والمواقع والتطبيقات البرمجية التي تحوي قواعد معطيات كبيرة، والتي بدورها تحتاج لسرعة وسهولة في الوصول إليها وإجراء العمليات المناسبة ضمنها.
تشرح هذه الورقة بشكلٍ مختصر التحدّيات التي واجهت قواعد المعطيات العلاقاتية والطريقة التقليدية في التعامل مع البيانات، والأسباب التي أدّت للجوء إلى ما يُسمّى قواعد المعطيات غير العلاقاتية NoSQL (Not Only SQL)، بالإضافة للتطرّق إلى نظرية CAP وبعض أنواع NoSQL، مع التركيز على GraphQL كأحد تقنيات النّوع Graph.