ترغب بنشر مسار تعليمي؟ اضغط هنا

استخلاص مخططات إجراءات العمل انطلاقا من النصوص

Extracting Business Process Models from Natural Language Texts

921   0   76   0 ( 0 )
 تاريخ النشر 2017
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

نقترح في هذه الأطروحة منهجية لتوليد مخططات الإجراءات من النصوص تحاكي عملية الترجمة الآلية, حيث تعتمد المنهجية المقترحة أسلوب الترجمة بالنقل على أساس دلالي, حيث ستتم في المرحلة الأولى معالجة النص لاستخلاص المفاهيم الأساسية فيه و العلاقات الدلالية بين هذه المفاهيم بما يشكل شبكة مفاهيم concept map للنص .


ملخص البحث
تُعنى هذه الأطروحة بتطوير منهجية لاستخلاص مخططات إجراءات العمل من النصوص الطبيعية باستخدام تقنيات الترجمة الآلية. تتضمن المنهجية مرحلتين رئيسيتين: الأولى هي تحليل النصوص الطبيعية لاستخلاص المفاهيم والعلاقات الدلالية بينها، والثانية هي توليد مخطط BPMN بناءً على التمثيل الدلالي المستخلص. تم اختبار المنهجية باستخدام مجموعة من النصوص والنماذج المستخلصة يدويًا، وأظهرت النتائج أن المنهجية المقترحة تفوقت على المنهجيات السابقة بنسبة تشابه وصلت إلى 81.21%.
قراءة نقدية
تُعد هذه الأطروحة خطوة مهمة نحو تحسين عملية نمذجة إجراءات العمل، إلا أنه يمكن تحسينها بشكل أكبر من خلال معالجة بعض النقاط. أولاً، تعتمد المنهجية بشكل كبير على دقة التحليل النحوي والصرفي، مما يجعلها عرضة للأخطاء في حال كانت هذه التحليلات غير دقيقة. ثانيًا، يمكن تحسين دقة فك غموض حالات الإحالة من خلال استخدام تقنيات تعلم الآلة المتقدمة. ثالثًا، يمكن توسيع نطاق الاختبارات لتشمل نصوصًا من لغات مختلفة لضمان عمومية المنهجية.
أسئلة حول البحث
  1. ما هي المراحل الرئيسية في المنهجية المقترحة لاستخلاص مخططات إجراءات العمل من النصوص؟

    تتضمن المنهجية مرحلتين رئيسيتين: الأولى هي تحليل النصوص الطبيعية لاستخلاص المفاهيم والعلاقات الدلالية بينها، والثانية هي توليد مخطط BPMN بناءً على التمثيل الدلالي المستخلص.

  2. ما هي نسبة التشابه التي حققتها المنهجية المقترحة مقارنة بالمنهجيات السابقة؟

    حققت المنهجية المقترحة نسبة تشابه وصلت إلى 81.21%، متفوقة على المنهجيات السابقة التي حققت نسبة تشابه بلغت 76.98%.

  3. ما هي التحديات الرئيسية التي تواجه المنهجية المقترحة؟

    التحديات الرئيسية تشمل دقة التحليل النحوي والصرفي، دقة فك غموض حالات الإحالة، وضرورة توسيع نطاق الاختبارات لتشمل نصوصًا من لغات مختلفة.

  4. كيف يمكن تحسين دقة فك غموض حالات الإحالة في المنهجية المقترحة؟

    يمكن تحسين دقة فك غموض حالات الإحالة من خلال استخدام تقنيات تعلم الآلة المتقدمة والاستفادة من المزيد من البيانات التدريبية لتحسين النموذج.


المراجع المستخدمة
Abney, S. (1996). Partial parsing via finite-state cascades. Natural Language Engineering, 2(4), 337-344
Achour, C. B. (1998). Guiding scenario authoring. In In: 8th European-Japanese Conference on Information Modelling and Knowledge Bases
Blumberg, R., & Atre, S. (2003). The problem with unstructured data. Dm Review, 13(42-49), 62
قيم البحث

اقرأ أيضاً

تم تطوير العديد من التقنيات لقياس احداثيات السمات المكانية على سطح الأرض بدقة هندسية عالية. تعتبر تقنية الليزر الجوي المحمول أحدث تقنية مستخدمة في هذا المجال وقد حققت انتشارا واسعا. تعمل هذه التقنية على مسح المعالم ضمن المشهد الطبيعي (سطح الأرض ، ا لأبنية ، الغطاء النباتي) ،من خلال عدة أصداء، يسجل كل صدى طول المدى بين المرسل والجسم العاكس الأول الذي تصادفه أي قياس المدى عن كافة المعالم فوق سطح الأرض، وتخزن هذه البيانات بشكل غمامة عشوائية كثيفة من النقاط ثلاثية الأبعاد بوقت قصير. لكن على الرغم من الدقة العالية للنقاط المسجلة، فإن إمكانية الفصل الآلي بين النقاط المنعكسة على السمات فوق سطح الأرض تعتبر تحدياً كبيراً. يتم تصنيف بيانات الليزر الجوي أولا من خلال الفصل بين سطح الأرض الطبيعية وبقية الاحزاء غير المنتمية لهذا السطح، ويجري لاحقاً فصل متقدم بين العمران والغطاء النباتي. وبما أن تقنية الليزر الجوي المحمول تعتبر تقنية واعدة ومهمة بالبيانات التي تقدمها، فإن هذا البحث يهتم بوضع آلية مؤتمتة للفصل بين السمات الطبيعية والصنعية (سطح الأرض، العمران، الغطاء النباتي) انطلاقاً من بيانات الليزر الجوي. تم في هذا البحث تطوير نموذج رقمي مؤتمت يعتمد خوارزمية التجميع التكراري بالاستناد الي تحليلات طبولوجيا الحواف، وذلك بهدف أتمتة تصنيف غمامة ليزري من النقاط وفصل السطح النهائي للأرض الطبيعية الذي يمثل سطح الأرض الطبيعية عن بقية الأجسام التي ستصنف لاحقا إلى صفين أساسيين (العمران والغطاء النباتي). سيتم أولا استنباط نقاط الارض من الحواف ضمن المشهد من خلال تطبيق مجموعة من تحليلات الجوار الهندسية مع استقراء للسطح الأولي للأرض الطبيعية. ثانياً سيتم تجميع وضم المزيدمن نقاط الغمامة إلى سطح الأرض الأولى، حيث تقوم الاجرائية على تجزئة السطح الأولي للأرض إلى عناصر هندسية مجمعة، وضم النقاط المجاورة لكل سمة مجمعة وفق معيار المنحنى العام لعذه السمة. استخدمت صمن الخوارزمية المطورة مجموعة من البارامترات العامة دون تخصيص لقيم هذه البارامترات لتلائم مشاهد محددة، وقد تم اختبار الخوارزمية المطورة على مجموعة واسعة من المعطيات لعدد من غمامات المسح الليزري الجوي، والتي كانت متاحة مجاناً على الموقع الإلكتروني لمجموعه واسعة من الباحثين وعلى نفس المعطيات وكانت نتائج اقتطاع سطح الأرض الطبيعية النهائي ذات موثوقية كبيرة.
تم في هذا البحث تحديد المحتوى الكلي للفينولات والفلافونوئيدات لقشور بعض الحمضيات السورية ودرست الفعالية الكلية المضادة للأكسدة لها , كما تم دراسة تأثير تغيير طريقة الاستخلاص على هذه الفعالية والمحتوى .
باستخدام كجن من الرموز المجمعة من الدول الأمريكية التي تحتوي على أقسام قانون الضرائب المسمى، نقوم بتدريب نصوص النصوص لوضع علامة على وثائق القانون الضريبي تلقائيا، وعلاوة على تحديد مصدر الإيرادات المرتبط (على سبيل المثال الدخل أو الممتلكات أو المبيعات ).بعد تقييم أداء المصنف في بيانات الاختبار المحتفظ بها، نطبقها على جثة تاريخية لتشريعات الدولة الأمريكية لاستخراج تدفق القوانين ذات الصلة على مر السنين في عام 1910 حتى عام 2010. نحن نوثقة أن المصنفين فعالة في الكوربوس التاريخية، على سبيل المثالمن خلال اكتشاف مؤسسات الضرائب ذات الدخل الشخصي الحكومي.يتم نشر النماذج المدربة مع رمز النسخ المتماثل في https://github.com/luyang521/tax-classification.
تقدمت نماذج اللغة المحددة مثل بيرت حالة الفن للعديد من مهام NLP. لغات غنية بالموارد، لدى المرء الاختيار بين عدد من النماذج الخاصة باللغة، في حين أن النماذج متعددة اللغات تستحق الدراسة أيضا. هذه النماذج معروفة جيدا لأدائها Croadlingual، لكنها أظهرت أي ضا أداء تنافسي في اللغة في بعض المهام. نحن نعتبر نماذج أحادية اللغات متعددة اللغات من منظور النصوص التاريخية، وعلى وجه الخصوص للنصوص المخصبة بالملاحظات الافتتاحية: كيف تتعامل نماذج اللغة مع المحتوى التاريخي والتحرير في هذه النصوص؟ نقدم مجموعة بيانات جديدة للتعرف على كيان جدد للهولندية بناء على تقارير الشركة الشرقية في الهند التابعة للشرحة في القرن 17 و 18th والتي تمتد مع الملاحظات التحريرية الحديثة. تؤكد تجاربنا مع نماذج اللغة المحددة مسبقا متعددة اللغات والهولندية القدرات crosslingual من النماذج متعددة اللغات مع إظهار أن جميع النماذج اللغوية يمكنها الاستفادة من البيانات المختلطة المختلطة. على وجه الخصوص، تدمج نماذج اللغة بنجاح ملاحظات لتنبؤ الكيانات في النصوص التاريخية. نجد أيضا أن النماذج متعددة اللغات تتفوق على نماذج أحادية الألوان على بياناتنا، ولكن هذا التفوق مرتبط بالمهمة في متناول اليد: تفقد النماذج متعددة اللغات مصلحتها عند مواجهتها بمهام أكثر دلالة.
جذبت الكشف التلقائي لمؤشر Myers-Briggs Type (MBTI) من منشورات قصيرة عناية ملحوظة في السنوات القليلة الماضية.أظهرت الدراسات الحديثة أن هذه مهمة صعبة للغاية، خاصة في بيانات تويتر شائعة الاستخدام.من الصعب أيضا الحصول على تسميات MBTI أيضا، حيث تتطلب الشر ح البشري علماء النفس المدربين، والطريقة التلقائية للحصول عليها من خلال استبيانات طويلة من قابلية الاستخدام المشكوك فيها للمهمة.في هذه الورقة، نقدم طريقة لجمع ملصقات MBTI موثوقة عبر أربعة أسئلة مختارة بعناية يمكن تطبيقها على أي نوع من البيانات النصية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا