ترغب بنشر مسار تعليمي؟ اضغط هنا

دراسة و تحليل طرق ترقيم مستندات XML

Study And Analysis Of Labeling Schemes For XML Document

833   1   111   0 ( 0 )
 تاريخ النشر 2014
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

سنقوم من خلال هذا البحث بالتعرف على طرق الترقيم، و تقسيمها إلى أربع فئات أساسية و هي Prefix- Based Labeling ،Range Based Labeling Scheme Vector Based ،Multiplication Based Labeling Schemes،Schemes Labeling Schemes. و ضمن هذه الفئات سنتطرق لأهم طرق الترقيم المعروفة، و نوضح محاسن و مساوئ كل طريقة. و سنبحث عن العلاقات التي يمكن أن تحددها كل منها، و من خلال هذه العلاقات سنتمكن من تحديد جدوى هذه الطرق من ناحية التخزين و سرعة الاستعلام و تعديل المستند. كما أننا سنجري دراسة تجريبية على عدة مستندات XML بأحجام مختلفة، و نقارن بين ترقيمها باستخدام ثلاث طرق و هي V-Containment ،ORDPath،Traversal Order, و ذلك من ناحية زمن الترقيم و مساحة التخزين التي يتطلبها الترقيم.


ملخص البحث
تتناول هذه الدراسة طرق ترقيم مستندات XML، حيث تعتبر مستندات XML من أهم التقنيات الحديثة لتخزين البيانات وتبادلها في التطبيقات المختلفة. يهدف البحث إلى دراسة طرق تخزين مستندات XML، ولغات الاستعلام المستخدمة معها مثل XPath وXQuery. يتم تقسيم طرق الترقيم إلى أربع فئات رئيسية: الترقيم باستخدام المجالات، الترقيم باستخدام البادئة، الترقيم باستخدام الجداء، والترقيم باستخدام الشعاع. يركز البحث على توضيح محاسن ومساوئ كل طريقة، وتحديد العلاقات التي يمكن استنتاجها من الترقيم، مثل علاقة سلف-سليل، علاقة أب-ابن، وعلاقة أشقاء. كما تم إجراء دراسة تجريبية على مستندات بأحجام مختلفة لمقارنة زمن الترقيم ومساحة التخزين اللازمة لكل طريقة. أظهرت النتائج أن طريقة Traversal Order تستغرق زمنًا أكبر ولكنها تحتاج إلى مساحة تخزين أقل، بينما كانت نتائج OrdPath وV-Containment متشابهة إلى حد ما.
قراءة نقدية
دراسة نقدية: تعتبر هذه الدراسة شاملة ومفيدة في مجال ترقيم مستندات XML، حيث تقدم تصنيفًا واضحًا لطرق الترقيم وتوضح محاسن ومساوئ كل منها. ومع ذلك، يمكن تحسين الدراسة من خلال تضمين المزيد من الأمثلة العملية والتطبيقات الواقعية لطرق الترقيم المختلفة. كما يمكن التركيز أكثر على تحليل الأداء في بيئات مختلفة ومع مستندات ذات تعقيد أعلى. بالإضافة إلى ذلك، يمكن تحسين الدراسة من خلال تضمين المزيد من التفاصيل حول كيفية تأثير الترقيم على أداء الاستعلامات في التطبيقات الحقيقية.
أسئلة حول البحث
  1. ما هي الفئات الرئيسية لطرق ترقيم مستندات XML التي تم دراستها في البحث؟

    تم تقسيم طرق ترقيم مستندات XML إلى أربع فئات رئيسية: الترقيم باستخدام المجالات، الترقيم باستخدام البادئة، الترقيم باستخدام الجداء، والترقيم باستخدام الشعاع.

  2. ما هي العلاقات التي يمكن تحديدها من خلال طرق الترقيم المختلفة؟

    يمكن تحديد عدة علاقات من خلال طرق الترقيم المختلفة، مثل علاقة سلف-سليل، علاقة أب-ابن، وعلاقة أشقاء.

  3. ما هي نتائج الدراسة التجريبية فيما يتعلق بزمن الترقيم ومساحة التخزين؟

    أظهرت الدراسة التجريبية أن طريقة Traversal Order تستغرق زمنًا أكبر ولكنها تحتاج إلى مساحة تخزين أقل، بينما كانت نتائج OrdPath وV-Containment متشابهة إلى حد ما.

  4. ما هي لغات الاستعلام المستخدمة مع مستندات XML والتي تم دراستها في البحث؟

    تم دراسة لغتي الاستعلام XPath وXQuery في البحث، وهما تستخدمان للاستعلام من مستندات XML.


المراجع المستخدمة
Fomichev A., Grinev, M., and Kuznetsov, "Sedna: A native XML DBMS",2006
Sh. Pal, I. Cseri, O. Seeliger, M. Rys , G. Schaller , Wei Yu , D. Tomic , Adrian Baras , Brandon B., Denis Ch. , Eugene K. , “XQuery implementation in a relational database system”, 2005
Alin Deutsch, Mary F. Fern´andez, and Dan Suciu. "Storing Semistructured Data with STORED, 1999
قيم البحث

اقرأ أيضاً

في هذا البحث سنقوم باقتراح طريقة ترقيم جديدة Grouped OrdPath تعتمد على طريقةOrdPath المعروفة لتحسين أدائها و أهم اهداف البحث هو الحصول على بنية تخزين ذات حجم صغير. سنقوم بتجميع عقد المستند على شكل أشجار فرعية (العقدة الأب و الأبناء) ماعدا العقدة الجذر. ثم نقوم بترقيم هذه الأشجار و ترقيم عقد كل شجرة أيضاً ترقيماً داخلياً لتمييز تسلسل عقد الشجرة الواحدة.
يركز هذا البحث على دراسة علاقة التعميم و التخصيص الضبابية و الإحاطة بكل إضافة القيود المرافقة لها في نموذج الكيانات و الارتباطات الموسع EER الضبابي. لذلك نقدم طريقة لتحويل علاقة التعميم و التخصيص الضبابية و القيود المرافقة لها إلى لغة توصيف البي انات XML Schema. و أخيرا، نقترح مجموعة من التوسيعات ل XML Schema. بحيث تدعم تمثيل علاقة التعميم و التخصيص و القيود المرافقة لها بمستوى عال من التجريد.
تفتقر الأبحاث الحديثة باستخدام نماذج اللغة المدربة مسبقا لمهمة تلخيص المستندات متعددة الوثائق إلى تحقيق عميق في الحالات الخاطئة المحتملة وتطبيقها المحتمل على اللغات الأخرى.في هذا العمل، نطبق نموذج لغة مدرب مسبقا (BART) لمهمة تلخيص متعدد الوثائق (MDS) باستخدام كل من الضبط الدقيق ودون ضبط جيد.نحن نستخدم مجموعات بيانات اللغة الإنجليزية ومجموعة بيانات ألمانية واحدة لهذه الدراسة.أولا، نقوم بإعادة إنتاج ملخصات متعددة الوثائق باللغة الإنجليزية باتباع إحدى الدراسات الحديثة.بعد ذلك، نعرض لقابلية تطبيق النموذج إلى اللغة الألمانية من خلال تحقيق أداء حديثة على MDS الألمانية.نقوم بإجراء تحليل خطأ متعمق للنهج التالي لكلتا اللغتين، مما يؤدي إلى تحديد معظم الأخطاء البارزة، من الحقائق الصادقة وتعليم الموضوع، وقياس مقدار الاستقصاء.
إن الهدف الرئيس من هذه الدراسة هو تسليط الضوء و تحليل الأذيات الصدرية المختلفة أثناء النزاعات العسكرية. تمت دراسة و تحليل الملفات السريرية لـ (542) إصابة بأذيات صدرية أثناء فترة البحث. 91.9% من المرضى كانوا ذكوراً، تراوحت أعمار المصابين بين (3 – 75 ) عاماً، 88.1% منهم كانوا في الأعمار بين (20 – 40) عاماً. 71 إصابة إسعافية شديدة (13%) أدخلت مباشرة إلى غرفة العمليات، أما العدد الباقي من المرضى فقد أجريت لهم استقصاءات تشخيصية مختلفة، لعب التصوير الطبقي المحوري دوراً هاماً في تشخيص الأذيات الصدرية و قد أجري في 62.2% من الإصابات. 92.8% من المرضى تعرضوا لأذيات صدر نافذة بسبب الطلق الناري مع أو بدون الشظايا و الصواريخ. من بين الأذيات الحاصلة كان تكدم الرئة هو الغالب بنسبة 31.9% تلاه تدمي و استرواح الجنب بنسبة 29.15%، تمزق الرئة 14.39% 77 حالة (13.2%) من الجرحى أصيبوا بكسور أضلاع، 3 منهم (3.89%) شخص لديهم صدر سائب. تمزقات الحجاب حدثت لدى 6.45% من الجرحى ، الأذيات المشتركة شخصت لدى 61.07% من الحالات ، أغلبها 46.2% كانت أذيات في البطن ، 39.27% كانت أذيات رأس و عنق.
تستخدم مصطلح خطط الترجغ على نطاق واسع في معالجة اللغة الطبيعية واسترجاع المعلومات. على وجه الخصوص، فإن وزن المصطلح هو الأساس لاستخراج الكلمات الرئيسية. ومع ذلك، هناك عدد قليل نسبيا دراسات التقييم التي ألقت الضوء على نقاط القوة وأوجه القصور في كل مخطط للتوازن. في الواقع، في معظم الحالات، يلجأ الباحثون والممارسون في معظم الحالات إلى TF-IDF المعروفة بشكل افتراضي، على الرغم من وجود بدائل أخرى مناسبة، بما في ذلك النماذج القائمة على الرسم البياني. في هذه الورقة، نقوم بإجراء مقارنة تجريبية وشاملة واسعة النطاق من كل من أساليب الترجيح الإحصائية والرصاص القائمة على الرسم البياني في سياق استخراج الكلمات الرئيسية. يكشف تحليلنا عن بعض النتائج المثيرة للاهتمام مثل مزايا الخصوصية المعروفة الأقل شهرة فيما يتعلق ب TF-IDF، أو الاختلافات النوعية بين الأساليب الإحصائية والرصاص القائمة على الرسم البياني. وأخيرا، بناء على نتائجنا نناقشها واستنباد بعض الاقتراحات للممارسين. تعد شفرة المصدر لإعادة إنتاج نتائجنا التجريبية، بما في ذلك مكتبة استخراج الكلمات الرئيسية، متوفرة في المستودع التالي: https://github.com/asahi417/kex
التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا