غالبا ما يؤدي الكتاب إلى إعادة المواد من النصوص الموجودة عند تأليف مستندات جديدة. لأن معظم المستندات لديها أكثر من مصدر واحد، لا يمكننا تتبع هذه الاتصالات باستخدام نماذج فقط من التشابه على مستوى المستند. بدلا من ذلك، تعتبر هذه الورقة أساليب الكشف عن إعادة استخدام النص المحلي (LTRD)، والكشف عن المناطق المترجمة من نص مشابه من المعالجات أو المعلنة المضمنة بشكل غير مرتبط بطريقة غير ذات صلة. في تجارب مكثفة، ندرس الأداء النسبي لأربعة فصول من النماذج العصبية وحقيبة النماذج على ثلاثة مهام LTRD - اكتشاف الانتحال، واستخدام النمذجة للصحفيين من النشرات الصحفية، وتحديد استشهاد العلماء في الأوراق السابقة. نقوم بإجراء تقييمات على ثلاث مجموعات بيانات حالية ومجموعة بيانات جديدة ومتاحة للجمهور. تلقيت النتائج الخاصة بنا الضوء على عدد من الأسئلة غير المستكشفة سابقا في دراسة LTRD، بما في ذلك أهمية دمج السياق على مستوى المستند للتنبؤات، وتطبيق النماذج العصبية على الرف المحددة على مهام التشابه النصي الدلالي كما كشف عن الصياغة، والمفاضلات بين كيس من الكلمات الأكثر كفاءة والنماذج العصبية القائمة على الميزات وأبطأ النماذج العصبية الزوجية.
Writers often repurpose material from existing texts when composing new documents. Because most documents have more than one source, we cannot trace these connections using only models of document-level similarity. Instead, this paper considers methods for local text reuse detection (LTRD), detecting localized regions of lexically or semantically similar text embedded in otherwise unrelated material. In extensive experiments, we study the relative performance of four classes of neural and bag-of-words models on three LTRD tasks -- detecting plagiarism, modeling journalists' use of press releases, and identifying scientists' citation of earlier papers. We conduct evaluations on three existing datasets and a new, publicly-available citation localization dataset. Our findings shed light on a number of previously-unexplored questions in the study of LTRD, including the importance of incorporating document-level context for predictions, the applicability of of-the-shelf neural models pretrained on general'' semantic textual similarity tasks such as paraphrase detection, and the trade-offs between more efficient bag-of-words and feature-based neural models and slower pairwise neural models.
المراجع المستخدمة
https://aclanthology.org/
تصف هذه الورقة محاولة لإعادة إنتاج تجربة سابقة، التي أجرتها سابقا من قبل المؤلف، والتي تقارن نصوص NLG التحوط وغير المتحركة كجزء من التحدي المشترك المتصنع.كان جهد الاستنساخ هذا قادرا فقط على تكرار النتائج جزئيا من الدراسة الأصلية.يقترح المحللون من جهد
يتناول البحث طريقة إعادة التأهيل بإضافة البيتومين الرغوي و هي أحد الطرق الحديثة نسبيا
في هذا المجال و لم يتم استخدامها في سورية بعد بسبب عدم توافر التجهيزات المخبرية
اللازمة لتقييم أداء طبقات الرصف المعاد تأهيلها، فكان هدف البحث تطوير نموذج رياضي
تعتبر العمليات الصناعية المولّد الأساسي للنفايات، و قد ساهم الوعي البيئي المتزايد في التركيز على المخاوف المتعلقة بمسألة رمي النفايات. و تعتبر إدارة هذه النفايات أحد المخاوف البيئية الرئيسية في العالم، و مع قلة المساحات اللازمة و المستخدمة لطمر النفا
أدت الزيادة الكبيرة في حجم نفايات الهدم البيتونية و تأثيرها على البيئة إلى إعادة النظر في استخدام ركام الهدم البيتوني كبديل جزئي أو كلي عن الحصويات الطبيعية، و العمل على إنتاج بيتون جديد يحقق الخواص المطلوبة لاستخدامه في المنشآت الهندسية. مع التنويه
أثار التوسع العمراني المتسارع في معظم الدول، و الحاجة إلى أبنية جديدة و بمتطلبات جديدة تتوافق مع النمو السكاني مشكلة كبيرة تتعلق بتأمين المواد الأولية اللازمة لإنتاج بيتون هذه الأبنية، و خصوصاً الحصويات التي تشكل الحجم الأكبر من هذه المواد. كما طرح خ