باستخدام كجن من الرموز المجمعة من الدول الأمريكية التي تحتوي على أقسام قانون الضرائب المسمى، نقوم بتدريب نصوص النصوص لوضع علامة على وثائق القانون الضريبي تلقائيا، وعلاوة على تحديد مصدر الإيرادات المرتبط (على سبيل المثال الدخل أو الممتلكات أو المبيعات).بعد تقييم أداء المصنف في بيانات الاختبار المحتفظ بها، نطبقها على جثة تاريخية لتشريعات الدولة الأمريكية لاستخراج تدفق القوانين ذات الصلة على مر السنين في عام 1910 حتى عام 2010. نحن نوثقة أن المصنفين فعالة في الكوربوس التاريخية، على سبيل المثالمن خلال اكتشاف مؤسسات الضرائب ذات الدخل الشخصي الحكومي.يتم نشر النماذج المدربة مع رمز النسخ المتماثل في https://github.com/luyang521/tax-classification.
Using a corpus of compiled codes from U.S. states containing labeled tax law sections, we train text classifiers to automatically tag tax-law documents and, further, to identify the associated revenue source (e.g. income, property, or sales). After evaluating classifier performance in held-out test data, we apply them to an historical corpus of U.S. state legislation to extract the flow of relevant laws over the years 1910 through 2010. We document that the classifiers are effective in the historical corpus, for example by automatically detecting establishments of state personal income taxes. The trained models with replication code are published at https://github.com/luyang521/tax-classification.
المراجع المستخدمة
https://aclanthology.org/
نقترح في هذه الأطروحة منهجية لتوليد مخططات الإجراءات من النصوص تحاكي عملية الترجمة الآلية, حيث تعتمد المنهجية المقترحة أسلوب الترجمة بالنقل على أساس دلالي, حيث ستتم في المرحلة الأولى معالجة النص لاستخلاص المفاهيم الأساسية فيه و العلاقات الدلالية بين
هذه المقالة تحوي ترجمة وتلخيص وتوضيح للمذكور في الورقة البحثية المذكور اسمها أعلاه والموجودة في https://annals-csis.org/Volume_8/pliks/221.pdf , والتي تقوم باستخراج المعلومات الدلالية المهمة الموجودة في الوثائق والملفات والأوراق البحثية .
جذبت الكشف التلقائي لمؤشر Myers-Briggs Type (MBTI) من منشورات قصيرة عناية ملحوظة في السنوات القليلة الماضية.أظهرت الدراسات الحديثة أن هذه مهمة صعبة للغاية، خاصة في بيانات تويتر شائعة الاستخدام.من الصعب أيضا الحصول على تسميات MBTI أيضا، حيث تتطلب الشر
هدفت هذه الدراسة إلى بيان اختصاصات رئيس الجمهورية، و ذلك من خلال تحليل النصوص الدستورية المانحة لتلك الاختصاصات في محاولة لتفسير إرادة المشرع الدستوري السوري فيما ذهب إليه عندما منح رئيس الجمهورية تلك الاختصاصات.
يؤدي استخراج الموجات القصيرة تلقائيا من المستندات العلمية إلى تمثيل موجز قيم يمكن أن يفهم البشر ويمكنهم معالجة الآلات للمهام، مثل استرجاع المعلومات، تجميع المقالات وتصنيف المادة.تهتم هذه الورقة بأجزاء مقالة علمية يجب أن تعطى كمدخلات لطرق استخراج الحر