باستخدام كجن من الرموز المجمعة من الدول الأمريكية التي تحتوي على أقسام قانون الضرائب المسمى، نقوم بتدريب نصوص النصوص لوضع علامة على وثائق القانون الضريبي تلقائيا، وعلاوة على تحديد مصدر الإيرادات المرتبط (على سبيل المثال الدخل أو الممتلكات أو المبيعات).بعد تقييم أداء المصنف في بيانات الاختبار المحتفظ بها، نطبقها على جثة تاريخية لتشريعات الدولة الأمريكية لاستخراج تدفق القوانين ذات الصلة على مر السنين في عام 1910 حتى عام 2010. نحن نوثقة أن المصنفين فعالة في الكوربوس التاريخية، على سبيل المثالمن خلال اكتشاف مؤسسات الضرائب ذات الدخل الشخصي الحكومي.يتم نشر النماذج المدربة مع رمز النسخ المتماثل في https://github.com/luyang521/tax-classification.
Using a corpus of compiled codes from U.S. states containing labeled tax law sections, we train text classifiers to automatically tag tax-law documents and, further, to identify the associated revenue source (e.g. income, property, or sales). After evaluating classifier performance in held-out test data, we apply them to an historical corpus of U.S. state legislation to extract the flow of relevant laws over the years 1910 through 2010. We document that the classifiers are effective in the historical corpus, for example by automatically detecting establishments of state personal income taxes. The trained models with replication code are published at https://github.com/luyang521/tax-classification.
References used
In our work, we chose to follow semantic transfer based approach. Our approach consists of two main phases. The first phase, Natural Language Analysis phase, aims to analyze the text and extract the required knowledge from it. In addition to the synt
هذه المقالة تحوي ترجمة وتلخيص وتوضيح للمذكور في الورقة البحثية المذكور اسمها أعلاه والموجودة في https://annals-csis.org/Volume_8/pliks/221.pdf , والتي تقوم باستخراج المعلومات الدلالية المهمة الموجودة في الوثائق والملفات والأوراق البحثية .
Automatic detection of the Myers-Briggs Type Indicator (MBTI) from short posts attracted noticeable attention in the last few years. Recent studies showed that this is quite a difficult task, especially on commonly used Twitter data. Obtaining MBTI l
In this research I’m going to highlight these powers by analyzing the constitutional
provisions entitling the president such powers trying to ascertain the will of the
Syrian legislator when he gave the president such powers.
Automatically extracting keyphrases from scholarly documents leads to a valuable concise representation that humans can understand and machines can process for tasks, such as information retrieval, article clustering and article classification. This