يهدف التنقيب في النصوص بشكل عام إلى تحليل النصوص لاستخلاص معارف ذات جودة عالية من عدة مصادر نصية، والربط فيما بينها لتشكيل حقائق وفرضيات جديدة. تعد الأوراق البحثية التمثيل الأكثر اكتمالاً للمعرفة البشرية. وقد ساهمت حركة "الوصول المفتوح" إلى الأوراق البحثية، بالإضافة إلى ازدهار حقل التعلم الآلي في الآونة الأخيرة وتوفر الأدوات البرمجية والعتادية بكلف منخفضة نسبياً، بتداعي الحواجز المعيقة لعملية التنقيب في نصوص الأوراق البحثية.
في تتمة هذه الدراسة سنستعرض مجموعة من أساليب التنقيب في النصوص العلمية من حيث أهميتها، مجالات استخدامها، وطرق تطبيقها.
No English abstract
References used
Petr Knoth, and Phil Gooch, A. (22 September 2015). An Introduction to Text Mining Research Papers [PDF]. Retrieved from https://www.uksg.org/sites/uksg.org/files/Text-Mining-Research-Papers.pptx.pdf.
(Visser, W. T., and M. B. Wieling. "Sentence-based summarization of scientific documents." The design and implementation of an online available automatic summarizer. Report, last retrieved Nov. 29th (2007).
Qazvinian, Vahed, and Dragomir R. Radev. "Scientific paper summarization using citation summary networks." Proceedings of the 22nd International Conference on Computational Linguistics-Volume 1. Association for Computational Linguistics, 2008
, Horacio, and Francesco Ronzano. "Trainable citation-enhanced summarization of scientific articles." Proceedings of the Joint Workshop on Bibliometric-enhanced Information Retrieval and Natural Language Processing for Digital Libraries (BIRNDL). 2016
(Collins, Ed, Isabelle Augenstein, and Sebastian Riedel. "A Supervised Approach to Extractive Summarization of Scientific Papers." arXiv preprint arXiv:1706.03946 (2017)
Clark, Christopher Andreas, and Santosh Kumar Divvala. "Looking Beyond Text: Extracting Figures, Tables and Captions from Computer Science Papers." AAAI Workshop: Scholarly Big Data. 2015
Clark, Christopher, and Santosh Divvala. "PDFFigures 2.0: Mining figures from research papers." Digital Libraries (JCDL), 2016 IEEE/ACM Joint Conference on. IEEE, 2016
Valenzuela, Marco, Vu Ha, and Oren Etzioni. "Identifying Meaningful Citations." AAAI Workshop: Scholarly Big Data. 2015
“Citeomatic: Automated Literature Review”. The Allen Institute for Artificial Intelligence, 2017. Retrieved from http://allenai.org/semantic-scholar/citeomatic