METHODOLOGY FOR AUTOMATED ASSESSMENT OF THEMATIC RELATEDNESS OF SCIENTIFIC PUBLICATIONS USING SEMANTIC ANALYSIS

Authors

  • Oleksandr Ivaniuk

DOI:

https://doi.org/10.26906/SUNZ.2025.3.096

Keywords:

thematic relatedness, embeddings, cosine similarity, reviewer assignment, dissertations, researcher profiles, OpenAI text-embedding-3-large, UMAP, DBSCAN, NDCG, Hit@k, recommender systems, text analytics, machine learning

Abstract

Relevance. Automated assessment of thematic relatedness between doctoral theses and profiles of potential experts is needed for transparent and reproducible selection of official reviewers and composition of one -time specialized councils; the open NAQA.Svr data make such assessment technically feasible. Object of research: methods and tools for constructing semantic profiles of theses and researchers and for ranking them in a shared vector space. Purpose of the article. To develop and empirically validate a methodology for automated assessment of thematic relatedness of scientific publications based on semantic analysis. Research results. We assembled a corpus of 259 theses, 662 researcher profiles, and 3345 publications; texts were normalized, and publication titles were standardized using a large language model. Semantic representations were obtained with an OpenAI model. We compared two variants of thesis profiling (full description; keywords only) and two variants of researcher profiling (by publications; by keywords). Quality was evaluated against actual reviewer assignments using the metrics NDCG, Hit@k, and NDCG-lift. The best results were consistently achieved by the combination “thesis by keywords” and “researcher by publications,” which yields the highest top-rank accuracy and the largest gain over random selection. Conclusions. Combining a keyword-based thesis profile with a publication-aggregated researcher profile provides the best balance of accuracy and robustness and is practically suitable for preliminary reviewer selection. The proposed methodology is reproducible, scalable, and aligned with open data; promising directions include incorporating temporal weights of publications, handling bilingual terminol ogy, and accounting for procedural constraints in final assignments.

Downloads

Download data is not yet available.

References

1. Кабінет Міністрів України. (2022). Про затвердження Порядку присудження ступеня доктора філософії та скасування рішення разової спеціалізованої вченої ради закладу вищої освіти, наукової установи про присудження ступеня доктора філософії. Available at: https://zakon.rada.gov.ua/laws/show/44-2022-%D0%BF#Text

2. Національне агентство із забезпечення якості вищої освіти. (2024). Порядок функціонування інформаційної системи «NAQA.Svr» (затверджено 30.08.2022; зі змінами від 19.11.2024). Available at: https://naqa.gov.ua/wpcontent/uploads/2025/04...8F-NAQA.Svr_22.04.2025.pdf

3. Національне агентство із забезпечення якості вищої освіти. (2020). Рекомендації для експертів Національного агентства стосовно акредитації освітніх програм третього рівня вищої освіти (додаток до «Методичних рекомендацій для експертів Національного агентства щодо застосування Критеріїв оцінювання якості освітньої програми»). Available at: https://naqa.gov.ua/wp-content/uploads/2020/02....pdf

4. Міністерство освіти і науки України. (2024). Про затвердження Положення про акредитацію освітніх програм, за якими здійснюється підготовка здобувачів вищої освіти (Наказ № 686; зареєстровано в Міністерстві юстиції України 04.07.2024 № 1013/42358). Available at: https://zakon.rada.gov.ua/laws/show/z1013-24#Text

5. Національне агентство із забезпечення якості вищої освіти. (2019). Методичні рекомендації для експертів Національного агентства щодо застосування Критеріїв оцінювання якості освітньої програми. Available at: https://bit.ly/4gG5Yki

6. Zhao, X., & Zhang, Y. (2022). Reviewer assignment algorithms for peer review automation: A survey. Information Processing & Management, 59(5), 103028. https://doi.org/10.1016/j.ipm.2022.103028 DOI: https://doi.org/10.1016/j.ipm.2022.103028

7. Aksoy, M., Yanik, S., & Amasyali, M. F. (2023). Reviewer assignment problem: A systematic review of the literature. Journal of Artificial Intelligence Research, 76, 761–827. https://doi.org/10.1613/JAIR.1.14318 DOI: https://doi.org/10.1613/jair.1.14318

8. Tan, S., Duan, Z., Zhao, S., Chen, J., & Zhang, Y. (2021). Improved reviewer assignment based on both word and semantic features. Information Retrieval Journal, 24(3), 175–204. https://doi.org/10.1007/s10791-021-09390-8 DOI: https://doi.org/10.1007/s10791-021-09390-8

9. Price, S., & Flach, P. (2017). Computational support for academic peer review: A perspective from artificial intelligence. Communications of the ACM, 60(3), 70–79. https://doi.org/10.1145/2979672 DOI: https://doi.org/10.1145/2979672

10. Ogunleye, O., Ifebanjo, T., Abiodun, T. N., & Adebiyi, A. A. (2017). Proposed framework for a paper-reviewer assignment system using Word2Vec. Proc. of the 4th Covenant University Conf. on E-Governance in Nigeria (CUCEN 2017). Covenant University Repository. Available at: https://www.researchgate.net/publication/322356955_Covenant_University_EGovernance_Conference_CUCEN_2017

11. Mimno, D., & McCallum, A. (2007). Expertise modeling for matching papers with reviewers. Proceedings of the 13th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, рp. 500–509. https://doi.org/10.1145/1281192.1281247 DOI: https://doi.org/10.1145/1281192.1281247

12. Штовба, С. Д., Петричко, М. В. (2024). Експрес-підбір опонентів для разових рад із захисту PhD-дисертацій. Ukrainian Journal of Information Systems and Data Science, 2(1), 41–54. https://doi.org/10.31558/2786-9482.2024.1.4 DOI: https://doi.org/10.31558/2786-9482.2024.1.4

Published

2025-09-30