This article explores various text preprocessing techniques for the extraction of keywords and key phrases. It delves into methods such as text lemmatization, stop-word removal, and number removal, comparing their efficacy with unprocessed text in keyword extraction. Evaluation is based on the ability of keyword sets to retrieve relevant news articles from search engine queries. The study employs multiple keyword extraction tools for comprehensive analysis. © The Author(s), under exclusive license to Springer Nature Switzerland AG 2026.
Язык оригиналаАнглийский
Название основной публикации Internet and Modern Society. Human-Computer Communication
ИздательSpringer Nature
Страницы105-112
Число страниц8
ISBN (печатное издание)9783031961762
DOI
СостояниеОпубликовано - 2026
СобытиеXXVII Международная объединенная научная конференция «Интернет и современное общество» - ИТМО-Университет, Санкт-Петербург, Российская Федерация
Продолжительность: 24 июн 202426 июн 2024
Номер конференции: XXVII
https://ims.itmo.ru
https://ims.itmo.ru/
https://ims.itmo.ru

Серия публикаций

НазваниеCommunications in Computer and Information Science
Том2534 CCIS

конференция

конференцияXXVII Международная объединенная научная конференция «Интернет и современное общество»
Сокращенное названиеIMS 2024
Страна/TерриторияРоссийская Федерация
ГородСанкт-Петербург
Период24/06/2426/06/24
Сайт в сети Internet

ID: 151442754