Данная статья посвящена описанию проблем при сборе обучающего набора данных для создания диалогового агента для медицинской сферы. Авторами описывается собственный эксперимент, заключающийся в разработке стратегии выкачивания данных из сети интернет и последующего анализа слабоструктурированных текстов с целью выделения фактов и именованных сущностей. Итогом проведенного исследования является опубликованный датасет.
Переведенное названиеMINING OF TEXTUAL HEALTH INFORMATION: METHOD FOR COLLECTING AND LABELING SYMPTOMS OF DISEASES
Язык оригиналарусский
Страницы (с-по)12-19
ЖурналКомпьютерная лингвистика и вычислительные онтологии
Номер выпуска6
СостояниеОпубликовано - 2022

ID: 103630944