Research output: Chapter in Book/Report/Conference proceeding › Conference contribution › Research › peer-review
Тематическое моделирование русскоязычных текстов с опорой на леммы и лексические конструкции. / Митрофанова, Ольга Александровна; Седова, Анастасия Георгиевна.
Компьютерная лингвистика и вычислительные онтологии. Выпуск 1 : Труды XX Международной объединенной научной конференции «Интернет и современное общество», IMS-2017, Санкт-Петербург, 21 – 23 июня 2017 г. Сборник научных статей. НИУ ИТМО, 2017. p. 132-144.Research output: Chapter in Book/Report/Conference proceeding › Conference contribution › Research › peer-review
}
TY - GEN
T1 - Тематическое моделирование русскоязычных текстов с опорой на леммы и лексические конструкции
AU - Митрофанова, Ольга Александровна
AU - Седова, Анастасия Георгиевна
N1 - Conference code: XX
PY - 2017
Y1 - 2017
N2 - Исследование посвящено усовершенствованию методоввероятностного тематического моделирования, направленных навыявление скрытых взаимосвязей между словами, документами итемами в текстовых коллекциях. В большинстве тематических моделейтемы представлены исключительно униграммами, что в некоторыхслучаях влечет за собой ухудшение точности и повышает сложностьсодержательной интерпретации выделяемых тем. Нами предложенновый алгоритм на основе метода LDA, позволяющий автоматическивыделять в корпусе словосочетания, состоящие из двух слов, идобавлять их в тематические модели. В статье изложена работаалгоритма и приведены результаты его применения в автоматическойобработке корпусов специальных текстов.
AB - Исследование посвящено усовершенствованию методоввероятностного тематического моделирования, направленных навыявление скрытых взаимосвязей между словами, документами итемами в текстовых коллекциях. В большинстве тематических моделейтемы представлены исключительно униграммами, что в некоторыхслучаях влечет за собой ухудшение точности и повышает сложностьсодержательной интерпретации выделяемых тем. Нами предложенновый алгоритм на основе метода LDA, позволяющий автоматическивыделять в корпусе словосочетания, состоящие из двух слов, идобавлять их в тематические модели. В статье изложена работаалгоритма и приведены результаты его применения в автоматическойобработке корпусов специальных текстов.
UR - https://openbooks.itmo.ru/ru/file/6518/6518.pdf
M3 - статья в сборнике материалов конференции
SP - 132
EP - 144
BT - Компьютерная лингвистика и вычислительные онтологии. Выпуск 1
PB - НИУ ИТМО
T2 - XX Международная объединенная научная конференция «Интернет и современное общество»
Y2 - 21 June 2017 through 23 June 2017
ER -
ID: 9328963