Research output: Contribution to journal › Article › peer-review
Сравнительный анализ ассоциаций в корпусах социальных сетей на основе дистрибутивно-семантических моделей для русского языка. / Антипенко, Анна А.; Митрофанова, Ольга А.
In: International Journal of Open Information Technologies, Vol. 8, No. 1, 2020, p. 27-33.Research output: Contribution to journal › Article › peer-review
}
TY - JOUR
T1 - Сравнительный анализ ассоциаций в корпусах социальных сетей на основе дистрибутивно-семантических моделей для русского языка
AU - Антипенко, Анна А.
AU - Митрофанова, Ольга А.
PY - 2020
Y1 - 2020
N2 - Данная статья отражает результаты эксперимента по автоматическому извлечению ассоциативных связей из корпусов русскоязычных текстов социальных сетей Facebook и Pikabu с помощью алгоритмов и инструментов дистрибутивной семантики. Выбор материала социальных сетей обуславливается спецификой полилогического интернет-дискурса, совмещающего черты письменной и устной разговорной речи. Была высказана гипотеза о возможности воспроизведения методики ассоциативного эксперимента при работе с корпусами текстов социальных сетей на основе дистрибутивно-семантических моделей. Для лексем, выражающих ключевые понятия русскоязычной картины мира, автоматически извлечены ассоциаты с использованием нейросетевых архитектур Word2Vec (CBOW и Skip-gram). Был проведен сопоставительный анализ полученных данных и данных Русского ассоциативного словаря, Русской региональной ассоциативной базы данных (Сибирь и Дальний Восток) и Русского дистрибутивного тезауруса. Была разработана и реализована методика количественной оценки соответствий между результатами, полученными из разных источников. Была подтверждена специализация используемых словарных источников и дистрибутивно- семантических моделей в отношении парадигматических и синтагматических связей. Экспериментальные данные позволили провести лингвистический анализ языкового сознания современных пользователей социальных сетей и выявить тенденции в динамике его развития.
AB - Данная статья отражает результаты эксперимента по автоматическому извлечению ассоциативных связей из корпусов русскоязычных текстов социальных сетей Facebook и Pikabu с помощью алгоритмов и инструментов дистрибутивной семантики. Выбор материала социальных сетей обуславливается спецификой полилогического интернет-дискурса, совмещающего черты письменной и устной разговорной речи. Была высказана гипотеза о возможности воспроизведения методики ассоциативного эксперимента при работе с корпусами текстов социальных сетей на основе дистрибутивно-семантических моделей. Для лексем, выражающих ключевые понятия русскоязычной картины мира, автоматически извлечены ассоциаты с использованием нейросетевых архитектур Word2Vec (CBOW и Skip-gram). Был проведен сопоставительный анализ полученных данных и данных Русского ассоциативного словаря, Русской региональной ассоциативной базы данных (Сибирь и Дальний Восток) и Русского дистрибутивного тезауруса. Была разработана и реализована методика количественной оценки соответствий между результатами, полученными из разных источников. Была подтверждена специализация используемых словарных источников и дистрибутивно- семантических моделей в отношении парадигматических и синтагматических связей. Экспериментальные данные позволили провести лингвистический анализ языкового сознания современных пользователей социальных сетей и выявить тенденции в динамике его развития.
KW - дистрибутивная семантика
KW - Word2Vec
KW - ассоциативный эксперимент
KW - социальные сети
KW - Русский язык
KW - Distributional semantics
KW - corpus linguistics
KW - Social networks
KW - associative experiment
KW - language consciousness
KW - Russian
UR - http://www.injoit.org/index.php/j1/article/view/871
M3 - статья
VL - 8
SP - 27
EP - 33
JO - International Journal of Open Information Technologies
JF - International Journal of Open Information Technologies
SN - 2307-8162
IS - 1
ER -
ID: 51040151