Сравнительный анализ ассоциаций в корпусах социальных сетей на основе дистрибутивно-семантических моделей для русского языка

Анна А. Антипенко, Ольга А. Митрофанова

Результат исследований: Научные публикации в периодических изданияхстатья

11 Загрузки (Pure)

Аннотация

Данная статья отражает результаты эксперимента по автоматическому извлечению ассоциативных связей из корпусов русскоязычных текстов социальных сетей Facebook и Pikabu с помощью алгоритмов и инструментов дистрибутивной семантики. Выбор материала социальных сетей обуславливается спецификой полилогического интернет-дискурса, совмещающего черты письменной и устной разговорной речи. Была высказана гипотеза о возможности воспроизведения методики ассоциативного эксперимента при работе с корпусами текстов социальных сетей на основе дистрибутивно-семантических моделей. Для лексем, выражающих ключевые понятия русскоязычной картины мира, автоматически извлечены ассоциаты с использованием нейросетевых архитектур Word2Vec (CBOW и Skip-gram). Был проведен сопоставительный анализ полученных данных и данных Русского ассоциативного словаря, Русской региональной ассоциативной базы данных (Сибирь и Дальний Восток) и Русского дистрибутивного тезауруса. Была разработана и реализована методика количественной оценки соответствий между результатами, полученными из разных источников. Была подтверждена специализация используемых словарных источников и дистрибутивно- семантических моделей в отношении парадигматических и синтагматических связей. Экспериментальные данные позволили провести лингвистический анализ языкового сознания современных пользователей социальных сетей и выявить тенденции в динамике его развития.
Переведенное названиеComparative Study of Word Associations in Social Networks Corpora by means of Distributional Semantics Models for Russian
Язык оригиналарусский
Страницы (с-по)27-33
ЖурналInternational Journal of Open Information Technologies
Том8
Номер выпуска1
СостояниеОпубликовано - 2020

Ключевые слова

  • дистрибутивная семантика
  • Word2Vec
  • ассоциативный эксперимент
  • социальные сети
  • Русский язык

Fingerprint Подробные сведения о темах исследования «Сравнительный анализ ассоциаций в корпусах социальных сетей на основе дистрибутивно-семантических моделей для русского языка». Вместе они формируют уникальный семантический отпечаток (fingerprint).

Цитировать