В статье описываются экспериментальные исследования устойчивости словосочетаний и способы их количественной оценки в синхронии и диахронии. Количественная оценка лингвистических данных и математические методы их обработки представляют большой интерес для лингвистов. Богатым источником статистической информации являются корпуса текстов. Однако существует проблема верификации и достоверности данных, получаемых на основе корпусов. Для реализации потенциальных возможностей корпус должен удовлетворять таким требованиям, как репрезентативность (объем) и сбалансированность (качество).
Язык оригиналарусский
Название основной публикацииКомпьютерная лингвистика и вычислительные онтологии: сборник научных статей
ИздательНИУ ИТМО
Страницы82-93
ISBN (печатное издание)978-5-7577-0504-0
СостояниеОпубликовано - 2015
Опубликовано для внешнего пользованияДа

    Области исследований

  • количественные методы в лингвистике, большие данные, корпусы текстов, устойчивые словосочетания, меры ассоциации, диахронические исследования

ID: 4733606