В статье описываются экспериментальные исследования устойчивости словосочетаний и способы их количественной оценки в синхронии и диахронии. Количественная оценка лингвистических данных и математические методы их обработки представляют большой интерес для лингвистов. Богатым источником статистической информации являются корпуса текстов. Однако существует проблема верификации и достоверности данных, получаемых на основе корпусов. Для реализации потенциальных возможностей корпус должен удовлетворять таким требованиям, как репрезентативность (объем) и сбалансированность (качество).
Original languageRussian
Title of host publicationКомпьютерная лингвистика и вычислительные онтологии: сборник научных статей
PublisherНИУ ИТМО
Pages82-93
ISBN (Print)978-5-7577-0504-0
StatePublished - 2015
Externally publishedYes

ID: 4733606