Результаты исследований: Публикации в книгах, отчётах, сборниках, трудах конференций › статья в сборнике
Лингвистика больших корпусов. / Захаров, В. П.
Компьютерная лингвистика и вычислительные онтологии: сборник научных статей. НИУ ИТМО, 2015. стр. 82-93.Результаты исследований: Публикации в книгах, отчётах, сборниках, трудах конференций › статья в сборнике
}
TY - CHAP
T1 - Лингвистика больших корпусов
AU - Захаров, В. П.
PY - 2015
Y1 - 2015
N2 - В статье описываются экспериментальные исследования устойчивости словосочетаний и способы их количественной оценки в синхронии и диахронии. Количественная оценка лингвистических данных и математические методы их обработки представляют большой интерес для лингвистов. Богатым источником статистической информации являются корпуса текстов. Однако существует проблема верификации и достоверности данных, получаемых на основе корпусов. Для реализации потенциальных возможностей корпус должен удовлетворять таким требованиям, как репрезентативность (объем) и сбалансированность (качество).
AB - В статье описываются экспериментальные исследования устойчивости словосочетаний и способы их количественной оценки в синхронии и диахронии. Количественная оценка лингвистических данных и математические методы их обработки представляют большой интерес для лингвистов. Богатым источником статистической информации являются корпуса текстов. Однако существует проблема верификации и достоверности данных, получаемых на основе корпусов. Для реализации потенциальных возможностей корпус должен удовлетворять таким требованиям, как репрезентативность (объем) и сбалансированность (качество).
KW - количественные методы в лингвистике
KW - большие данные
KW - корпусы текстов
KW - устойчивые словосочетания
KW - меры ассоциации
KW - диахронические исследования
M3 - статья в сборнике
SN - 978-5-7577-0504-0
SP - 82
EP - 93
BT - Компьютерная лингвистика и вычислительные онтологии: сборник научных статей
PB - НИУ ИТМО
ER -
ID: 4733606