Корпусно-ориентированный подход к построению тезаурусов и онтологий. / Захаров, В.П.
Структурная и прикладная лингвистика.. Издательство Санкт-Петербургского университета, 2015. p. 123-141.Research output: Chapter in Book/Report/Conference proceeding › Article in an anthology › Research
}
TY - CHAP
T1 - Корпусно-ориентированный подход к построению тезаурусов и онтологий
AU - Захаров, В.П.
PY - 2015
Y1 - 2015
N2 - Статья представляет результаты исследования по автоматическому построению лексического ядра тезауруса по узкой предметной области. Тезаурус строится на основе дистрибутивно-статистического анализа большого корпуса текстов объемом около 15 млрд. словоупотреблений с помощью инструментов системы Sketch Engine. Для парадигматических и синтагматических отношений лексических единиц тезауруса вычисляется количественный показатель силы связи. Изучено влияние объема корпуса на качество тезауруса. The paper presents the results of automatic thesaurus construction in a narrow subject area. Thesaurus is designed on the base of distributional and statistical analyses of a big text corpus of about 15 billion words by Sketch Engine system tools. Paradigmatic and syntagmatic relations in a thesaurus are evaluated quantifically. The corpus volume influence on the quality of a thesaurus is studied.
AB - Статья представляет результаты исследования по автоматическому построению лексического ядра тезауруса по узкой предметной области. Тезаурус строится на основе дистрибутивно-статистического анализа большого корпуса текстов объемом около 15 млрд. словоупотреблений с помощью инструментов системы Sketch Engine. Для парадигматических и синтагматических отношений лексических единиц тезауруса вычисляется количественный показатель силы связи. Изучено влияние объема корпуса на качество тезауруса. The paper presents the results of automatic thesaurus construction in a narrow subject area. Thesaurus is designed on the base of distributional and statistical analyses of a big text corpus of about 15 billion words by Sketch Engine system tools. Paradigmatic and syntagmatic relations in a thesaurus are evaluated quantifically. The corpus volume influence on the quality of a thesaurus is studied.
KW - Корпусная лингвистика
KW - корпусы текстов
KW - тезаурус
KW - онтология
KW - лексико-семантическое поле
KW - термины
KW - дистрибутивно-статистические методы
KW - коллокации
KW - автоматический анализ. Corpus linguistics
KW - text corpora
KW - thesaurus
KW - ontology
KW - terms
KW - distributional and statistical methods
KW - collocations
KW - automatic analysis
M3 - статья в сборнике
SN - ISSN 0202-2400
SP - 123
EP - 141
BT - Структурная и прикладная лингвистика.
PB - Издательство Санкт-Петербургского университета
ER -
ID: 4787455