Результаты исследований: Научные публикации в периодических изданиях › статья › Рецензирование
Низкочастотные слова в русском языке и подходы к моделированию общеязыковой частотности. / Блинова, Ольга Владимировна.
в: СОЦИО- И ПСИХОЛИНГВИСТИЧЕСКИЕ ИССЛЕДОВАНИЯ, № 7, 1, 2019, стр. 7-13.Результаты исследований: Научные публикации в периодических изданиях › статья › Рецензирование
}
TY - JOUR
T1 - Низкочастотные слова в русском языке и подходы к моделированию общеязыковой частотности
AU - Блинова, Ольга Владимировна
PY - 2019
Y1 - 2019
N2 - Целью статьи является выработка методики формирования списков низкочастотных слов путем сравнения данных, предоставляемых русскими корпусами. В статье сравниваются частотные списки лемм, представленные в «Новом частотном словаре русской лексики» на базе НКРЯ и полученные на базе веб-корпуса ruTenTen11. Перед сравнением исходные списки были преобразованы; в результате преобразования получены списки общей длиной, соответственно, 51 681 слово и 457 935 слов. Сопоставлены списки слов, имеющих относительные частоты <5 ipm по данным хотя бы одного из корпусов. В качестве нижнего порога отсечения вынужденно выбрано значение абсолютной частоты, равное 37. Посчитаны значения мер «coverage» (охват) и «enrichment» (обогащение). Выяснилось, что мера «coverage», отражающая долю перекрытия между списками лемм, принимает значение в 9,4%.Исследование проведено при поддержке гранта РНФ, проект № 19-18-00525 «Понятность официального русского языка: юридическая и лингвистическая проблематика».
AB - Целью статьи является выработка методики формирования списков низкочастотных слов путем сравнения данных, предоставляемых русскими корпусами. В статье сравниваются частотные списки лемм, представленные в «Новом частотном словаре русской лексики» на базе НКРЯ и полученные на базе веб-корпуса ruTenTen11. Перед сравнением исходные списки были преобразованы; в результате преобразования получены списки общей длиной, соответственно, 51 681 слово и 457 935 слов. Сопоставлены списки слов, имеющих относительные частоты <5 ipm по данным хотя бы одного из корпусов. В качестве нижнего порога отсечения вынужденно выбрано значение абсолютной частоты, равное 37. Посчитаны значения мер «coverage» (охват) и «enrichment» (обогащение). Выяснилось, что мера «coverage», отражающая долю перекрытия между списками лемм, принимает значение в 9,4%.Исследование проведено при поддержке гранта РНФ, проект № 19-18-00525 «Понятность официального русского языка: юридическая и лингвистическая проблематика».
KW - русский язык
KW - языковые корпусы
KW - веб-корпусы
KW - частотный список лемм
KW - общеязыковая частотность
KW - низкочастотные слова
KW - лексическая сложность
M3 - статья
SP - 7
EP - 13
JO - СОЦИО- И ПСИХОЛИНГВИСТИЧЕСКИЕ ИССЛЕДОВАНИЯ
JF - СОЦИО- И ПСИХОЛИНГВИСТИЧЕСКИЕ ИССЛЕДОВАНИЯ
SN - 2310-0214
IS - 7
M1 - 1
ER -
ID: 49022243