Standard

Сложность русских правовых текстов: методы оценки и языковые данные. / Блинова, Ольга Владимировна; Тарасов, Никита Андреевич.

2021. 175-182 Работа представлена на Корпусная лингвистика - 2021: международная научная конференция, Санкт-Петербург, Российская Федерация.

Результаты исследований: Материалы конференцийматериалыРецензирование

Harvard

Блинова, ОВ & Тарасов, НА 2021, 'Сложность русских правовых текстов: методы оценки и языковые данные', Работа представлена на Корпусная лингвистика - 2021: международная научная конференция, Санкт-Петербург, Российская Федерация, 30/06/21 - 3/07/21 стр. 175-182. <https://elibrary.ru/item.asp?id=47945380>

APA

Блинова, О. В., & Тарасов, Н. А. (2021). Сложность русских правовых текстов: методы оценки и языковые данные. 175-182. Работа представлена на Корпусная лингвистика - 2021: международная научная конференция, Санкт-Петербург, Российская Федерация. https://elibrary.ru/item.asp?id=47945380

Vancouver

Блинова ОВ, Тарасов НА. Сложность русских правовых текстов: методы оценки и языковые данные. 2021. Работа представлена на Корпусная лингвистика - 2021: международная научная конференция, Санкт-Петербург, Российская Федерация.

Author

Блинова, Ольга Владимировна ; Тарасов, Никита Андреевич. / Сложность русских правовых текстов: методы оценки и языковые данные. Работа представлена на Корпусная лингвистика - 2021: международная научная конференция, Санкт-Петербург, Российская Федерация.7 стр.

BibTeX

@conference{1347a9d02a474fffb9ff27f330f66398,
title = "Сложность русских правовых текстов: методы оценки и языковые данные",
abstract = "Для создания модели автоматического определения сложности русских правовых текстов было необходимо собрать коллекцию таких текстов, разметить их, выделить параметры оценки сложности в применении к выбранному формату разметки. Эти шаги описываются в настоящей работе. Обозначается состав корпусов современных русских юридических текстов СorRIDA, CorDeс, CorCodex общим объемом 8,5 млн токенов. Описываются основания выбора инструментов лингвистической разметки (UDPipe, pymorphy2). Кратко характеризуются языковые признаки оценки сложности, среди которых: простейшие базовые метрики; пять формул читабельности; параметры оценки лексической сложности (значения TTR, Yule{\textquoteright}s K, количество гапаксов, аббревиатур, абстрактных слов и мн. др.); параметры оценки морфосинтаксической и дискурсивной сложности (значения Noun-Verb Ratio; количество граммем генитива, среднего рода, пассива; относительных предложений, аппозитивных модификаторов, лексических средств дискурсивной связности и пр.).",
keywords = "языковая сложность, правовые документы, читабельность, лексическая сложность, морфосинтаксическая сложность, дискурсивная сложность, русские синхронные юридические корпусы",
author = "Блинова, {Ольга Владимировна} and Тарасов, {Никита Андреевич}",
note = "Блинова О.В., Тарасов Н.А. Сложность русских правовых текстов: методы оценки и языковые данные // Труды международной конференции «Корпусная лингвистика-2021». — СПб.: Скифия-принт, 2021. С. 175-182.; Корпусная лингвистика - 2021: международная научная конференция ; Conference date: 30-06-2021 Through 03-07-2021",
year = "2021",
language = "русский",
pages = "175--182",

}

RIS

TY - CONF

T1 - Сложность русских правовых текстов: методы оценки и языковые данные

AU - Блинова, Ольга Владимировна

AU - Тарасов, Никита Андреевич

N1 - Блинова О.В., Тарасов Н.А. Сложность русских правовых текстов: методы оценки и языковые данные // Труды международной конференции «Корпусная лингвистика-2021». — СПб.: Скифия-принт, 2021. С. 175-182.

PY - 2021

Y1 - 2021

N2 - Для создания модели автоматического определения сложности русских правовых текстов было необходимо собрать коллекцию таких текстов, разметить их, выделить параметры оценки сложности в применении к выбранному формату разметки. Эти шаги описываются в настоящей работе. Обозначается состав корпусов современных русских юридических текстов СorRIDA, CorDeс, CorCodex общим объемом 8,5 млн токенов. Описываются основания выбора инструментов лингвистической разметки (UDPipe, pymorphy2). Кратко характеризуются языковые признаки оценки сложности, среди которых: простейшие базовые метрики; пять формул читабельности; параметры оценки лексической сложности (значения TTR, Yule’s K, количество гапаксов, аббревиатур, абстрактных слов и мн. др.); параметры оценки морфосинтаксической и дискурсивной сложности (значения Noun-Verb Ratio; количество граммем генитива, среднего рода, пассива; относительных предложений, аппозитивных модификаторов, лексических средств дискурсивной связности и пр.).

AB - Для создания модели автоматического определения сложности русских правовых текстов было необходимо собрать коллекцию таких текстов, разметить их, выделить параметры оценки сложности в применении к выбранному формату разметки. Эти шаги описываются в настоящей работе. Обозначается состав корпусов современных русских юридических текстов СorRIDA, CorDeс, CorCodex общим объемом 8,5 млн токенов. Описываются основания выбора инструментов лингвистической разметки (UDPipe, pymorphy2). Кратко характеризуются языковые признаки оценки сложности, среди которых: простейшие базовые метрики; пять формул читабельности; параметры оценки лексической сложности (значения TTR, Yule’s K, количество гапаксов, аббревиатур, абстрактных слов и мн. др.); параметры оценки морфосинтаксической и дискурсивной сложности (значения Noun-Verb Ratio; количество граммем генитива, среднего рода, пассива; относительных предложений, аппозитивных модификаторов, лексических средств дискурсивной связности и пр.).

KW - языковая сложность

KW - правовые документы

KW - читабельность

KW - лексическая сложность

KW - морфосинтаксическая сложность

KW - дискурсивная сложность

KW - русские синхронные юридические корпусы

M3 - материалы

SP - 175

EP - 182

T2 - Корпусная лингвистика - 2021: международная научная конференция

Y2 - 30 June 2021 through 3 July 2021

ER -

ID: 93138164