Research output: Contribution to journal › Article › peer-review
Применение лингвистических признаков для автоматического определения интонационно выделенных слов в русскоязычном тексте. / Кочаров, Даниил Александрович; Меньшикова, Алла Павловна.
In: Труды СПИИРАН: SPIIRAS Proceedings, Vol. 6, No. 55, 2017, p. 216-236.Research output: Contribution to journal › Article › peer-review
}
TY - JOUR
T1 - Применение лингвистических признаков для автоматического определения интонационно выделенных слов в русскоязычном тексте
AU - Кочаров, Даниил Александрович
AU - Меньшикова, Алла Павловна
PY - 2017
Y1 - 2017
N2 - В данной статье предлагается метод автоматического предсказания интонационно выделенных слов, то есть наиболее важной информации в высказывании. Метод опирается на использование лексических, грамматических и синтаксических маркеров интонационного выделения, что делает возможным его применение в системах синтеза речи по тексту, где реализация интонационного выделения может повысить естественность звучания синтезированной речи.В качестве методов классификации независимо друг от друга использовалось несколько различных моделей: наивная байесовская модель, модель максимальной энтропии и условные случайные поля. Сопоставление результатов, полученных в ходе нескольких экспериментов, показало, что использовавшиеся дискриминативные модели демонстрируют сбалансированные и примерно равные значения метрик качества, в то время как генеративная модель потенциально более пригодна для поиска интонационно выделенных слов в речевом сигнале.Результаты, представленные в статье, сравнимы и в некоторых случаях превосходят аналогичные системы, разработанные для других языков.
AB - В данной статье предлагается метод автоматического предсказания интонационно выделенных слов, то есть наиболее важной информации в высказывании. Метод опирается на использование лексических, грамматических и синтаксических маркеров интонационного выделения, что делает возможным его применение в системах синтеза речи по тексту, где реализация интонационного выделения может повысить естественность звучания синтезированной речи.В качестве методов классификации независимо друг от друга использовалось несколько различных моделей: наивная байесовская модель, модель максимальной энтропии и условные случайные поля. Сопоставление результатов, полученных в ходе нескольких экспериментов, показало, что использовавшиеся дискриминативные модели демонстрируют сбалансированные и примерно равные значения метрик качества, в то время как генеративная модель потенциально более пригодна для поиска интонационно выделенных слов в речевом сигнале.Результаты, представленные в статье, сравнимы и в некоторых случаях превосходят аналогичные системы, разработанные для других языков.
KW - интонационное выделение
KW - просодия
KW - лексический анализ
KW - синтаксический анализ
KW - байесовский классификатор
KW - метод максимальной энтропии
KW - условные случайные поля
KW - русский язык
M3 - статья
VL - 6
SP - 216
EP - 236
JO - SPIIRAS Proceedings
JF - SPIIRAS Proceedings
SN - 2078-9181
IS - 55
ER -
ID: 10254799