DOI

The article presents work on predicting the fundamental frequency (F0) values for the Kazakh language. The fundamental frequency plays one of the most important roles in the perception of speech, and at the same time modelling continuous F0 is one of the most difficult tasks in the development of intonational speech synthesis systems. The main and obvious difficulty is that a person is able to say the same sentence with different intonations and with different tones. In this work, we used deep neural networks for accurate and qualitative prediction F0 values as close as possible to the natural sounding of Kazakh speech.

Язык оригиналаанглийский
Название основной публикацииICEMIS '19
Подзаголовок основной публикацииProceedings of the 5th International Conference on Engineering and MIS
ИздательAssociation for Computing Machinery
ISBN (электронное издание)9781450372121
ISBN (печатное издание)9781450372121
DOI
СостояниеОпубликовано - 6 июн 2019
Событие5th International Conference on Engineering and MIS, ICEMIS 2019 - Astana, Казахстан
Продолжительность: 6 июн 20198 июн 2019

Серия публикаций

НазваниеACM International Conference Proceeding Series

конференция

конференция5th International Conference on Engineering and MIS, ICEMIS 2019
Страна/TерриторияКазахстан
ГородAstana
Период6/06/198/06/19

    Предметные области Scopus

  • Программный продукт
  • Человеко-машинное взаимодействие
  • Компьютерное зрение и распознавание образов
  • Компьютерные сети и коммуникации

ID: 46097990