Документы

Ссылки

DOI

  • Alexander Alenin
  • Anton Okhotnikov
  • Rostislav Makarov
  • Nikita Torgashov
  • Ilya Shigabeev
  • Konstantin Simonchik
This paper describes ID R&D team submission to the text- independent task of the Short-duration Speaker Verification (SdSV) Challenge 2021. The top performed system is a fu- sion of 9 Convolutional Neural Networks based on the ResNet architecture. Experiments’ results of optimal NN architecture search are shown. We also present and investigate the subnet- work approach to solve the auxiliary tasks such as gender or language detection. Verification scores refinement step using quality measurements of a trial pair allowed to further mini- mize the target metrics. A comparative analysis of all systems used in the fusion has been provided on the VoxCeleb-1 test set, SdSV-2021 development and evaluation sets. The final submis- sion achieves 0.69% EER and 0.0319 minDCF on the challenge evaluation set.
Язык оригиналаанглийский
Страницы2297-2301
Число страниц5
DOI
СостояниеОпубликовано - 30 авг 2021
СобытиеInterspeech 2021 - Брно, Чехия
Продолжительность: 30 авг 20213 сен 2021
https://www.interspeech2021.org/

конференция

конференцияInterspeech 2021
Сокращенное названиеInterspeech 2021
Страна/TерриторияЧехия
ГородБрно
Период30/08/213/09/21
Сайт в сети Internet

    Предметные области Scopus

  • Искусственный интеллект
  • Обработка сигналов
  • Компьютерные науки (все)
  • Программный продукт
  • Языки и лингвистика
  • Человеко-машинное взаимодействие
  • Моделирование и симуляция

ID: 86369686