Кыргызский (киргизский) язык, как один из малоресурсных, требует значительных усилий для создания качественных синтаксических корпусов. В данной работе предложен вариант подхода, упрощающего процесс разработки синтаксического корпуса для кыргызского языка. В настоящей работе представлен инструмент для переноса синтаксической разметки с турецкого языка на кыргызский, основанный на методе машинного перевода трибанков. Эффективность предложенного инструмента была оценена с использованием трибанка TueCL. Результаты исследования показывают, что данный подход обеспечивает более высокую точность синтаксической разметки по сравнению с моноязычной моделью, обученной на кыргызском трибанке KTMU. Кроме того, в работе предлагается метод оценки сложности ручного аннотирования полученных синтаксических деревьев.
Язык оригиналарусский
Страницы (с-по)252-275
ЖурналЗаписки научных семинаров ПОМИ
Том540
Номер выпускаИсследования по прикладной математике и информатике. IV
СостояниеОпубликовано - 2024

    Предметные области Scopus

  • Информационные системы
  • Искусственный интеллект
  • Языки и лингвистика

    Области исследований

  • обработка естественного языка, обработка кыргызского языка, машинный перевод, грамматика зависимостей, языки с малым количеством ресурсов

ID: 132514657