Статья посвящена проекту по созданию интегрированной базы данных сочетаемости, содержащей автоматически извлеченные коллокации. Квантитативные методы, применяемые к корпусным данным, позволяют исследователям оценить полученные результаты. Статистические меры ассоциации используются для оценки силы связи внутри словосочетаний и позволяют получать списки наиболее вероятных коллокаций. Словосочетания сопровождаются статистическими оценками и информацией из корпусов текстов и словарных источников. Цель проекта - представить информацию о сочетаемостных предпочтениях частотных лексем, снабженную дополнительными сведениями и примерами из общего и специализированных корпусов текстов и других ресурсов. Настоящий инструмент может быть использован в приложениях, связанных с автоматической обработкой текстов, например при снятии неоднозначности, в лексикографических проектах, машинном переводе и обучении языкам.
Переведенное названиеRUSSIAN COLLOCATIONS DATABASE: PRELIMINARY OBSERVATIONS
Язык оригиналарусский
Название основной публикацииСтруктурная и прикладная лингвистика
Подзаголовок основной публикацииМежвузовский сборник. Выпуск 12. К 60-летию отделения прикладной, компьютерной и математической лингвистики СПбГУ
РедакторыИ.С. Николаев
Место публикацииСПб.
ИздательRWTH Aahen University
Страницы212–220
СостояниеОпубликовано - 2019

    Области исследований

  • база данных, сочетаемость, корпусы текстов, словари, статистика

    Предметные области Scopus

  • Гуманитарные науки и искусство (все)

ID: 62338093