В статье обсуждается проект аннотированного корпуса билингвальной речи представителей албанской исторической диаспоры, проживающих в четырех албаноязычных селах в регионах Приазовья и Буджака. Использование корпуса для изучения билингвального речевого поведения позволит приблизиться к решению некоторых исследовательских проблем, находящихся в центре внимания исследователей билингвизма и связанных с двумя основными типами контактнообусловленных явлений — переключением кодов и заимствованием. В настоящей работе анализируются основные подходы к классификации однословных включений на одном языке в речь на другом языке, изучаются способы передачи языкового материала и аннотирования контактных явлений в некоторых существующих корпусах речи билингвов. Предлагаются теоретические и прикладные решения для отбора, метаразметки и записи текстов и предпринимается попытка разработать стандарт разметки контактнообусловленных явлений в устной спонтанной речи билингвов, который может быть применен впоследствии в аналогичных корпусах. В заключении формулируются перспективы использования создаваемого корпуса и дальнейшего развития корпусных ресурсов албанского языка.