Pragmatic Markers and Parts of Speech: on the Problems of Annotation of the Speech Corpus

Natalia V. Bogdanova-Beglarian, Kristina D. Zaides

Результат исследований: Публикации в книгах, отчётах, сборниках, трудах конференцийстатья в сборнике материалов конференциинаучнаярецензирование

Аннотация

The article considers the range of possibilities of pragmatic markers (PM) annotation: from the speaker’s code to the speaker’s commentaries for all difficult cases. The research is based on the material of two corpora of everyday Russian speech – “One Day of Speech” (ORD; dialogues / polylogues) and “Balanced Annotated Text Collection” (SAT; monologues). Two main annotation levels have become the objects of research in this paper: the part of speech of the original lexical unit, from which the basic version of the PM derived (POS), and the model of formation for the PM which consist of more than one word (Model). The research shows the low feasibility of trying to fit PM into the system of traditional parts of speech, and, conversely, the importance and role of defining a model of formation of PM for their systematic description. In any case, the automatic annotation of corpus material turns out to be considerably difficult.
Язык оригиналаанглийский
Название основной публикацииProceedings of the International Conference "Internet and Modern Society". IMS-2020
Место публикацииSt. Petersburg
Страницы155-165
СостояниеОпубликовано - 25 июн 2020
СобытиеXXIII Международная объединённая конференция «Интернет и современное общество» - ул. Ломоносова, д. 9, Университет ИТМО, Санкт-Петербург, Российская Федерация
Продолжительность: 17 июн 201820 июн 2020
Номер конференции: 23
http://ims.ifmo.ru/ru/pages/2/programma.htm

конференция

конференцияXXIII Международная объединённая конференция «Интернет и современное общество»
Сокращенный заголовокIMS-2020
СтранаРоссийская Федерация
ГородСанкт-Петербург
Период17/06/1820/06/20
Адрес в сети Интернет

Предметные области Scopus

  • Языки и лингвистика

Ключевые слова

  • Spoken Speech, Speech Corpus, Pragmatic Marker, Pragmaticalization, Part of Speech, Model of Formation

Fingerprint Подробные сведения о темах исследования «Pragmatic Markers and Parts of Speech: on the Problems of Annotation of the Speech Corpus». Вместе они формируют уникальный семантический отпечаток (fingerprint).

Цитировать