От корпуса устной речи к базе «расчлененных» дискурсивных единиц

Анатолий Владимирович Венцов
Юлия Олеговна Нигматулина
Ольга Васильевна Раева
Елена Игоревна Риехакайнен
Наталия Арсеньевна Слепокурова

A corpus of spoken Russian is used to create a database of “broken” discourse units. The database includes over 700 elements, which are either semantic-syntactic units broken by pauses or their fragments. Every unit of the database is to be provided with a sound file, an orthographic transcription and the description of its melodic contour. The principles of the description are discussed in the paper.

Translated title of the contribution	FROM A SPEECH CORPUS TO A DATABASE OF "BROKEN" DISCOURSE UNITS
Original language	Russian
Title of host publication	Корпусная лингвистика – 2015
Subtitle of host publication	Труды международной конференции
Place of Publication	СПб
Publisher	Издательство Санкт-Петербургского университета
Pages	154-161
ISBN (Print)	9785846514980
State	Published - 2015
Event	Международная конференция "Корпусная лингвистика - 2015" - Санкт-Петербург, Russian Federation Duration: 22 Jun 2015 → 26 Jun 2015

Conference

Conference	Международная конференция "Корпусная лингвистика - 2015"
Country/Territory	Russian Federation
City	Санкт-Петербург
Period	22/06/15 → 26/06/15

ID: 11422444