The paper is devoted to the construction of the Russian thesaurus on Corpus Linguistics. The linguistic resource involved in research is the Russian corpus on Corpus Linguistics developed in St.-Petersburg State University together with the Institute of Linguistic Studies and different vocabularies. The semi-automatic terminology extraction is performed with the help of the linguistic and statistical tools which allow generation of the lists of single-word and multi-word terms provided with frequency data and lexical-syntactic patterns. The lexical-syntactic patterns are used in the analysis of the contexts which contain the definitions of the terms, expose the relationships between the terms, provide their synonyms, translation equivalents, etc.
Язык оригиналарусский
Название основной публикацииИнформационные технологии и письменное наследие: El'Manuscript-10
Подзаголовок основной публикацииМатериалы Международной научной конференции
Место публикацииУфа
ИздательЭлектронное издательство "Вагант"
Страницы95-98
ISBN (печатное издание)978-5-66678-639-8
СостояниеОпубликовано - 2010
СобытиеИнформационные технологии и письменное наследие: El'Manuscript-10 - Уфа; Ижевск, Российская Федерация
Продолжительность: 28 окт 201031 окт 2010

конференция

конференцияИнформационные технологии и письменное наследие: El'Manuscript-10
Страна/TерриторияРоссийская Федерация
ГородУфа; Ижевск
Период28/10/1031/10/10

ID: 4633160