В статье обсуждается одно из активно развиваемых направлений в корпусной лингвистике – создание корпусов большого объема на основе текстов из веба. Описываются проблемы таких корпусов, которые ставят вопросы как перед разработчиками корпусов, так и перед пользователями, а именно, качество текстов веб-документов и проблема сбалансированности создаваемых корпусов.
Переведенное названиеEVALUATION OF INTERNET CORPORA OF RUSSIAN
Язык оригиналарусский
Название основной публикацииКорпусная лингвистика - 2015
Подзаголовок основной публикацииТруды международной конференции
Место публикацииСПб
ИздательИздательство Санкт-Петербургского университета
Страницы219-229
ISBN (печатное издание)978-5-8465-1498-0
СостояниеОпубликовано - 2015
СобытиеМеждународная конференция "Корпусная лингвистика - 2015" - Санкт-Петербург, Российская Федерация
Продолжительность: 22 июн 201526 июн 2015

конференция

конференцияМеждународная конференция "Корпусная лингвистика - 2015"
Страна/TерриторияРоссийская Федерация
ГородСанкт-Петербург
Период22/06/1526/06/15

    Области исследований

  • корпусы текстов, репрезентативность, сбалан¬си¬рованность, веб, wacky технология, оценкаweb corpora, representativity, balance, wacky technology, evaluation

ID: 4733587