Открытый корпус: принципы работы и перспективы

Д.В. Грановский, В.В. Бочаров, С.В. Бичинева

Research output

Abstract

Открытый корпус (OpenCorpora) — проект по созданию размечен- ного корпуса текстов на русском языке, доступного для исследователей в полном объеме и редактируемого пользователями, который призван решить проблему отсутствия подобных русскоязычных ресурсов. В статье описываются компоненты системы (хранилище, интерфейс разметки, подсистема экспорта), организация данных и жизненный цикл текста: добавление в корпус, автоматический разбор при помощи словаря, снятие неоднозначности пользователями. Большое внимание уделено минимизации порога вхождения в проект для новых пользователей.
Original languageRussian
Title of host publicationКомпьютерная лингвистика и развитие семантического поиска в Интернете: Труды научного семинара XIII Всероссийской объединенной конференции «Интернет и современное общество». Санкт-Петербург, 19–22 октября 2010 г.
Publication statusPublished - 2010

Cite this

Грановский, Д. В., Бочаров, В. В., & Бичинева, С. В. (2010). Открытый корпус: принципы работы и перспективы. In Компьютерная лингвистика и развитие семантического поиска в Интернете: Труды научного семинара XIII Всероссийской объединенной конференции «Интернет и современное общество». Санкт-Петербург, 19–22 октября 2010 г.
Грановский, Д.В. ; Бочаров, В.В. ; Бичинева, С.В. / Открытый корпус: принципы работы и перспективы. Компьютерная лингвистика и развитие семантического поиска в Интернете: Труды научного семинара XIII Всероссийской объединенной конференции «Интернет и современное общество». Санкт-Петербург, 19–22 октября 2010 г.. 2010.
@inbook{5287759692e8422a8dfdbead8769a2d9,
title = "Открытый корпус: принципы работы и перспективы",
abstract = "Открытый корпус (OpenCorpora) — проект по созданию размечен- ного корпуса текстов на русском языке, доступного для исследователей в полном объеме и редактируемого пользователями, который призван решить проблему отсутствия подобных русскоязычных ресурсов. В статье описываются компоненты системы (хранилище, интерфейс разметки, подсистема экспорта), организация данных и жизненный цикл текста: добавление в корпус, автоматический разбор при помощи словаря, снятие неоднозначности пользователями. Большое внимание уделено минимизации порога вхождения в проект для новых пользователей.",
author = "Д.В. Грановский and В.В. Бочаров and С.В. Бичинева",
year = "2010",
language = "русский",
booktitle = "Компьютерная лингвистика и развитие семантического поиска в Интернете: Труды научного семинара XIII Всероссийской объединенной конференции «Интернет и современное общество». Санкт-Петербург, 19–22 октября 2010 г.",

}

Грановский, ДВ, Бочаров, ВВ & Бичинева, СВ 2010, Открытый корпус: принципы работы и перспективы. in Компьютерная лингвистика и развитие семантического поиска в Интернете: Труды научного семинара XIII Всероссийской объединенной конференции «Интернет и современное общество». Санкт-Петербург, 19–22 октября 2010 г..

Открытый корпус: принципы работы и перспективы. / Грановский, Д.В.; Бочаров, В.В.; Бичинева, С.В.

Компьютерная лингвистика и развитие семантического поиска в Интернете: Труды научного семинара XIII Всероссийской объединенной конференции «Интернет и современное общество». Санкт-Петербург, 19–22 октября 2010 г.. 2010.

Research output

TY - CHAP

T1 - Открытый корпус: принципы работы и перспективы

AU - Грановский, Д.В.

AU - Бочаров, В.В.

AU - Бичинева, С.В.

PY - 2010

Y1 - 2010

N2 - Открытый корпус (OpenCorpora) — проект по созданию размечен- ного корпуса текстов на русском языке, доступного для исследователей в полном объеме и редактируемого пользователями, который призван решить проблему отсутствия подобных русскоязычных ресурсов. В статье описываются компоненты системы (хранилище, интерфейс разметки, подсистема экспорта), организация данных и жизненный цикл текста: добавление в корпус, автоматический разбор при помощи словаря, снятие неоднозначности пользователями. Большое внимание уделено минимизации порога вхождения в проект для новых пользователей.

AB - Открытый корпус (OpenCorpora) — проект по созданию размечен- ного корпуса текстов на русском языке, доступного для исследователей в полном объеме и редактируемого пользователями, который призван решить проблему отсутствия подобных русскоязычных ресурсов. В статье описываются компоненты системы (хранилище, интерфейс разметки, подсистема экспорта), организация данных и жизненный цикл текста: добавление в корпус, автоматический разбор при помощи словаря, снятие неоднозначности пользователями. Большое внимание уделено минимизации порога вхождения в проект для новых пользователей.

M3 - статья в сборнике

BT - Компьютерная лингвистика и развитие семантического поиска в Интернете: Труды научного семинара XIII Всероссийской объединенной конференции «Интернет и современное общество». Санкт-Петербург, 19–22 октября 2010 г.

ER -

Грановский ДВ, Бочаров ВВ, Бичинева СВ. Открытый корпус: принципы работы и перспективы. In Компьютерная лингвистика и развитие семантического поиска в Интернете: Труды научного семинара XIII Всероссийской объединенной конференции «Интернет и современное общество». Санкт-Петербург, 19–22 октября 2010 г.. 2010