Результаты исследований: Публикации в книгах, отчётах, сборниках, трудах конференций › статья в сборнике материалов конференции › Рецензирование
This paper presents a crowdsourcing project on the creation of a publicly available corpus of sentential paraphrases for Russian. Collected from the news headlines, such corpus could be applied for information extraction and text summarization. We collect news headlines from different agencies in real-time; paraphrase candidates are extracted from the headlines using an unsupervised matrix similarity metric. We provide user-friendly online interface for crowdsourced annotation which is available at paraphraser. ru. There are 5181 annotated sentence pairs at the moment, with 4758 of them included in the corpus. The annotation process is going on and the current version of the corpus is freely available at http://paraphraser.ru.
Язык оригинала | Английский |
---|---|
Название основной публикации | INFORMATION RETRIEVAL, (RUSSIR 2015) |
Редакторы | P Braslavski, Markov, P Pardalos, Y Volkovich, DI Ignatov, S Koltsov, O Koltsova |
Издатель | Springer Nature |
Страницы | 146-157 |
Число страниц | 12 |
ISBN (печатное издание) | 978-3-319-41717-2 |
DOI | |
Состояние | Опубликовано - 2016 |
Событие | 9th Russian Summer School in Information Retrieval (RuSSIR) - St Petersburg Продолжительность: 24 авг 2015 → 28 авг 2015 |
Название | Communications in Computer and Information Science |
---|---|
Издатель | SPRINGER INTERNATIONAL PUBLISHING AG |
Том | 573 |
ISSN (печатное издание) | 1865-0929 |
конференция | 9th Russian Summer School in Information Retrieval (RuSSIR) |
---|---|
Город | St Petersburg |
Период | 24/08/15 → 28/08/15 |
ID: 89669620