Индексирование данных является неотделимой частью задачи поиска. В то время как для данных в пространствах размерностей не более 5 существует хорошо изученный набор эффективных алгоритмов индексации и поиска, для пространств большой размерностей эти алгоритмы оказываются неэффективны или неприменимы. В этом обзоре мы приводим существующие обоснования проблем связанных с индексированием в пространствах большой размерности для задачи поиска ближайшего соседа. Рассматриваются возможные методы решения обозначенных проблем, применимые в областях анализа данных, таких как кластеризация и извлечение скрытых структур. Ставится вопрос о применимости различных методов размерностной редукции к задачи индексирования и поиска ближайшего соседа.
Язык оригиналарусский
Страницы (с-по)25-47
ЖурналТруды СПИИРАН: SPIIRAS Proceedings
Номер выпуска2(33)
СостояниеОпубликовано - 2014

    Области исследований

  • индексирование, поиск ближайшего соседа, данные большой размерности, анализ данных, редукция размерности

ID: 5742701