В статье рассматривается проблема избыточного многообразия алгоритмов, применяемых для решения задач криминалистического автороведения. Доступность текстов
в электронной форме и банализация использования программных средств привели к неконтролируемому многообразию алгоритмов, используемых для решения таких задач. Современный этап развития теории и практики авторской идентификации характеризуется широким распространением и легкой доступностью программных средств, позволяющих обрабатывать тексты, существующие в электронной форме, без дополнительной подготовки. Если на начальном этапе развития этой предметной области объектами исследования были в основном литературные тексты, то сегодня в центре внимания оказались электронные тексты (e-mail, SMS, чаты). Это создает у пользователей подобных текстов иллюзию отсутствия необходимости хотя бы общего ознакомления с основными положениями стилеметрии (как минимум таких, как требование жанровостилевой однородности исследуемых текстов, исключение речи персонажей и обработка только авторской речи, приоритет синтаксиса над лексикой), возникшей уже довольно давно. Нередко за стилистический анализ выдаются формальные процедуры, например разбиение текста на n-граммы. Отсутствие инструментов валидации результатов криминалистических экспертиз в этой сфере затрудняет их использование в юридической практике. В англосаксонских юрисдикциях обязательно применение метода оценки отношения правдоподобия (likelihood ratio, LR) при проверке статистических гипотез. Данное отношение показывает вероятность сходства между текстом известного происхождения и атрибутируемым текстом для нулевой гипотезы (Но), согласно которой оба текста имеют одно происхождение, против альтернативной гипотезы (На), в соответствии с которой у них разное происхождение. Применение этого метода позволяет сократить избыточное многообразие алгоритмов идентификации за счет отказа от использования алгоритмов, не включающих проверку статистических гипотез и оценку LR.