описание

Научная проблема, на решение которой направлен проект
Визуальное представление текста при исследовании механизмов чтения является одним из наименее проработанных направлений в рамках современной психолингвистики чтения (Slattery, 2016). До конца не ясно, как влияет на скорость чтения изменение шрифта, размера букв, интерлиньяжа (расстояния между строками), фона и т. п. Такое положение дел вызвано тем, что первоначально лингвисты и психологи предполагали, что шрифт или другие типографические характеристики не будут оказывать влияние на собственно лингвистические процессы. То есть лингвистические эффекты будут одинаковым образом представлены при любом визуальном представлении. Однако, недавние результаты противоречат исходному предположению. Например, было показано, что при более сложном шрифте (напр. стилизованном под готическое или рукописное написание) читающие сильнее опираются на предсказуемость и частотность слов, чем при чтении текста, набранного в обычном шрифте (Rayner et al., 2006; Slattery & Rayner, 2010). То есть плохо предсказуемые и низкочастотные слова вызывают большее затруднение при чтении в нестандартном визуальном представлении. Однако, пока неизвестно, будет ли проявляться взаимодействие между визуальным представлением текста и лингвистическими эффектами на более высоких уровнях (напр., семантическом или синтаксическом).
Эта научная проблема встает особенно остро, когда в центре внимания исследователей находятся люди с нарушением чтения — дислексики. Дислексия — избирательное нарушение способности к овладению навыками чтения при сохранении общей способности к обучению (Lyon et al., 2003; Rose 2009; Snowling, 2019). Она проявляется в медленном, а также нередко ошибочном чтении слов, предложений и текстов. Современные исследования показывают, что в основе нарушения чтения у 30-40% дислексиков (Amitay et al., 2002; Ramus et al., 2003; Saksida et al., 2016; White et al., 2006) лежат проблемы, связанные со зрительной обработкой (так называемая оптическая дислексия). Таким образом, пока непонятно, в какой степени проблемы на этом уровне у людей с дислексией будут распространяться на другие лингвистические уровни. Можно ли ожидать, что у оптических дислексиков будет больше угадывающих ошибок (замен слов на основе догадок, часто основанных на предсказуемости; лексический фактор), аграмматизмов (форм слов, не соответствующих по грамматическим признакам ожиданиям от предыдущего контекста; грамматический фактор) или замен на семантически похожие слова (семантический фактор), чем у людей с дислексией, обладающих одновременно оптической и фонологической дислексией? Сложности с фонологической обработкой считаются самой частой причиной дислексии (Snowling, 2019; Vellutino et al., 2004). Будут ли дислексики с доминированием оптической дислексии отличаться от дислексиков с доминированием фонологической дислексией по этим показателям? Кроме того, остается не ясным, одинаковым образом или по-разному проявляется взаимодействие между визуальными и лексическими факторами (напр. частотностью) в целом у дислексиков и у людей без дислексии. То есть в целом отличия в механизмах чтения у дислексиков и людей без дислексии качественные или количественные (Huettig et al., 2018)? Можно ли предсказать на основе соотношения ошибок чтения по типу аграмматизмов, угадывающего чтения, замен на основе семантического сходства и т. п. наличие высокого риска дислексии?
На решение всех этих вопросов и направлен текущий проект.

Далее, для совокупного обозначения данных вопросов (научной проблемы) мы будем использовать следующую формулировку: «определение степени влияния визуальных характеристик текста на лингвистические процессы у дислексиков и людей без таких нарушений».

Научная значимость и актуальность решения обозначенной проблемы
Научная значимость проекта заключается в следующем:
1) Исследуя нарушения чтения, мы сможем подобраться к тому, как в целом устроены механизмы чтения у людей без нарушений, по крайней мере с точки зрения взаимодействия визуального и лингвистического компонентов письменной речи. Таким образом, результаты нашего проекта смогут улучшить и расширить существующие модели чтения. Например, модель двойного пути (Coltheart et al., 2001), которая разрабатывалась с опорой на различные подвиды дислексии и включает себя орфографический (частью которого является визуальный модуль), фонологический и семантический компоненты.
2) В проекте затронута подобласть психолингвистики (визуальное представление текста), которая сама по себе является недоисследованной (Slattery, 2016). Таким образом, любые новые знания в этой области внесут существенный вклад в развитие данного направления.
3) В области коррекционной педагогики и патологии речи дислексия является одним из основных предметов исследования (Визель, 2005). Таким образом, новые знания в целом о дислексии и о ее оптическом и фонологическом подвидах в частности позволят лучше понять ученым сущность данных нарушений.
4) В рамках проекта будет создан ряд прикладных инструментов, которые могут быть использованы в будущих научных исследованиях:
a. Тест на проверку качества зрительной обработки (см. подробнее Предлагаемые методы и подходы) и нормы его выполнения у подростков, носителей русского языка без нарушения чтения. Этот тест может использоваться для отбора участников будущих исследований — поиска оптических дислексиков с нарушениями чтения, вызванных сокращенным визуальным полем внимания или подверженностью к визуальному шуму (см. подробнее Современное состояние исследований по данной проблеме).
b. Современные нормы чтения вслух у подростков, носителей русского языка без нарушения чтения, вместе с соответствующими материалами (см. подробнее Предлагаемые методы и подходы). Могут использоваться для поиска дислексиков в данных возрастных группах в будущих исследованиях.
c. Многофакторная классификация ошибок чтения вслух (см. подробнее Предлагаемые методы и подходы). Может быть использована для анализа ошибок вслух у людей с дислексией и поиска диагностирующих ошибок.

Актуальность решения научной проблемы обусловлена прежде всего частотой встречаемости дислексии. А именно, частота встречаемости дислексии среди детей школьного возраста варьируется в России от 5-10% (Корнев, 2003). Дислексия приводит к снижению школьной успеваемости по всем предметам, что, в свою очередь, часто становится причиной неврозов, фобий и социальной дезадаптации в целом. Несформированный навык чтения приводит к функциональной неграмотности у взрослых: более чем у 70% школьников, которым в 3-м классе был подтвержден диагноз дислексии, проявления дислексии сохраняются и во взрослом возрасте (Заваденко 2008).
Таким образом, любое исследование, затрагивающее данную тему, привнесет знания, которые можно будет впоследствии использовать для своевременной диагностики и коррекции дислексии.
В рамках данного проекта, помимо того, что будут получены теоретические знания о влиянии визуального представления текста на лингвистические процессы у дислексиков и людей без таких нарушений мы протестируем два кириллических шрифта для дислексиков (см. подробнее Предлагаемые методы и подходы) и определим, какой из них является наиболее перспективным для использования.

Конкретная задача (задачи) в рамках проблемы, на решение которой направлен проект, ее масштаб и комплексность

Для решения научной проблемы — определение степени влияния визуальных характеристик текста на лингвистические процессы у людей с дислексией и людей без таких нарушений — будет решен ряд задач.

Задача 1 (предварительная, решена на этапе составления заявки). Выявить конкретный объект исследования (конкретные типографические характеристики) и определить характеристики выборки (возраст участников исследования), на которой будет проводиться исследование.
Мы остановились на исследовании шрифтов: с засечками и без засечек; пропорциональных и моноширинных (с одинаковым физическим размером букв); специально разработанных для дислексиков и стандартных шрифтов. В качестве основной возрастной группы мы остановились на подростках. При наличии достаточного количество дислексиков к участию будут привлечены также взрослые (см. подробнее Предлагаемые методы и подходы).
Задача 2. Оценить участников исследования с точки зрения наличия дислексии. При ее наличии выявить ее подвиды: фонологическую, оптическую, смесь фонологической и оптической, другого рода. Для этого необходимо измерить скорость чтения текста вслух (определение симптомов дислексии); оценить невербальный интеллект (важно для определения дислексии); проверить качество фонологической обработки при чтении отдельных слов и псевдослов и при манипуляции с псевдословами по типу замены одного звука; проверить качество зрительной обработки с точки зрения сохранности визуального поля внимания и степени подверженности визуальному шуму (см. подробнее Предлагаемые методы и подходы).

Задача 3. Провести эксперимент, нацеленный на изучение скорости распознавания слов в зависимости от типа шрифта и частотности (лексический фактор) у подростков с нарушениями чтения (в том числе в зависимости от подтипа) и подростков без нарушений чтения. При наличии достаточного количества дислексиков среди взрослых провести подобный эксперимент на данной возрастной группе (см. подробнее Предлагаемые методы и подходы).

Задача 4. Провести эксперимент методом чтения вслух текста. Оценить влияние типа шрифта на количество ошибок, относящихся к разным языковым уровням (семантическому, грамматическому, фонетическому и прагматическому) у каждой группы участников. Для этого разработать многофакторную классификацию ошибок чтения вслух (см. подробнее Предлагаемые методы и подходы).

Задача 5 (дополнительная). Выявить ошибки или сочетания ошибок при чтении вслух, которые являются диагностирующими для дислексии.

Масштабность и комплексность поставленных задач обуславливается следующим:
1) Будет исследовано влияние ряда визуальных характеристик (специализированность шрифта, наличие засечек, пропорциональность/моноширинность) на лингвистические процессы на различных лингвистических уровнях (семантическом, грамматическом, фонетическом и прагматическом). Это поможет сложить комплексную картину взаимодействия визуального представления текста и лингвистической обработки.
2) Участники исследования пройдут комплекс тестов на выявление различных подвидов дислексии. Только в небольшом количестве исследований участников одновременно тестируют на различные подвиды дислексии (Snowling, 2019). Данный проект будет исключением.
3) Процедура исследования может быть масштабирована при адаптации тестов на другие возрастные группы (например, учащихся младшей и средней школы).
4) Мы не только изучим, чем люди с дислексией отличаются от людей без нарушения чтения на основе ошибок вслух при чтении текстов, набранных различными шрифтами, но и попробуем предсказать дислексию (путем моделирования), используя эту информацию.

Научная новизна исследований, обоснование того, что проект направлен на развитие новой для научного коллектива тематики*********, обоснование достижимости решения поставленной задачи (задач) и возможности получения предполагаемых результатов

Научная новизна исследования:

1) Насколько нам известно, в мировой науке ранее целенаправленно не исследовалось влияние визуального представления на более высокие лингвистические уровни, чем лексический (частотность, предсказуемость слов) при анализе ошибок вслух.
2) На русском языке еще не исследовались визуальные характеристики текста в связке с когнитивными процессами на разных лингвистических уровнях.
3) В предыдущих исследованиях, направленных на выявление наиболее эффективных визуальных характеристик текста у людей с дислексией (Bachmann & Mengheri, 2018; Duranovic et al., 2018; Galliussi et al., 2020; Karovska Ristovska & Filipovska, 2018; Kuster et al., 2018; Leeuw, 2010; Marinus et al., 2016; Rello & Baeza-Yates, 2013, 2016; Wery & Diliberto, 2017; Zikl et al., 2015), специально не определялась основная причина дислексии у экспериментальной группы участников. В нашем проекте мы будем отвечать на основной вопрос исследования (какова степень влияния визуальных характеристик текста на лингвистические процессы у дислексиков) с прицелом на различные подвиды дислексии.
4) В современной науке существуют общепризнанные тесты на проверку зрительной обработки в отношении визуального поля внимания, однако нет общепринятого теста для определения проблем, связанных с повышенной восприимчивостью к визуальному шуму (Saksida et al., 2016). Мы нацелены на создание комплексного теста, проверяющего обе возможные причины оптической дислексии.
5) При исследовании дислексии в отечественной науке предпочтение отдается школьникам младшего возраста (Dorofeeva et al., 2019; Lopukhina et al., 2021; Ахутина et al., 2016; Ахутина & Ишакова, 2008; Безруких & Иванов, 2019; Безруких & Морозова, 1996; Дорофеева et al., 2021; Иванов et al., 2010; Корнеев et al., 2019; Русецкая, 2003). В нашем исследовании мы сфокусируемся на подростках (обоснование нашего выбора приведено в разделе Предлагаемые методы и подходы). До 70% школьников, получивших диагноз дислексия в младшей школе, сохраняют его признаки и во взрослом состоянии.
6) Для подростков — носителей русского языка — нам неизвестны современные нормы чтения вслух. Такие нормы необходимы для определения подростков с высоким риском дислексии. В рамках данного проекта мы соберем такие нормы.
7) Мы впервые (насколько нам известно) попробуем предсказать наличие дислексии на основе различных подвидов ошибок вслух при чтении. Сейчас такие модели строятся в основном на основе данных движения глаз, ЭЭГ и ФМРТ. Для этого мы разработаем многофакторную классификацию ошибок.

Обоснование новизны тематики, предмета, объекта, плана исследования или методов для участников исследования Анастасия Шиморина знакома с методами машинного обучения, необходимыми для решения задачи 5 (предсказание дислексии при помощи методов машинного обучения). Однако, до настоящего времени она не занималась психолингвистикой, дислексией, визуальным представлением текста, многофакторной классификацией ошибок чтения вслух, созданием тестов на проверку когнитивных способностей, сбором данных у подростков.

Яна Никонова знакома с экспериментальными методами в психолингвистике, но она не занималась выявлением дислексии и ее подвидов, многофакторной классификацией ошибок чтения вслух, методами машинного обучения, созданием тестов на проверку когнитивных способностей, сбором данных у подростков.

Алиса Лезина знакома с экспериментальными методами в психолингвистике, но она не занималась выявлением дислексии и ее подвидов, визуальным представлением текста, многофакторной классификацией ошибок чтения вслух, методами машинного обучения, созданием тестов на проверку когнитивных способностей, сбором данных у подростков.
Руководитель проекта, Светлана Алексеева имеет опыт во многих из перечисленных сфер, однако, она никогда не составляла такой комплексный план исследования, не создавала тестов на проверку когнитивных способностей, не занималась многофакторной классификацией ошибок чтения вслух, имеет лишь незначительный опыт применения методов машинного обучения в лингвистике.

Обоснование достижимости решения задач и возможности получения результатов
Задача 1 (выбор визуальных характеристик и возрастной группы) была выполнена на этапе составления заявки (см. подробнее Предлагаемые методы и подходы).
Задача 2 (оценка участников исследования на предмет дислексии).
На этапе составления заявки получено предварительное согласие на проведение исследования в шести общеобразовательных школах (No564, No225, No241, No278, No256 и No491) и одной речевой школе (3) Санкт- Петербурга. Большое количество общеобразовательных школ дают уверенность, что мы сможем определить современные нормы чтения вслух для основной возрастной категории исследования. Наши предыдущие исследования (Alexeeva et al., 2020; Alexeeva, Zubov, & Konina, 2022) показывают, что в данной речевой школе дети читают статистически значимо медленнее, чем в общеобразовательной школе No491 (одной из школ, которая согласилась принимать участие в проекте). Таким образом, есть основания утверждать, что мы выявим достаточное число подростков с дислексией для того, чтобы делать выводы про крайней мере в целом для группы дислексиков (см. подробнее Предлагаемые методы и подходы). Все тесты, кроме одного, на выявление подвидов дислексии находятся в распоряжении авторов. Для последнего теста — теста на проверку зрительной обработки, — который необходимо будет создать (адаптировать и усовершенствовать), все материалы в наличии (см. подробнее Предлагаемые методы и подходы). Таким образом, техническая сторона не будет помехой к выявлению подтипов дислексии у ранее выявленных дислексиков (см. выше), тем не менее, мы не можем гарантировать, что среди нашей выборки встретится достаточное число подростков с преобладанием проблем с оптическим компонентом. Скорее всего, мы сможем выявить достаточное для построения выводов на групповом уровне количество дислексиков с преобладанием фонологической дислексии и с дислексией смешанного типа.
Задача 3 (эксперимент на оценку взаимодействия шрифта и частотности слов при чтении про себя). Руководитель проекта проводил эксперименты подобного рода (Алексеева & Слюсарь, 2017a; Слюсарь & Алексеева, 2017) и знаком со спецификой процедуры. Существует общедоступный ресурс (stimul.cognitivestudies.ru), который позволяет с легкостью определять частотность слов. Таким образом, мы не видим препятствий реализации данной задачи.
Задача 4 (эксперимент на оценку взаимодействия шрифта и ошибок чтения вслух, относящихся к разным лингвистическим уровням). Руководитель проекта проводил эксперименты подобного рода (Zubov et al., 2021). Новой задачей является создание многофакторной классификации ошибок и распределение ошибок вслух по выделенным типам. Тем не менее, на этапе составления заявки была выполнена работа по анализу уже существующих классификаций (см. подробнее Современное состояние исследований по данной проблеме) и определены основные ошибки на каждом из заявленных в проекте лингвистических уровней. Таким образом, мы считаем, что данная задача реализуема.
Задача 5, дополнительная (выявить диагностирующие для дислексии ошибки в чтении вслух). Это — самая сложная для оценки реализуемости задача. Пока не очень понятно, какое количество ошибок в среднем случается при чтении подростками с дислексией и без нарушений чтения. А для методов машинного обучения необходимо достаточно большое количество наблюдений. В связи с этим, эта задача является дополнительной и возможно по ней не будут достигнуты заявленные результаты.

Современное состояние исследований по данной проблеме, основные направления исследований в мировой науке и научные конкуренты

1. Дислексия и ее подвиды
Дислексия - неспособность к обучению, в первую очередь связанная с навыками чтения и письма (Lyon et al., 2003; Rose 2009; Snowling, 2019). Она проявляется как медленное, часто неточное чтение. Наиболее частый вид дислексии вызван трудностями фонологической обработки, которые затрагивают фонологическую осведомленность (phonological awareness), вербальную память и скорость вербальной обработки (Snowling, 2019; Vellutino et al., 2004). Термин “фонологическая осведомленность” означает способность человека воспринимать, обрабатывать и обобщать звуки речи, представленные в словах, в том числе связывать между собой звуки речи и буквы. Дефицит вербальной памяти подразумевает значительные трудности в запоминании вербальных (например, буквенных) элементов и последовательностей. Скорость вербальной обработки обычно измеряется с помощью тестов на быстрое последовательное называние (например, называние букв или цифр), и общепризнано, что люди с дислексией выполняют эти задания медленнее, чем их сверстники без проблем с чтением. Более медленное выполнение тестов на быстрое последовательное называние (RAN) отражает то, что у людей с дислексией снижена скорость чтения. Фонологические трудности фиксируются у 88% людей с дислексией (Shaywitz & Shaywitz, 2020). Тем не менее, в рамках современного подхода к дислексии считается, что возникновение данного нарушения в сущности зависит от множества факторов. Часто диагноз “дислексия” ставится взрослому или ребенку, только когда фиксируются нарушения нескольких когнитивных компонентов (Pennington, 2006; Snowling, 2019). Кроме фонологии, человек с дислексией может испытывать трудности с слуховой/речевой обработкой и иметь сложности с обработкой зрительной информации (Rusetskaya, 2007; Saksida et al., 2016; Snowling, 2019). Первое проявляется в низкой чувствительности к высоте звуков, их громкости, интенсивности, продолжительности, ритму и т. д. (Goswami, 2011; Tallal, 1980).

Последнее может иметь несколько причин:
(а) затрудненное восприятие контраста и движения, сопровождаемого нарушением контроля движения глаз. Такие нарушения обычно связывают с дефицитом магноцеллюлярной зрительной системы (Lovegrove et al., 1986; Stein, 2018). Эти затруднения обычно определяются задачей на зрительно обнаружение движения (Snowling, 2019). Цель задачи - указать на панель, которая содержит точки, двигающиеся в одном направлении (Hansen et al., 2001).
(b) меньший размер визуального поля внимания, приводящий к трудностям в разделении буквенных последовательностей на отдельные элементы (Bosse et al., 2007). Визуальное поле внимания обычно оценивается следующим образом: на короткий промежуток времени участникам исследования показывается последовательность из 5 букв, после этого она маскируется, и участникам необходимо либо воспроизвести всю последовательность (полный отчет), либо называть букву, стоящую в указанной последовательности на определенном месте (частичный отчет) (Snowling, 2019). Люди с дислексией менее точно справляются с данной задачей, особенно со символами на концах последовательностей.
(c) излишняя подверженность визуальному шуму (Evans, 2001), то есть чтение печатного текста вызывает искажения восприятия, такие как нечеткость или размытость букв, наложение и смешение слов, перемещение букв внутри слов, зеркальное отражение и переворачивание слов вверх ногами, появление гало и бликов и т. д. (Wolańska & Wolański, 2016). Из-за разнообразия возможных симптомов нет всеми признанной задачи, которая объективно измеряла бы влияние визуального шума. Однако чтение слов с цветным наложением (White et al., 2006) или отчеты испытуемых о полосках линий с высокой пространственной частотой (Saksida et al., 2016) иногда используются для выявлении дислексии этого типа.
Кроме того, у людей с дислексией также встречаются сложности в работе оперативной памяти (anchoring deficit) (Ahissar, 2007), симптомы медленного переключения внимания (Gori & Facoetti, 2015; Hari & Renvall, 2001), затрудненное выделение аудиальной информации из шума (Sperling et al., 2005) и нарушения автоматического (имплицитного) контроля двигательных навыков/навыков (гипотеза дефицита мозжечка (Haslum & Miles, 2007; Nicolson & Fawcett, 1990)).
В нескольких исследованиях (Amitay et al., 2002; Ramus et al., 2003; Saksida et al., 2016; White et al., 2006) изучалось, как одни и те же люди с дислексией выполняли ряд когнитивных задач, и их результаты использовались непосредственно для сравнения несколько теорий дислексии (см. выше). Было подтверждено, что фонологический дефицит является основной причиной дислексии. Например, более 90% людей с дислексией в (Saksida et al., 2016) и более половины в (White et al., 2006) показали худшие результаты, чем контрольная группа, в фонологических задачах.
Однако есть доказательства и существования других видов дислексии. Например, в работе (White et al., 2006) оценивались фонологическая обработка, слуховые навыки, влияние визуального шума, механизмы визуального обнаружения движения и двигательные навыки у людей с дислексией и без данного нарушения. Было получено, что фонологические переменные объясняют 60% различий в навыках чтения на групповом уровне, и никакие другие переменные (визуальные, моторные или слуховые) не вносят дополнительного вклада в вариативность скорости чтения. Тем не менее, анализ индивидуальных данных выявил 26% случаев нефонологической дислексии. Все они были вызваны визуальным дефицитом: 83 % — подверженностью визуальному шуму и 17 % — плохими навыками визуального обнаружения движения.
В исследовании Саксиды и др. (2016) сравнивались фонологическая теория дислексии и визуальные теории, приписывающие дислексию подверженности визуальному шуму или суженному визуальному полю внимания. Авторы обнаружили, что результаты теста на выявление визуального поля внимания объясняет некоторые различия в навыках чтения в дополнение к переменным, связанных с точностью выполнения фонологических тестов, которые объясняют большую часть различий. Более того, 28% людей с диагнозом “дислексия” показали уменьшенное визуальное поле внимания, в то время как не было никаких доказательств того, что среди диагностированных случаев дислексии был люди с симптомами визуального шума.

Таким образом, в западных исследованиях, несмотря на преобладание фонологической теории дислексии (Vellutino & Fletcher, 2005), также начинается признаваться оптическая разновидность данного нарушения.
В отечественной науке под дислексией понимается “состояние, основным проявлением которого является стойкая избирательная неспособность овладеть навыком чтения, несмотря на достаточный для этого уровень интеллектуального и речевого развития, отсутствие нарушений слухового и зрительного анализаторов и оптимальные условия обучения” (Корнев, 1997). В отечественной науке также принято разделять понятия дислексии и дисграфии в то время, как за рубежом нарушения письма (дисграфию) зачастую также относят к дислексии.

В отечественной науке также преобладает мнение, что главной причиной дислексии является фонологический дефицит. Теория фонологического дефицита подразумевает, что главную проблему для людей с дислексией представляет процесс, связанный с обработкой фонем (Григоренко, 2010). Помимо теории фонологического дефицита существуют и другие теории дислексии. Например, Е. Л. Григоренко (2010) выделяет еще 4 основных теории, которые объясняют возникновение нарушений чтения:

1. Теория дефицита быстрой аудиторной переработки информации. При таком дефиците основная сложность заключается в обработке слуховой информации.
2. Теория дефицита функционирования мозжечка, согласно которой люди с дислексией имеют нарушения моторных навыков;

3. Теория двойного дефицита, при которой трудности возникают, как и вследствие фонологического дефицита, так и вследствие «быстрого последовательного называния»;
4. Теория дефицита зрительной переработки. Она подразумевает, что у человека возникают трудности с визуальной составляющей текста: буквы могут сливаться друг с другом, плохо распознаваться за счёт графических характеристик.

В современной отечественной логопедии дислексию разделяют на отдельные подвиды в зависимости от того, в чем именно проявляются трудности у ребенка в процессе чтения. Например, выделяют фонематическую, семантическую, аграмматическую, мнестическую и оптическую дислексии (Величенкова & Русецкая, 2015). Фонематическая дислексия связана с недоразвитием функций фонематической системы. Семантическая дислексия (механическое чтение) проявляется в нарушении понимания прочитанного при технически правильном чтении. Аграмматическая дислексия обусловлена недоразвитием грамматического строя речи. Мнестическая дислексия проявляется в трудностях усвоения букв, в их недифференцированных заменах, и в нарушении речевой памяти. Оптическая дислексия проявляется в трудностях усвоения букв и в смешениях сходных букв (л-д, з-в), (т-г, ь-р, н-п-и). Подвиды дислексии определяются на основе различных видов ошибок вслух. Например, мена звуков, схожих по артикуляторно-акустическим признакам, свидетельствует о фонематической дислексии, мена слово на семантически близкое (рука-нога) — о семантической дислексии, аграмматизмы (не подходящие на основе предыдущего контекста словоформы) — о грамматической дислексии, вставки слов – о мнестической дислексии и оптические ошибки — об оптической дислексии.

Также согласно О. А. Величенковой и М. Н. Русецкой, дислексия и дисграфия – это не отдельные расстройства. Они зачастую встречаются вместе с другими нарушениями, например, устной речи. При диагностике дислексии авторы книги выделяют следующие симптомы: низкий темп чтения, большое количество ошибок и низкий уровень понимания прочитанного (Величенкова & Русецкая, 2015; Визель, 2005).

Стоит заметить, что оптическую форму дислексии в отечественной науке выделяют прежде всего на основе ошибок чтения вслух, связанных с оптическим сходством букв. В то время как за рубежом считают, что такие ошибки могут быть вызваны сложностью с запоминанием связи между буквой и звуком (то есть фонологическими причинами) (Snowling, 2019). В отечественной науке также отмечается, что сами по себе ошибки вслух полифакторны, то есть могут свидетельствовать о различных подвидах дислексии (Величенкова & Русецкая, 2015). Таким образом, введение в научный оборот тестов на зрительную обработку по типу тех, которые используются за рубежом, позволит с большей уверенностью выделять оптический подвид дислексии.

Также стоит отметить, что в зарубежной и отечественной науке основными вопросами в данной области является обнаружение когнитивных причин дислексии и методики коррекции ее отдельных подвидов (Shaywitz & Shaywitz, 2020; Величенкова & Русецкая, 2015). В данном проекте мы попробуем взглянуть на дислексию и ее подвиды с точки зрения лингвистических процессов. А именно посмотреть, как лингвистические факторы (например, частотность слов) взаимодействуют с визуальным представлением текста у людей с дислексией в целом и оптических дислексиков в частности.

2. Типографические элементы и дизайн
Основная область знаний, которая сфокусирована на визуальных характеристиках текста — это дизайн. В рамках данной области основной интерес представляют собой такие характеристики типографических элементов как разборчивость (legibility) и удобочитаемость (readability). Под удобочитаемостью понимают качество восприятия знаков и слов при чтении связного текста (Файола, 2003). Разборчивость отражает то, насколько легко или трудно распознать отдельный типографический элемент (например, отдельную букву). О разборчивости обычно говорят по отношении к шрифту. Шрифт — это комплект визуально различных, но единообразно спроектированных знаков всего алфавита, включая буквы, цифры, знаки пунктуации и другие знаки (Файола, 2003). В шрифте также задается базовое межстрочное (интерлиньяж), межсловное и межсимвольное расстояния.
В дизайне считается, что интерлиньяж, так же, как межсловные и межсимвольные интервалы, оказывают непосредственное влияние на удобочитаемость (Крейг & Скала, 2016). При этом сам интерлиньяж определяется гарнитурой (шрифт со всеми его подвидами в отношении насыщенности букв: нормальный, жирный, курсив и т. п.), кеглем (размер букв), длиной строки и др. Помимо интерлиньяжа выделяют такие факторы, которые могут влиять на удобочитаемость, как характер контура букв, контрастность штрихов, шрифта и фона, характер засечек (перпендикулярный штрих на конце буквы, с которого начинается и которым заканчивается основной штрих знака), пропорции сторон, плотность и размер шрифта (Нестерова & Коновалов, 2014).
Из-за такого большого набора факторов, которые могут повлиять на удобочитаемость, рекомендуется интуитивно оценивать визуальное представление текста, а не опираться на какие-то численные значения данных параметров. В целом, приводятся рекомендации следующего типа: увеличение контраста улучшает удобочитаемость, но слишком сильный контраст — ее ухудшает.
Такой же подход преобладает и в отношении разборчивости. Например, есть мнение, что слишком широкие или узкие буквы снижают разборчивость (Нестерова & Коновалов, 2014), но никаких численных порогов не приводится.
При этом также считается, что в связи с богатой историей типографики, предыдущие поколения нашли оптимальные значения основных типографических параметров для конкретных шрифтов (Крейг & Скала, 2016). Это одна из причин, почему в нашем исследовании мы выбрали шрифт для исследования взаимосвязи лингвистических и графических аспектов текста.

3. Влияние визуального представления текста на лингвистические обработку при чтении у людей без нарушения чтения
В рамках психолингвистики интерес к изучению типографических черт появился совсем недавно (Slattery, 2016). На лексическом уровне (графическая обработка, орфографическая обработка, фонологическая обработка, лексический доступ) были исследованы такие лингвистические параметры в взаимосвязи с визуальным представлением текста, как частотность (Paterson & Jordan, 2010; Perea, 2013; Rayner et al., 2006; Slattery & Rayner, 2010) и предсказуемость (Rayner et al., 2006).
В исследовании (Rayner et al., 2006) было показано, что читающие сильнее опираются на предсказуемость при чтении более сложного шрифта (стилизованный под готическое написание Old English), по сравнению со стандартным шрифтом Times New Roman, но показывают схожие эффекты частотности при чтении в обоих шрифтах. При этом в целом Old English читался дольше, чем Times New Roman. В (Perea, 2013) также не было найдено взаимодействие между частотностью и такой типографической характеристикой как наличие засечек (сравнивались Lucida Serif и Lucida Sans). Также не было получено значимой разницы между чтением между вариантами шрифта c засечками и без, хотя некоторые дизайнеры считают, что шрифт с засечками обладает большей удобочитаемостью (Нестерова & Коновалов, 2014).
Slattery и Rayner (2010) исследовали разборчивость. Было показано, что стилизованные под рукописные шрифты менее разборчивы, чем стандартный шрифт Times New Roman. Но главное, что читающие больше опираются на частотность при чтении слов в таких шрифтах. Также было найдено взаимодействие между размером межсимвольного и межсловного интервала и частотностью слов (Paterson & Jordan, 2010). Для условий с увеличенными интервалами для шрифта Courier исследователи обнаружили большее влияние частотности.
В целом при исследовании межстрочных и межсимвольных интервалов (безотносительно лингвистических характеристик) было найдено подтверждение предложения дизайнеров: увеличенные в небольшой степени интервалы улучшают скорость распознавания слов (Perea et al., 2012; Perea & Gomez, 2012), однако существует порог, после которого преимущество переходит в недостаток (Paterson & Jordan, 2010; Pelli et al., 2007).
Если обратиться к цвету, то было найдено следующее. Выделение цветом отдельных слов помогает китайцам читать быстрее (Perea & Wang, 2017) и может повлиять на конкуренции между словами при лексическом доступе (Marcet et al., 2019).

В отечественной науке благодаря исследованию разборчивости шрифтов Georgia и Courier New (Алексеева et al., 2019) было показано, что по-видимому буквы в слове и буквы, предъявленные сами по себе, распознаются по-разному. В первом случае преобладает стратегия распознавания по частям (то есть буквы идентифицируются по отдельным чертам), в то время как во втором случае — образ буквы схватывается целиком.
Так как частотность — это тот показатель, которому отдается первостепенное место в моделях распознавания слов при чтении (Engbert et al., 2005; Grainger & Jacobs, 1994; Reichle & Sheridan, 2015; Rumelhart & McClelland, 1982; Whitney, 2001) и текущие результаты относительно взаимодействия визуальных характеристик и частотности неоднозначны, в рамках данного проекта на лексическом уровне мы сфокусируемся на этом факторе.
Что касается других уровней, то исследования также немногочисленны. Например, не было обнаружено взаимосвязи между размером шрифта и пониманием (семантика) набора терминов, определения для которых нужно было выделить из прочитанного текста (Tavakoli & Kheirzadeh, 2011). При этом понимание статей Википедии улучшается, если размер шрифта увеличить с 10 pt до 18 и больше (Rello et al., 2016). Уменьшение размера шрифта и увеличение слов в строке отрицательным образом сказывается на понимании прочитанного у второклассников (Katzir et al., 2013).
Добавление дефисов между слогами (фонетика) замедляет чтение слов на финском у детей, которые начинают читать, в то время как использование различных цветов для различных слогов значимо не отличается от чтения без использования цвета (Häikiö et al., 2015). Также было показано при помощи выделения цветом границ слогов и морфем в немецких словах, что ученики вторых классов скорее опираются при чтении на слоги, а ученики четвертых классов — на морфемы (грамматика) (Hasenäcker & Schroeder, 2017).
Что касается исследований на русском языке, нам удалось обнаружить следующее. Не было найдено отличий в понимании прочитанного между версиями шрифта PT с засечками и без (Akhmadeeva et al., 2012). В дополнение, Arial (без засечек) и Book Antiqua (с засечками) превзошли в понимании текста Times New Roman (с засечками) и Comic Sans (без засечек) (Морозова & Мурин, 2013), что также показывает неоднозначность влияния засечек на понимание текста.
Данные исследования показывают, что эффекты, связанные с визуальным представлением текста, могут быть обнаружены на более высоких лингвистических уровнях. Однако, в перечисленных исследованиях тот или иной графический элемент изучался в приложении к одному или двум лингвистическим уровням. В нашем проекте мы посмотрим, как шрифт влияет сразу на несколько языковых уровней. Для этого мы проанализируем ошибки чтения вслух, затрагивающие разные лингвистические уровни, в зависимости от шрифта. Анализ ошибок вслух — это одна из распространенных методик обнаружения подвидов дислексии в рамках психологии и педагогики.

4. Влияние визуального представления текста на чтении у людей с дислексией
В рамках данной области фокус исследования состоит в тестировании различных типографических характеристик на предмет поиска оптимальных для людей, испытывающих сложности с чтением. Влияние визуального представления текста на лингвистическую обработку у людей с дислексией (в отличие от нашего проекта) не является основным предметом исследования в данной подобласти.
Как было сказано выше (см. п. 1 выше), среди людей с дислексией существует подгруппа, у которой проблемы с чтением вызваны в основном или частично нарушениями зрительной обработки. Для такого рода дислексиков были разработаны специализированные шрифты. Для латинского алфавита это Dyslexie, OpenDyslexic, EasyReadingT, Sylexiad, Read Regular, Lexia Readable, Polish Doferm (Wolańska & Wolański, 2016). Наиболее популярные шрифты - это Dyslexie и OpenDyslexic (Wolańska & Wolański, 2016). Ключевыми особенностями обоих шрифтов являются разные формы для легко смешиваемых букв и утолщенные нижние части букв (для преодоления искажений восприятия, например, переворачивания букв). Для шрифта Dyslexie характерно увеличение расстояния между буквами и словами. Дизайнеры этих шрифтов, сами обладающие дислексией, инстинктивно использовали особенности, которые могли бы помочь преодолеть симптомы визуального шума и суженного поля зрительного внимания.
На сегодняшний день только три латинских шрифта были эмпирически протестированы на людях с дислексией. Это Dyslexie (Duranovic et al., 2018; Kuster et al., 2018; Leeuw, 2010; Marinus et al., 2016), OpenDyslexic (Rello & Baeza-Yates, 2013; Wery & Diliberto, 2017; Zikl et al., 2015) и EasyReadingTM (Bachmann & Mengheri, 2018). EasyReadingTM, как и Dyslexie, характеризуется увеличенным расстоянием между символами, словами и строками текста.
Контрольными шрифтами являлись Arial (Kuster et al., 2018; Leeuw, 2010; Marinus et al., 2016; Wery & Diliberto, 2017), Curlz MT (Duranovic et al., 2018) и Times New Roman (Bachmann & Mengheri, 2018; Duranovic et al., 2018; Wery & Diliberto, 2017). Rello и Baeza-Yates (2013) использовали Arial, Arial Italic, CMU, Courier, Garamond, Helvetica, Myriad, Times, Times Italic и Verdana в качестве контрольных шрифтов. География участников варьировалась от Австралии (Marinus et al., 2016), Боснии и Герцеговины (Bachmann & Mengheri, 2018), Чехии (Zikl et al., 2015) и Нидерландов (Kuster et al., 2018; Leeuw, 2010) до Италии (Bachmann & Mengheri, 2018), Испании (Rello & Baeza-Yates, 2013) и США (Wery & Diliberto, 2017). Ни в одном из этих исследований не проверялись навыки зрительной обработки у участников с дислексией.

В большинстве исследований (Kuster et al., 2018; Leeuw, 2010; Rello & Baeza-Yates, 2013; Wery & Diliberto, 2017; Zikl et al., 2015) не было найдено доказательств того, что специализированные шрифты отличаются от контрольных в плане скорости чтения. Однако в большинстве исследований (кроме Rello & Baeza-Yates, 2013) для измерения скорости чтения использовалась задача чтения вслух. Можно предположить, что стадия артикулирования могла помешать проявлению эффекта шрифта. С другой стороны, Bachmann и Mengheri (2018), Duranovic et al. (2018), и Marinus et al. (2016) также использовали тест на чтение вслух и выявили превосходство шрифтов для людей с дислексией над контрольными шрифтами в беглости чтения у участников с дислексией. Помимо скорости, Bachmann & Mengheri (2018) и Duranovic et al. (2018) измеряли точность чтения. По этому показателю люди с дислексией также показали лучшие результаты при чтении текстов, представленных шрифтами для людей с дислексией. Аналогичные результаты по точности были получены в работе (Leeuw, 2010).

Поскольку предыдущие исследования показали, что увеличенное расстояние между буквами помогает людям с дислексией преодолеть визуальную скученность (негативное влияние соседних букв; crowding) и читать быстрее (Zorzi et al., 2012), то положительное влияние специализированных шрифтов для людей с дислексией, найденное выше, может быть обусловлено исключительно увеличением расстояния между буквами — основной характеристикой специализированных шрифтов (Bachmann & Mengheri, 2018; Duranovic et al., 2018; Marinus et al., 2016). Действительно, контрольные шрифты с увеличенным расстоянием между буквами (Duranovic et al., 2018) или между буквами и словами (Marinus et al., 2016) (таким же по величине, как в шрифтах для людей с дислексией) приводили к исчезновению первоначального преимущества специализированных шрифтов перед контрольными (Duranovic et al., 2018; Marinus et al., 2016). Тем не менее, даже в такой ситуации не было обнаружено доказательств того, что шрифты для людей с дислексией работали хуже, чем контрольные шрифты, хотя первые предположительно были незнакомыми для участников исследования.
Для данного проекта особый интерес представляет работа (Leeuw, 2010). В данной работе помимо скорости чтения (см. выше) исследовалось то, как шрифт влияет на различные виды ошибок чтения вслух. Данные ошибки затрагивают различные лингвистические уровни: фонетику (пропуск одного из согласного в стечении гласных, замена звука на фонетически похожий) и графику (замену буквы на оптически похожую букву; перестановки букв внутри слова). Было показано, что люди с дислексией делают меньше ошибок как оптической, так и фонетической природы в специализированном шрифте, чем контрольном. В нашем проекте мы воспользуемся тем же методом исследования, что и в данной работе, для изучения влияния шрифта на лингвистическую обработку на разных уровнях (см. 5 ниже). Обратимся к шрифтам для дислексиков для кириллического алфавита. Кириллических шрифтов для людей с дислексией гораздо меньше, но всё же они существуют: Adys из Болгарии, Dyslexic FZF (Karovska Ristovska & Filipovska, 2018) из Македонии, Антидислексия [Antidyslexia] от русскоговорящего дизайнера, живущего в Канаде, и LexiaD из России.
На сегодняшний день протестирован только шрифт LexiaD (Alexeeva et al., 2020, 2022, на рецензировании). LexiaD — это пропорциональный шрифт без засечек, предназначенный для большего размера букв. Среди других характеристик можно выделить следующее: расстояние между буквами, словами и строками увеличено; объем белого цвета внутри букв также увеличен. В отличие от латинских аналогов, шрифт основан на сходствах букв, объективно оцененных в предварительном исследовании с применением методики регистрации движений глаз (Конина & Алексеева, 2016). Тестирование шрифта LexiaD при чтении про себя показало следующее (Alexeeva et al., 2020, 2022, на рецензировании): (a) шрифт LexiaD показывает положительный эффект при извлечении информации, необходимой для опознавания конкретных букв (далее извлечение признаков), и интеграции текста (но отрицательный эффект для лексического доступа) по сравнению с незнакомыми, но стандартными шрифтами PT Serif и PT Sans у детей младшего школьного возраста с дислексией и без нее при чтении с экрана компьютера; (b) шрифт LexiaD имеет преимущество на этапе извлечения признаков, но только после того, как участники привыкнут к шрифту (без существенной разницы в скорости чтения на этапах лексического доступа, интеграции текста и глобальной обработке прочитанного), в сравнении с Arial, популярным шрифтом без засечек с низким качеством кириллических букв у подростков с дислексией и без нее, при чтении с экрана компьютера; (c) шрифт LexiaD по глобальной скорости чтения уступает Roboto, набирающему популярность современному и схожему с Arial шрифту с хорошим качеством кириллических букв у подростков без дислексии при чтении печатного текста; (d) шрифт LexiaD по глобальной скорости чтения не отличался от Times New Roman, распространенного шрифта с засечками у подростков без дислексии при чтении печатного текста.
Более важным для данного проекта является то, что скорость чтения с экрана компьютера в исследуемых шрифтах у младших и старших школьников с дислексией и без нарушений чтения зависела от частотности слова (Alexeeva et al., 2020; Alexeeva, Zubov, & Konina, 2022). Все четыре группы показали, что для высокочастотных слов LexiaD имеет преимущество над контрольными шрифтами, в то же время на низкочастотных словах показывает схожие с контрольным шрифтом результаты (Alexeeva et al., 2020; Alexeeva, Zubov, & Konina, 2022). Это подтверждает то, что визуальное представление текста может оказывать влияние на лингвистические процессы и требует дальнейшего изучения.

5. Классификации ошибок вслух при чтении детьми с дислексией
Одним из основных способов определения подвидов дислексии является анализ ошибок вслух (Величенкова & Русецкая, 2015). Ошибки показывают сложности на разных лингвистических уровнях и в соответствии с этим в отечественном подходе у ребенка или взрослого отмечаются тот или иной подвид дислексии (например, фонематическая или грамматическая дислексия). Как мы видели в пункте 4, типографические характеристики (в частности, шрифт) могут оказывать влияние на ошибки вслух различных типов. В связи с этим, в данном проекте мы также произведем анализ ошибок вслух и посмотрим, как шрифт влияет на количество ошибок тех или иных типов. Одной из задач данного проекта на этапе написания заявки был поиск наиболее удобной и подробной классификации ошибок при устном чтении. Мы проанализировали несколько диссертаций и статей на русском и английском языках, посвященных ошибкам в чтении и устной речи для того, чтобы выявить все возможные типы ошибок вслух (Crystal, 2012; Dorofeeva et al., 2019; Goodman, 1969; Lichtenberger & Smith, 2005; Schrank et al., 2014; Stafford, 1967; Stemberger, 1989; Stuever, 1969; Weber, 1970; Завадская, 2018; Подлесская & Кибрик, 2007; Русецкая, 2003; Садовникова, 2005; Сапунова, 2009)
А. Н. Корнев выделяет основные типы ошибок, которые встречаются практически в каждом экспериментальном исследовании: замены гласных и согласных, добавления, перестановки, инверсии, ошибки угадывающего чтения и чтение по слогам (Корнев 1997). В диссертации М. Н. Русецкой о связи дислексии с нарушениями речи (2003) приведена классификация 20 типов ошибок. Она отличается от предыдущей тем, что в ней уточнены типы вовлеченных в ошибку звуков (согласные или гласные), а также причины их смешения (наличие акустико-артикуляторного или визуального сходства). В эту классификацию также входят такие типы, как аграмматизм, антиципации (замена звука на предвосхищаемый звук), "персеверация" (замена звука на персеверируемый звук) и неправильное ударение. Работа Русецкой показала сложную природу ошибок. Почти каждая ошибка в слове может быть отнесена сразу к нескольким типам; например, изменение окончания существительного — это и аграмматизм, и замена одного или нескольких звуков. Это означает, что одна и та же ошибка может отражать трудности на разных языковых уровнях.
Версия классификации С. В. Дорофеевой (Дорофеева и др., 2019) более лаконична: в ней присутствует разделение ошибок по количеству звуков, в которых есть ошибка, а также по тому, какой частью речи является слово (основной или служебной). Стоит также отметить, что в ее классификации было проведено разделение ошибок без самоисправления и с самоисправлением. В (Садовникова 2005) приведены конкретные пары акустико-артикуляторных сходных звуков, а также автором выделен новый тип ошибок ("смешение звуков по кинетическому сходству"). Пособие И. Н. Садовниковой оказалось полезным еще и потому, что в нем упоминается тот факт, что персеверации и антиципации возможны в пределах нескольких слов, а не только в пределах одного слова.
Е. М. Сапунова (2009) и А. А. Кибрик и В. И. Подлесская (2007) показали нам, что несколько слов в строке могут быть затронуты оговоркой. Кроме того, возможны и более сложные случаи. В частности, исправление неправильно произнесенного слова может сопровождаться повторением нескольких предыдущих изначально правильных слов. Фальстарты, которые часто называют "обрывами", находятся в центре типологии Ю. О. Завадской (2018). Ю. О. Завадская также приводит несколько типов возможных реакций на обрывы (вербальных и невербальных) и способы заполнения пауз в речи.
Необходимо также упомянуть классификации, разработанные для английского языка. Прежде всего, мы обратились к руководству "The Woodcock-Johnson Best of Achievement-IV" (Mathler & Wendling 2014). Это широко используемый тест для оценки когнитивных способностей, который также включает блок с чтением вслух. В руководстве к тесту выделяют такие ошибки, как замены, пропуски, вставки и возвраты звуков, что также является ключевой особенностью почти всех русских классификаций. Также были проанализированы пособия по другим англоязычным текстам на чтение вслух (Stafford 1967, Stuever 1969). К. Стефорд (1967) подчеркивает структурный аспект ошибок: находятся ли они в начале, в середине или в конце или затрагивают несколько частей слова. Среди источников ошибок устной речи следует также выделить классификацию Й. Штембергера (Stemberger 1989: 168). Он заметил, что ошибки могут быть семантически, синтаксически или фонетически (не)приемлемыми. Классификация 20 наиболее частых категорий речевых ошибок в "Кембриджской энциклопедии языка" (Crystal 2012) напомнила нам, что необходимо обращать внимание на кластеры согласных.
Проанализировав все эти источники, мы пришли к выводу, что необходимо создать собственную классификацию ошибок, соотнеся каждую ошибку, упомянутую в предыдущих исследованиях, с определенным лингвистическим уровнем. 

6. Методы машинного обучения при предсказании дислексии

Для автоматической диагностики дислексии используются данные когнитивных тестов (Chakraborty & Sundaram, 2021; Latifoğlu et al., 2020; Mulakaluri & Girisha, 2020; Rello et al., 2018), параметры движений глаз при чтении (Asvestopoulou et al., 2019; Benfatto et al., 2016; Chakraborty, 2020; Rello & Ballesteros, 2015), сигналы ЭЭГ (Frid & Manevitz, 2018; Mulakaluri & Girisha, 2020; Perera et al., 2018; Rezvani et al., 2019) и ФМРТ (Cui et al., 2016; Ploński et al., 2017), аудио- записи (Radford et al., 2021; Tolami et al., 2021) и опросники (Jayasinghe, 2019). Результаты достигают точности более 95% (Chakraborty, 2020; Latifoğlu et al., 2020; Mulakaluri & Girisha, 2020). Среди лучших методов классификации выделяют K-means (Jayasinghe, 2019; Kariyawasam et al., 2019; Mulakaluri & Girisha, 2020), Random Forest (Latifoğlu et al., 2020), SVM (Benfatto et al., 2016; Chakraborty, 2020; Chakraborty & Sundaram, 2021; Rello & Ballesteros, 2015; Rezvani et al., 2019), нейронную сеть (Radford et al., 2021). Методы работают на от 5 до более 220 признаков — различных измерений когнитивного поведения людей с дислексией и без нарушения чтения (Chakraborty, 2020; Kaisar, 2020). Хотя в большинстве случаев количество участников в экспериментальной (с дислексией) и контрольной группе (без дислексии) приближается к 100 и даже больше (Kaisar, 2020), в некоторых исследованиях размер каждой группы участников составляет лишь 30-50 человек (Cui et al., 2016; Perera et al., 2018; Ploński et al., 2017; Radford et al., 2021; Rello & Ballesteros, 2015; Rezvani et al., 2019; Richard & Serrurier, 2020).
Проанализировав литературу, мы пришли к выводу, что нам необходимо как минимум 30 человек в экспериментальной группе для более или менее успешного предсказания дислексии. Помимо когнитивных тестов мы построим классификатор с учетом различных ошибок чтения вслух. Прежде всего, мы воспользуемся методом классификации SVM, так как это наиболее популярный метод в области.


Предлагаемые методы и подходы, общий план работы на весь срок выполнения проекта и ожидаемые результаты

Задача 1 (определения объекта исследования и выборки) была определена на этапе написания заявки.
Объектом исследования с точки зрения визуального представления стал шрифт. Мы остановились на данном типографическом элементе по следующей причине. Проанализированная литература (см. пункт 2, формы 4.5) показывает, что именно шрифты построены таким образом, чтобы оптимальным образом учесть как можно больше параметров, которые влияют на удобочитаемость текста. Таким образом, выбрав шрифт как основной объект исследования, мы сможем проследить его возможное влияние на лингвистические процессы в оптимальном с точки зрения дизайна виде. При этом мы решили провести исследование, привлекая 4 различных шрифта, чтобы тем не менее оценить различия с точки зрения некоторых базовых типографических характеристик. Ими стали Times New Roman, Roboto, LexiaD и Антидислексия.

Times New Roman – это широко используемый пропорциональный шрифт с засечками, Roboto (шрифт по умолчанию для Google-приложений) — это широко используемый пропорциональный шрифт без засечек. Наши исследования показывают, что по субъективной частотности использования (знакомости) данные шрифты значимо не отличаются (Alexeeva, Zubov, & Konina, 2022; Alexeeva, Zubov, & Nikonova, 2022). Тем не менее они фундаментальным образом отличаются друг от друга по наличию засечек. С точки зрения оптической дислексии важно протестировать шрифты специально созданные для людей с дислексией. В связи с этим в набор шрифтов включены LexiaD (Alexeeva et al., 2020) и Антидислексия (http://app.prostoslovo.com). Эти шрифты оба без засечек, но при этом LexiaD — пропорциональный, а Антидислексия — моноширинный. Хотя LexiaD был протестирован относительно ряда шрифтов (Alexeeva et al., 2020; Alexeeva, Zubov, & Konina, 2022; Alexeeva, Zubov, & Nikonova, 2022), он не сравнивался с Times New Roman и Roboto в группе с дислексией. Шрифт Антидислексия ранее протестирован не был.

Таким образом, мы сможем оценить в первом приближении влияние таких характеристик шрифта, как засечки (сравнив Times New Roman и Roboto), пропорциональность (сравнив LexiaD и Антидислексию) и предназначенность для людей с дислексией (сравнив Times New Roman/Roboto и LexiaD/Антидислексию), на лингвистическую обработку на разных уровнях.

В качестве основной выборки мы остановились на подростках возраста 15-17 лет по следующим причинам. Мы получили предварительное согласие на проведение исследования в Речевой школе 3 (г. Санкт-Петербург), а наши предыдущие исследования показывают (Alexeeva et al., 2020; Alexeeva, Zubov, & Konina, 2022), что в данной школе действительно учатся дети со значимо сниженной скоростью чтения, то есть с высоким риском дислексии. Следовательно, мы считаем, что мы сможем найти достаточное количество школьников с высоким риском дислексии для достоверных выводов по нашим основным вопросам. В связи с этим, мы не можем, к примеру сфокусироваться на взрослых, так как для нас нет очевидных способов нахождения людей с дислексией в этой возрастной категории. Тем не менее, мы проведем часть экспериментов и на взрослых (без нарушений чтения), чтобы подтвердить ранее найденное взаимодействие между типом шрифта и частотностью у взрослых носителей языка без проблем с чтением Paterson & Jordan, 2010; Slattery & Rayner, 2010). Мы расцениваем эту возрастную категорию как дополнительную. Что касается школьников, мы остановились на подростках, так как наше исследование предполагает прохождение множества тестов (см. ниже), которое может занять больше часа и школьникам младшего возраста будет сложно полностью его пройти. Поэтому мы решили привлечь школьников старшего возраста.

Задача 2 (оценка выборки на предмет дислексии и ее подвидов).
Для определения наличия высокого риска дислексии у того или иного подростка необходимо собрать современные нормы чтения вслух у подростков без наличия нарушений чтения. Недавние подобные нормы для детей младшего возраста были собраны (Dorofeeva et al., 2019). Воспользовавшись дизайном и процедурой данной работы, мы предполагаем собрать данные при чтении вслух у 90-100 подростков без истории диагностированных неврологических расстройств, диагностированных проблем с освоением чтения, с нормальным или скорректированным до нормального зрением (информация об этом будет собрана при помощи опроса) и нормальным уровнем невербального интеллекта и рассчитать среднюю скорость чтения. В (Dorofeeva et al., 2019) высокий риск дислексии был определен как низкая скорость чтения (соответствующая скорости меньшей, чем разницы между средним и 1,5 стандартных отклонений). Невербальный интеллект будет протестирован при помощи матриц Равена (Равен & Корт, 2002). Скорость чтения будет померена по методики СМИНЧ (Корнев & Ишимова, 2010) на одном тексте: количество правильных прочитанных слов за 1 минуту чтения. Выбор материала (текста) и вопросов на понимание к ним будет осуществлен во время консультации с логопедами Речевой школы 3.
Для определения двух интересующих нас подвидов дислексии (оптической и фонематической) мы проведем ряд тестов:
- субтест «Замена звука в псевдослове» из батареи тестов ЗАРЯ, разработанной в Центре языка и мозга НИУ ВШЭ. Он показывает сложности в фонологической обработке c наибольшей достоверностью (Dorofeeva et al., 2020).
- тест на чтение отдельных слов и псевдослов, разработанный в Центре языка и мозга НИУ ВШЭ (Дорофеева et al., 2021). Он показывает другой аспект проблем с фонологической обработкой.
- тест на проверку зрительной обработки. Мы хотим протестировать две возможных причины оптической дислексии: уменьшенное поле визуального внимания и повышенная восприимчивость к визуальному шуму. Для этого мы адаптируем тест на поиск букв в массиве с частичным отчетом (см. подробнее форму 4.5, п. 1) так, чтобы он показывал сложности в этих двух аспектах – изначально он разработан только для определения уменьшенного поля визуального внимания (Snowling, 2019). Процедура исходной версии — следующая. Участникам показывают последовательность букв, потом ее маскируют (заменяют буквы на звездочки) и стрелкой указывают на какую-то из звездочек, участник должен назвать букву, которая стояла в последовательности на этом месте. Люди с оптической дислексией выполняют эту задачу хуже, чем люди без дислексии. При этом наибольшие сложности вызывают позиции на концах последовательности (в отдалении от точки взора). В нашей версии после показа последовательности мы будем предъявлять две буквы и просить участников выбрать, какая из букв была частью ранее предъявленной последовательности. Позиция «правильной» буквы будет варьироваться в последовательности. Так мы сможем оценить сложности в поиске букв на концах последовательности. Такой дизайн будет снижать нагрузку на вербальную память (не нужно называть конкретную букву). Сниженная вербальная память сама по себе может быть причиной дислексии. Кроме того, в паре с правильной буквой мы будем показывать либо визуально похожие, либо визуально непохожие буквы. Это, по нашему мнению, поможет выявить сложности, связанные с особой восприимчивостью к визуальному шуму. Визуально похожие буквы для русского языка были определены нами ранее (Алексеева et al., 2019; Конина & Алексеева, 2016).

Таким образом, каждый участник с предполагаемой дислексией (из Речевой школы) и без предполагаемых нарушений пройдет следующие тесты: тест по методике СМИНЧ, определяющей скорость чтения, тест на невербальный интеллект, тест на замену звука в псевдослове, тест на чтение слов и псевдослов и тест на зрительную обработку. Кроме того, у каждого участника мы соберем демографическую информацию и информацию, связанную с речевыми нарушениями. Все эти тесты позволят нам выделить участников с высоким риском дислексии, а среди них участников с фонематической, оптической, смешанной и дислексией другого типа.

Задача 3. (эксперимент, нацеленный на изучение скорости распознавания слов в зависимости от типа шрифта и частотности).
В качестве методической основы мы возьмем исследование (Moret-Tatay & Perea, 2011), в котором изучалось влияние засечек в семействе шрифтов Lucida на скорость распознавания отдельных слов. Исследование было проведено методом лексического решения (участнику необходимо определить при помощи нажатия клавиш на клавиатуре, является ли предъявленная последовательность букв словом или псевдословом), измерялась скорость распознавания отдельных слов и псевдослов. Мы включим в эксперимент не менее 50 реальных слов на каждый шрифт, из них 50% будут низкочастотными и 50% высокочастотными. Мы создадим две версии эксперимента. В первой версии будут исследоваться Times New Roman, Roboto и Антидислексия, во второй — Times New Roman, Roboto и LexiaD. Включение всех четырех шрифтов в один шаблон сильно бы увеличило время прохождения эксперимента. Поэтому мы остановились на двух версиях.

Эксперимент пройдут все участники с высоким риском дислексии, а также подростки и взрослые без нарушений чтения. Мы предполагаем, основываясь на литературе (Paterson & Jordan, 2010; Slattery & Rayner, 2010), что по крайней мере для участников без нарушений фактор частотности будет сильнее выражен в новых для них шрифтах LexiaD и Антидислексия, чем для Times New Roman и Roboto. В отношении экспериментальной группы на данный момент предположений нет.

Задача 4. (эксперимент, нацеленный на изучение влияние типа шрифта на количество ошибок, относящихся к разным языковым уровням)
Как показал анализ литературы, относящийся к классификациям ошибок вслух (см. форму 4.5, п. 5), читающие могут делать большое количество разнообразных ошибок. По предварительным подсчетам не менее чем 25-30. В связи с этим, для изучения влияния типа шрифта на количество ошибок различных видов мы ограничимся исследованием двух шрифтов: Roboto и LexiaD. Мы выбрали Roboto, так как это современный популярный шрифт, кроме того, он так же, как и LexiaD, является шрифтом без засечек. Мы выбрали LexiaD, так как при изучении дислексии важно исследовать шрифты, предназначенные для дислексиков. Мы предпочли LexiaD над Антидислексией, так как мы не имеем доступа к самому шрифтовому файлу для шрифта Антидислексия, этот шрифт не распространяется в настоящий момент. Для задачи 3 (см. 4.7. «Задел исследования») автор шрифта уже прислал нам список слов, набранных в шрифте Антидислексия.

Методика эксперимента будет следующая. Участники исследования будут читать вслух два текста, один из которых будет набран в Roboto, другой — в LexiaD. В соответствии с рекомендациями СМИНЧ (Корнев & Ишимова, 2010) мы ограничимся одной минутой чтения. Мы будем вести аудиозапись, затем расшифруем записи и выделим различные виды ошибок. Воспользуясь анализом существующих классификаций ошибок (см. форму 4.5, п. 6), мы создадим собственную классификацию ошибок, в которой ошибки будут соотнесены с тем или иным лингвистическим уровнем (семантическим, грамматическим, фонетическим и прагматическим), и распределим ранее выделенные ошибки по данной классификации. Выбор материала (текста) и вопросов на понимание к ним будет осуществлен во время консультации с логопедами Речевой школы 3.

Данный эксперимент пройдут подростки с нарушением чтения и без такого.
Далее статистическим методом мы определим влияния шрифта на ошибки на различных лингвистических уровнях.

Мы предполагаем, что для Задач 3 и 4 у нас наберется достаточное количество подростков с дислексией, чтобы сравнить влияния шрифта на лингвистическую обработку у участников без нарушения чтения и с дислексией в целом. Однако, мы не можем гарантировать, что то количество оптических и фонематических дислексиков внутри экспериментальной группы, которое мы выявим по результатам задачи 2, позволит нам с уверенностью сделать выводы для отдельных подвидов дислексии.

Задача 5 (предсказание дислексии на основе ошибок вслух)
Полученная после выполнения задачи 4 таблица ошибок чтения вслух для подростков с дислексией и без нарушений чтения будет являться пространством признаков для разработки классификатора, который предсказывал бы наличие дислексии у того или иного ребенка. Мы надеемся, что в рамках Задачи 2 мы выделим не менее 30 дислексиков. При этом у нас будут расшифровки ошибок вслух для не менее 90-100 (см. выше Задача 2) подростков без нарушений чтения. И для каждого участника у нас будет от 25 до 50 измерений (различных ошибок). Далее мы попробуем предсказать дислексию на основе данных признаков при помощи SVM (наиболее популярного классификатора в области, см. форму 4.5, п. 5) с 10-ти проходной перекрестной проверкой (кросс-валидацией). Классификатор позволяет выделить наиболее диагностирующие признаки, то есть в нашем случае ошибки.
Эта задача является дополнительной, так как мы не уверены, что данных хватит для того, чтобы предсказать наличие высокого риска дислексии хотя бы с 90% точностью.

Общий план работы на весь срок проекта и ожидаемые результаты
2022 год (на этапе написания заявки):
Решена Задача 1 (см. выше), частично решена Задача 3 (см. форму 4.7 «Задел» ниже) 2023 год 

- План: решена Задача 2. Результаты: рассчитаны современные нормы чтения вслух у подростков без дислексии; разработан тест на зрительную обработку; собраны когнитивные тесты у подростков из обычных и речевой школ; выявлены подростки с высоким риском дислексии в целом и ее подвидов (оптической, фонематической, смешанной из оптической и фонематической и другого рода)

- План: частично решены Задача 3 и 4. Результаты: собраны данные для эксперимента в рамках Задачи 3; подобран материал и собраны данные для эксперимента в рамках задачи 4.
2024:
- План: Решена Задача 3. Результаты: проведен статический анализ и оценено влияние типа шрифта на эффект частотности при распознавании слов у подростков с нарушениями чтения и без них, а также у подростков и взрослых без нарушений.

- План: Решена Задача 4. Результаты: составлена многофакторная классификация ошибок чтения вслух; ошибки чтения вслух распределены по классификациям; проведен статистический анализ; оценено влияние типа шрифта на ошибки, относящихся к разным лингвистическим уровням у подростков с нарушениями чтения и без них.

- План: решена Задача 5. Результаты: построен классификатор на основе ошибок вслух для предсказания дислексии; оценено наличие диагностирующих ошибок при чтении вслух.


Имеющийся у научного коллектива научный задел по проекту, наличие опыта совместной реализации проектов

В рамках Задачи 3 (см. предыдущий пункт) отобран материал, разработан шаблон эксперимента и проведен пилотный сбор данных по исследованию влияния шрифта (Roboto, Times New Roman, Антидислексия) на эффект частотности у взрослых носителей русского языка без нарушения чтения. Было показано, что взрослые носители языка в большей степени опираются на частотность при распознавании слов в Антидислексии, чем Roboto. Однако, между остальными парами шрифтов не было обнаружено подобной разницы на статически значимом уровне. Пилотный эксперимент был проведен совместно с Яной Никоновой, участницей проекта и отражен в курсовой работе (Никонова Я. Эффект шрифта при чтении взрослыми носителями русского языка. Курсовая работа 3 курса. Санкт-Петербургский государственный университет. Санкт-Петербург). Разработанный шаблон эксперимента предполагается использовать в данном проекте.

Опыт совместной реализации проекта с остальными участниками проекта.
Алиса Лезина под руководством Светланы Алексеевой (руководителя проекта) провела исследование стратегии идентификаций букв в слове носителями финского языка. Использовался метод поиска букв в слове — этот метод очень похож на метод, который лежит в основе зрительного теста, который необходимо будет адаптировать для русского языка в данном проекте. Было показано, что для носителей финского языка действует параллельная стратегия распознавания букв, а не последовательная, как предполагалось в соответствии с гипотезой М. Ктори и Н. Питчфорда (Ktori & Pitchford, 2008). Результаты исследования отражены в курсовой работе (Лезина А. Закономерности распознавания буквенного состава слова в языках с разным типом орфографии. Курсовая работа 1 курса. Национальный исследовательский университет «Высшая школа экономики». Санкт-Петербург).

Светлана Алексеева и Анастасия Шиморина являются участниками проекта OpenCorpora (opencorpora.org). Проект представляет собой ресурс для морфологической разметки текста по технологии crowdsourcing. В обязанности Светланы Алексеевой и Анастасии Шимориной входит написание инструкций по морфологической разметке и проверка разметки, выполненной другими участниками проекта. На настоящий момент Анастасией и Светланой проверено 10971 предложений (более 70000 слов).

АкронимRSF_SRG_2023 - 2
СтатусВыполняется
Эффективные даты начала/конца1/01/2431/12/24

    Области исследований

  • чтение, подростки, визуальное представление текста, дислексия, оптическая дислексия, фонематическая дислексия, шрифты, тест на зрительную обработку, русский язык

ID: 115552989