Визуальное представление текста и лингвистическая обработка: механизмы чтения у людей с дислексией: 2024 г. этап 2

Алексеева, Светлана Владимировна (руководитель)
Никонова, Яна Евгеньевна (исполнитель)
Колтунцева, Виктория Евгеньевна (исполнитель)
Черевик, Александра Сергеевна (исполнитель)
Чупрова, Кристина Евгеньевна (исполнитель)
Никонова, Яна Евгеньевна (исполнитель)
Колтунцева, Виктория Евгеньевна (исполнитель)
Бурдына, Александра Владимировна (исполнитель)

описание

Научная проблема, на решение которой направлен проект
Визуальное представление текста при исследовании механизмов чтения является одним из наименее проработанных направлений в рамках современной психолингвистики чтения (Slattery, 2016). До конца не ясно, как влияет на скорость чтения изменение шрифта, размера букв, интерлиньяжа (расстояния между строками), фона и т. п. Такое положение дел вызвано тем, что первоначально лингвисты и психологи предполагали, что шрифт или другие типографические характеристики не будут оказывать влияние на собственно лингвистические процессы. То есть лингвистические эффекты будут одинаковым образом представлены при любом визуальном представлении. Однако, недавние результаты противоречат исходному предположению. Например, было показано, что при более сложном шрифте (напр. стилизованном под готическое или рукописное написание) читающие сильнее опираются на предсказуемость и частотность слов, чем при чтении текста, набранного в обычном шрифте (Rayner et al., 2006; Slattery & Rayner, 2010). То есть плохо предсказуемые и низкочастотные слова вызывают большее затруднение при чтении в нестандартном визуальном представлении. Однако, пока неизвестно, будет ли проявляться взаимодействие между визуальным представлением текста и лингвистическими эффектами на более высоких уровнях (напр., семантическом или синтаксическом).
Эта научная проблема встает особенно остро, когда в центре внимания исследователей находятся люди с нарушением чтения — дислексики. Дислексия — избирательное нарушение способности к овладению навыками чтения при сохранении общей способности к обучению (Lyon et al., 2003; Rose 2009; Snowling, 2019). Она проявляется в медленном, а также нередко ошибочном чтении слов, предложений и текстов. Современные исследования показывают, что в основе нарушения чтения у 30-40% дислексиков (Amitay et al., 2002; Ramus et al., 2003; Saksida et al., 2016; White et al., 2006) лежат проблемы, связанные со зрительной обработкой (так называемая оптическая дислексия). Таким образом, пока непонятно, в какой степени проблемы на этом уровне у людей с дислексией будут распространяться на другие лингвистические уровни. Можно ли ожидать, что у оптических дислексиков будет больше угадывающих ошибок (замен слов на основе догадок, часто основанных на предсказуемости; лексический фактор), аграмматизмов (форм слов, не соответствующих по грамматическим признакам ожиданиям от предыдущего контекста; грамматический фактор) или замен на семантически похожие слова (семантический фактор), чем у людей с дислексией, обладающих одновременно оптической и фонологической дислексией? Сложности с фонологической обработкой считаются самой частой причиной дислексии (Snowling, 2019; Vellutino et al., 2004). Будут ли дислексики с доминированием оптической дислексии отличаться от дислексиков с доминированием фонологической дислексией по этим показателям? Кроме того, остается не ясным, одинаковым образом или по-разному проявляется взаимодействие между визуальными и лексическими факторами (напр. частотностью) в целом у дислексиков и у людей без дислексии. То есть в целом отличия в механизмах чтения у дислексиков и людей без дислексии качественные или количественные (Huettig et al., 2018)? Можно ли предсказать на основе соотношения ошибок чтения по типу аграмматизмов, угадывающего чтения, замен на основе семантического сходства и т. п. наличие высокого риска дислексии?
На решение всех этих вопросов и направлен текущий проект.

Далее, для совокупного обозначения данных вопросов (научной проблемы) мы будем использовать следующую формулировку: «определение степени влияния визуальных характеристик текста на лингвистические процессы у дислексиков и людей без таких нарушений».

Научная значимость и актуальность решения обозначенной проблемы
Научная значимость проекта заключается в следующем:
1) Исследуя нарушения чтения, мы сможем подобраться к тому, как в целом устроены механизмы чтения у людей без нарушений, по крайней мере с точки зрения взаимодействия визуального и лингвистического компонентов письменной речи. Таким образом, результаты нашего проекта смогут улучшить и расширить существующие модели чтения. Например, модель двойного пути (Coltheart et al., 2001), которая разрабатывалась с опорой на различные подвиды дислексии и включает себя орфографический (частью которого является визуальный модуль), фонологический и семантический компоненты.
2) В проекте затронута подобласть психолингвистики (визуальное представление текста), которая сама по себе является недоисследованной (Slattery, 2016). Таким образом, любые новые знания в этой области внесут существенный вклад в развитие данного направления.
3) В области коррекционной педагогики и патологии речи дислексия является одним из основных предметов исследования (Визель, 2005). Таким образом, новые знания в целом о дислексии и о ее оптическом и фонологическом подвидах в частности позволят лучше понять ученым сущность данных нарушений.
4) В рамках проекта будет создан ряд прикладных инструментов, которые могут быть использованы в будущих научных исследованиях:
a. Тест на проверку качества зрительной обработки (см. подробнее Предлагаемые методы и подходы) и нормы его выполнения у подростков, носителей русского языка без нарушения чтения. Этот тест может использоваться для отбора участников будущих исследований — поиска оптических дислексиков с нарушениями чтения, вызванных сокращенным визуальным полем внимания или подверженностью к визуальному шуму (см. подробнее Современное состояние исследований по данной проблеме).
b. Современные нормы чтения вслух у подростков, носителей русского языка без нарушения чтения, вместе с соответствующими материалами (см. подробнее Предлагаемые методы и подходы). Могут использоваться для поиска дислексиков в данных возрастных группах в будущих исследованиях.
c. Многофакторная классификация ошибок чтения вслух (см. подробнее Предлагаемые методы и подходы). Может быть использована для анализа ошибок вслух у людей с дислексией и поиска диагностирующих ошибок.

Актуальность решения научной проблемы обусловлена прежде всего частотой встречаемости дислексии. А именно, частота встречаемости дислексии среди детей школьного возраста варьируется в России от 5-10% (Корнев, 2003). Дислексия приводит к снижению школьной успеваемости по всем предметам, что, в свою очередь, часто становится причиной неврозов, фобий и социальной дезадаптации в целом. Несформированный навык чтения приводит к функциональной неграмотности у взрослых: более чем у 70% школьников, которым в 3-м классе был подтвержден диагноз дислексии, проявления дислексии сохраняются и во взрослом возрасте (Заваденко 2008).
Таким образом, любое исследование, затрагивающее данную тему, привнесет знания, которые можно будет впоследствии использовать для своевременной диагностики и коррекции дислексии.
В рамках данного проекта, помимо того, что будут получены теоретические знания о влиянии визуального представления текста на лингвистические процессы у дислексиков и людей без таких нарушений мы протестируем два кириллических шрифта для дислексиков (см. подробнее Предлагаемые методы и подходы) и определим, какой из них является наиболее перспективным для использования.

Конкретная задача (задачи) в рамках проблемы, на решение которой направлен проект, ее масштаб и комплексность

Для решения научной проблемы — определение степени влияния визуальных характеристик текста на лингвистические процессы у людей с дислексией и людей без таких нарушений — будет решен ряд задач.

Задача 1 (предварительная, решена на этапе составления заявки). Выявить конкретный объект исследования (конкретные типографические характеристики) и определить характеристики выборки (возраст участников исследования), на которой будет проводиться исследование.
Мы остановились на исследовании шрифтов: с засечками и без засечек; пропорциональных и моноширинных (с одинаковым физическим размером букв); специально разработанных для дислексиков и стандартных шрифтов. В качестве основной возрастной группы мы остановились на подростках. При наличии достаточного количество дислексиков к участию будут привлечены также взрослые (см. подробнее Предлагаемые методы и подходы).
Задача 2. Оценить участников исследования с точки зрения наличия дислексии. При ее наличии выявить ее подвиды: фонологическую, оптическую, смесь фонологической и оптической, другого рода. Для этого необходимо измерить скорость чтения текста вслух (определение симптомов дислексии); оценить невербальный интеллект (важно для определения дислексии); проверить качество фонологической обработки при чтении отдельных слов и псевдослов и при манипуляции с псевдословами по типу замены одного звука; проверить качество зрительной обработки с точки зрения сохранности визуального поля внимания и степени подверженности визуальному шуму (см. подробнее Предлагаемые методы и подходы).

Задача 3. Провести эксперимент, нацеленный на изучение скорости распознавания слов в зависимости от типа шрифта и частотности (лексический фактор) у подростков с нарушениями чтения (в том числе в зависимости от подтипа) и подростков без нарушений чтения. При наличии достаточного количества дислексиков среди взрослых провести подобный эксперимент на данной возрастной группе (см. подробнее Предлагаемые методы и подходы).

Задача 4. Провести эксперимент методом чтения вслух текста. Оценить влияние типа шрифта на количество ошибок, относящихся к разным языковым уровням (семантическому, грамматическому, фонетическому и прагматическому) у каждой группы участников. Для этого разработать многофакторную классификацию ошибок чтения вслух (см. подробнее Предлагаемые методы и подходы).

Задача 5 (дополнительная). Выявить ошибки или сочетания ошибок при чтении вслух, которые являются диагностирующими для дислексии.

Масштабность и комплексность поставленных задач обуславливается следующим:
1) Будет исследовано влияние ряда визуальных характеристик (специализированность шрифта, наличие засечек, пропорциональность/моноширинность) на лингвистические процессы на различных лингвистических уровнях (семантическом, грамматическом, фонетическом и прагматическом). Это поможет сложить комплексную картину взаимодействия визуального представления текста и лингвистической обработки.
2) Участники исследования пройдут комплекс тестов на выявление различных подвидов дислексии. Только в небольшом количестве исследований участников одновременно тестируют на различные подвиды дислексии (Snowling, 2019). Данный проект будет исключением.
3) Процедура исследования может быть масштабирована при адаптации тестов на другие возрастные группы (например, учащихся младшей и средней школы).
4) Мы не только изучим, чем люди с дислексией отличаются от людей без нарушения чтения на основе ошибок вслух при чтении текстов, набранных различными шрифтами, но и попробуем предсказать дислексию (путем моделирования), используя эту информацию.

Научная новизна исследований, обоснование того, что проект направлен на развитие новой для научного коллектива тематики*********, обоснование достижимости решения поставленной задачи (задач) и возможности получения предполагаемых результатов

Научная новизна исследования:

1) Насколько нам известно, в мировой науке ранее целенаправленно не исследовалось влияние визуального представления на более высокие лингвистические уровни, чем лексический (частотность, предсказуемость слов) при анализе ошибок вслух.
2) На русском языке еще не исследовались визуальные характеристики текста в связке с когнитивными процессами на разных лингвистических уровнях.
3) В предыдущих исследованиях, направленных на выявление наиболее эффективных визуальных характеристик текста у людей с дислексией (Bachmann & Mengheri, 2018; Duranovic et al., 2018; Galliussi et al., 2020; Karovska Ristovska & Filipovska, 2018; Kuster et al., 2018; Leeuw, 2010; Marinus et al., 2016; Rello & Baeza-Yates, 2013, 2016; Wery & Diliberto, 2017; Zikl et al., 2015), специально не определялась основная причина дислексии у экспериментальной группы участников. В нашем проекте мы будем отвечать на основной вопрос исследования (какова степень влияния визуальных характеристик текста на лингвистические процессы у дислексиков) с прицелом на различные подвиды дислексии.
4) В современной науке существуют общепризнанные тесты на проверку зрительной обработки в отношении визуального поля внимания, однако нет общепринятого теста для определения проблем, связанных с повышенной восприимчивостью к визуальному шуму (Saksida et al., 2016). Мы нацелены на создание комплексного теста, проверяющего обе возможные причины оптической дислексии.
5) При исследовании дислексии в отечественной науке предпочтение отдается школьникам младшего возраста (Dorofeeva et al., 2019; Lopukhina et al., 2021; Ахутина et al., 2016; Ахутина & Ишакова, 2008; Безруких & Иванов, 2019; Безруких & Морозова, 1996; Дорофеева et al., 2021; Иванов et al., 2010; Корнеев et al., 2019; Русецкая, 2003). В нашем исследовании мы сфокусируемся на подростках (обоснование нашего выбора приведено в разделе Предлагаемые методы и подходы). До 70% школьников, получивших диагноз дислексия в младшей школе, сохраняют его признаки и во взрослом состоянии.
6) Для подростков — носителей русского языка — нам неизвестны современные нормы чтения вслух. Такие нормы необходимы для определения подростков с высоким риском дислексии. В рамках данного проекта мы соберем такие нормы.
7) Мы впервые (насколько нам известно) попробуем предсказать наличие дислексии на основе различных подвидов ошибок вслух при чтении. Сейчас такие модели строятся в основном на основе данных движения глаз, ЭЭГ и ФМРТ. Для этого мы разработаем многофакторную классификацию ошибок.

Обоснование новизны тематики, предмета, объекта, плана исследования или методов для участников исследования Анастасия Шиморина знакома с методами машинного обучения, необходимыми для решения задачи 5 (предсказание дислексии при помощи методов машинного обучения). Однако, до настоящего времени она не занималась психолингвистикой, дислексией, визуальным представлением текста, многофакторной классификацией ошибок чтения вслух, созданием тестов на проверку когнитивных способностей, сбором данных у подростков.

Яна Никонова знакома с экспериментальными методами в психолингвистике, но она не занималась выявлением дислексии и ее подвидов, многофакторной классификацией ошибок чтения вслух, методами машинного обучения, созданием тестов на проверку когнитивных способностей, сбором данных у подростков.

Алиса Лезина знакома с экспериментальными методами в психолингвистике, но она не занималась выявлением дислексии и ее подвидов, визуальным представлением текста, многофакторной классификацией ошибок чтения вслух, методами машинного обучения, созданием тестов на проверку когнитивных способностей, сбором данных у подростков.
Руководитель проекта, Светлана Алексеева имеет опыт во многих из перечисленных сфер, однако, она никогда не составляла такой комплексный план исследования, не создавала тестов на проверку когнитивных способностей, не занималась многофакторной классификацией ошибок чтения вслух, имеет лишь незначительный опыт применения методов машинного обучения в лингвистике.

Обоснование достижимости решения задач и возможности получения результатов
Задача 1 (выбор визуальных характеристик и возрастной группы) была выполнена на этапе составления заявки (см. подробнее Предлагаемые методы и подходы).
Задача 2 (оценка участников исследования на предмет дислексии).
На этапе составления заявки получено предварительное согласие на проведение исследования в шести общеобразовательных школах (No564, No225, No241, No278, No256 и No491) и одной речевой школе (3) Санкт- Петербурга. Большое количество общеобразовательных школ дают уверенность, что мы сможем определить современные нормы чтения вслух для основной возрастной категории исследования. Наши предыдущие исследования (Alexeeva et al., 2020; Alexeeva, Zubov, & Konina, 2022) показывают, что в данной речевой школе дети читают статистически значимо медленнее, чем в общеобразовательной школе No491 (одной из школ, которая согласилась принимать участие в проекте). Таким образом, есть основания утверждать, что мы выявим достаточное число подростков с дислексией для того, чтобы делать выводы про крайней мере в целом для группы дислексиков (см. подробнее Предлагаемые методы и подходы). Все тесты, кроме одного, на выявление подвидов дислексии находятся в распоряжении авторов. Для последнего теста — теста на проверку зрительной обработки, — который необходимо будет создать (адаптировать и усовершенствовать), все материалы в наличии (см. подробнее Предлагаемые методы и подходы). Таким образом, техническая сторона не будет помехой к выявлению подтипов дислексии у ранее выявленных дислексиков (см. выше), тем не менее, мы не можем гарантировать, что среди нашей выборки встретится достаточное число подростков с преобладанием проблем с оптическим компонентом. Скорее всего, мы сможем выявить достаточное для построения выводов на групповом уровне количество дислексиков с преобладанием фонологической дислексии и с дислексией смешанного типа.
Задача 3 (эксперимент на оценку взаимодействия шрифта и частотности слов при чтении про себя). Руководитель проекта проводил эксперименты подобного рода (Алексеева & Слюсарь, 2017a; Слюсарь & Алексеева, 2017) и знаком со спецификой процедуры. Существует общедоступный ресурс (stimul.cognitivestudies.ru), который позволяет с легкостью определять частотность слов. Таким образом, мы не видим препятствий реализации данной задачи.
Задача 4 (эксперимент на оценку взаимодействия шрифта и ошибок чтения вслух, относящихся к разным лингвистическим уровням). Руководитель проекта проводил эксперименты подобного рода (Zubov et al., 2021). Новой задачей является создание многофакторной классификации ошибок и распределение ошибок вслух по выделенным типам. Тем не менее, на этапе составления заявки была выполнена работа по анализу уже существующих классификаций (см. подробнее Современное состояние исследований по данной проблеме) и определены основные ошибки на каждом из заявленных в проекте лингвистических уровней. Таким образом, мы считаем, что данная задача реализуема.
Задача 5, дополнительная (выявить диагностирующие для дислексии ошибки в чтении вслух). Это — самая сложная для оценки реализуемости задача. Пока не очень понятно, какое количество ошибок в среднем случается при чтении подростками с дислексией и без нарушений чтения. А для методов машинного обучения необходимо достаточно большое количество наблюдений. В связи с этим, эта задача является дополнительной и возможно по ней не будут достигнуты заявленные результаты.

Современное состояние исследований по данной проблеме, основные направления исследований в мировой науке и научные конкуренты

1. Дислексия и ее подвиды
Дислексия - неспособность к обучению, в первую очередь связанная с навыками чтения и письма (Lyon et al., 2003; Rose 2009; Snowling, 2019). Она проявляется как медленное, часто неточное чтение. Наиболее частый вид дислексии вызван трудностями фонологической обработки, которые затрагивают фонологическую осведомленность (phonological awareness), вербальную память и скорость вербальной обработки (Snowling, 2019; Vellutino et al., 2004). Термин “фонологическая осведомленность” означает способность человека воспринимать, обрабатывать и обобщать звуки речи, представленные в словах, в том числе связывать между собой звуки речи и буквы. Дефицит вербальной памяти подразумевает значительные трудности в запоминании вербальных (например, буквенных) элементов и последовательностей. Скорость вербальной обработки обычно измеряется с помощью тестов на быстрое последовательное называние (например, называние букв или цифр), и общепризнано, что люди с дислексией выполняют эти задания медленнее, чем их сверстники без проблем с чтением. Более медленное выполнение тестов на быстрое последовательное называние (RAN) отражает то, что у людей с дислексией снижена скорость чтения. Фонологические трудности фиксируются у 88% людей с дислексией (Shaywitz & Shaywitz, 2020). Тем не менее, в рамках современного подхода к дислексии считается, что возникновение данного нарушения в сущности зависит от множества факторов. Часто диагноз “дислексия” ставится взрослому или ребенку, только когда фиксируются нарушения нескольких когнитивных компонентов (Pennington, 2006; Snowling, 2019). Кроме фонологии, человек с дислексией может испытывать трудности с слуховой/речевой обработкой и иметь сложности с обработкой зрительной информации (Rusetskaya, 2007; Saksida et al., 2016; Snowling, 2019). Первое проявляется в низкой чувствительности к высоте звуков, их громкости, интенсивности, продолжительности, ритму и т. д. (Goswami, 2011; Tallal, 1980).

Последнее может иметь несколько причин:
(а) затрудненное восприятие контраста и движения, сопровождаемого нарушением контроля движения глаз. Такие нарушения обычно связывают с дефицитом магноцеллюлярной зрительной системы (Lovegrove et al., 1986; Stein, 2018). Эти затруднения обычно определяются задачей на зрительно обнаружение движения (Snowling, 2019). Цель задачи - указать на панель, которая содержит точки, двигающиеся в одном направлении (Hansen et al., 2001).
(b) меньший размер визуального поля внимания, приводящий к трудностям в разделении буквенных последовательностей на отдельные элементы (Bosse et al., 2007). Визуальное поле внимания обычно оценивается следующим образом: на короткий промежуток времени участникам исследования показывается последовательность из 5 букв, после этого она маскируется, и участникам необходимо либо воспроизвести всю последовательность (полный отчет), либо называть букву, стоящую в указанной последовательности на определенном месте (частичный отчет) (Snowling, 2019). Люди с дислексией менее точно справляются с данной задачей, особенно со символами на концах последовательностей.
(c) излишняя подверженность визуальному шуму (Evans, 2001), то есть чтение печатного текста вызывает искажения восприятия, такие как нечеткость или размытость букв, наложение и смешение слов, перемещение букв внутри слов, зеркальное отражение и переворачивание слов вверх ногами, появление гало и бликов и т. д. (Wolańska & Wolański, 2016). Из-за разнообразия возможных симптомов нет всеми признанной задачи, которая объективно измеряла бы влияние визуального шума. Однако чтение слов с цветным наложением (White et al., 2006) или отчеты испытуемых о полосках линий с высокой пространственной частотой (Saksida et al., 2016) иногда используются для выявлении дислексии этого типа.
Кроме того, у людей с дислексией также встречаются сложности в работе оперативной памяти (anchoring deficit) (Ahissar, 2007), симптомы медленного переключения внимания (Gori & Facoetti, 2015; Hari & Renvall, 2001), затрудненное выделение аудиальной информации из шума (Sperling et al., 2005) и нарушения автоматического (имплицитного) контроля двигательных навыков/навыков (гипотеза дефицита мозжечка (Haslum & Miles, 2007; Nicolson & Fawcett, 1990)).
В нескольких исследованиях (Amitay et al., 2002; Ramus et al., 2003; Saksida et al., 2016; White et al., 2006) изучалось, как одни и те же люди с дислексией выполняли ряд когнитивных задач, и их результаты использовались непосредственно для сравнения несколько теорий дислексии (см. выше). Было подтверждено, что фонологический дефицит является основной причиной дислексии. Например, более 90% людей с дислексией в (Saksida et al., 2016) и более половины в (White et al., 2006) показали худшие результаты, чем контрольная группа, в фонологических задачах.
Однако есть доказательства и существования других видов дислексии. Например, в работе (White et al., 2006) оценивались фонологическая обработка, слуховые навыки, влияние визуального шума, механизмы визуального обнаружения движения и двигательные навыки у людей с дислексией и без данного нарушения. Было получено, что фонологические переменные объясняют 60% различий в навыках чтения на групповом уровне, и никакие другие переменные (визуальные, моторные или слуховые) не вносят дополнительного вклада в вариативность скорости чтения. Тем не менее, анализ индивидуальных данных выявил 26% случаев нефонологической дислексии. Все они были вызваны визуальным дефицитом: 83 % — подверженностью визуальному шуму и 17 % — плохими навыками визуального обнаружения движения.
В исследовании Саксиды и др. (2016) сравнивались фонологическая теория дислексии и визуальные теории, приписывающие дислексию подверженности визуальному шуму или суженному визуальному полю внимания. Авторы обнаружили, что результаты теста на выявление визуального поля внимания объясняет некоторые различия в навыках чтения в дополнение к переменным, связанных с точностью выполнения фонологических тестов, которые объясняют большую часть различий. Более того, 28% людей с диагнозом “дислексия” показали уменьшенное визуальное поле внимания, в то время как не было никаких доказательств того, что среди диагностированных случаев дислексии был люди с симптомами визуального шума.

Таким образом, в западных исследованиях, несмотря на преобладание фонологической теории дислексии (Vellutino & Fletcher, 2005), также начинается признаваться оптическая разновидность данного нарушения.
В отечественной науке под дислексией понимается “состояние, основным проявлением которого является стойкая избирательная неспособность овладеть навыком чтения, несмотря на достаточный для этого уровень интеллектуального и речевого развития, отсутствие нарушений слухового и зрительного анализаторов и оптимальные условия обучения” (Корнев, 1997). В отечественной науке также принято разделять понятия дислексии и дисграфии в то время, как за рубежом нарушения письма (дисграфию) зачастую также относят к дислексии.

В отечественной науке также преобладает мнение, что главной причиной дислексии является фонологический дефицит. Теория фонологического дефицита подразумевает, что главную проблему для людей с дислексией представляет процесс, связанный с обработкой фонем (Григоренко, 2010). Помимо теории фонологического дефицита существуют и другие теории дислексии. Например, Е. Л. Григоренко (2010) выделяет еще 4 основных теории, которые объясняют возникновение нарушений чтения:

1. Теория дефицита быстрой аудиторной переработки информации. При таком дефиците основная сложность заключается в обработке слуховой информации.
2. Теория дефицита функционирования мозжечка, согласно которой люди с дислексией имеют нарушения моторных навыков;

3. Теория двойного дефицита, при которой трудности возникают, как и вследствие фонологического дефицита, так и вследствие «быстрого последовательного называния»;
4. Теория дефицита зрительной переработки. Она подразумевает, что у человека возникают трудности с визуальной составляющей текста: буквы могут сливаться друг с другом, плохо распознаваться за счёт графических характеристик.

В современной отечественной логопедии дислексию разделяют на отдельные подвиды в зависимости от того, в чем именно проявляются трудности у ребенка в процессе чтения. Например, выделяют фонематическую, семантическую, аграмматическую, мнестическую и оптическую дислексии (Величенкова & Русецкая, 2015). Фонематическая дислексия связана с недоразвитием функций фонематической системы. Семантическая дислексия (механическое чтение) проявляется в нарушении понимания прочитанного при технически правильном чтении. Аграмматическая дислексия обусловлена недоразвитием грамматического строя речи. Мнестическая дислексия проявляется в трудностях усвоения букв, в их недифференцированных заменах, и в нарушении речевой памяти. Оптическая дислексия проявляется в трудностях усвоения букв и в смешениях сходных букв (л-д, з-в), (т-г, ь-р, н-п-и). Подвиды дислексии определяются на основе различных видов ошибок вслух. Например, мена звуков, схожих по артикуляторно-акустическим признакам, свидетельствует о фонематической дислексии, мена слово на семантически близкое (рука-нога) — о семантической дислексии, аграмматизмы (не подходящие на основе предыдущего контекста словоформы) — о грамматической дислексии, вставки слов – о мнестической дислексии и оптические ошибки — об оптической дислексии.

Также согласно О. А. Величенковой и М. Н. Русецкой, дислексия и дисграфия – это не отдельные расстройства. Они зачастую встречаются вместе с другими нарушениями, например, устной речи. При диагностике дислексии авторы книги выделяют следующие симптомы: низкий темп чтения, большое количество ошибок и низкий уровень понимания прочитанного (Величенкова & Русецкая, 2015; Визель, 2005).

Стоит заметить, что оптическую форму дислексии в отечественной науке выделяют прежде всего на основе ошибок чтения вслух, связанных с оптическим сходством букв. В то время как за рубежом считают, что такие ошибки могут быть вызваны сложностью с запоминанием связи между буквой и звуком (то есть фонологическими причинами) (Snowling, 2019). В отечественной науке также отмечается, что сами по себе ошибки вслух полифакторны, то есть могут свидетельствовать о различных подвидах дислексии (Величенкова & Русецкая, 2015). Таким образом, введение в научный оборот тестов на зрительную обработку по типу тех, которые используются за рубежом, позволит с большей уверенностью выделять оптический подвид дислексии.

Также стоит отметить, что в зарубежной и отечественной науке основными вопросами в данной области является обнаружение когнитивных причин дислексии и методики коррекции ее отдельных подвидов (Shaywitz & Shaywitz, 2020; Величенкова & Русецкая, 2015). В данном проекте мы попробуем взглянуть на дислексию и ее подвиды с точки зрения лингвистических процессов. А именно посмотреть, как лингвистические факторы (например, частотность слов) взаимодействуют с визуальным представлением текста у людей с дислексией в целом и оптических дислексиков в частности.

2. Типографические элементы и дизайн
Основная область знаний, которая сфокусирована на визуальных характеристиках текста — это дизайн. В рамках данной области основной интерес представляют собой такие характеристики типографических элементов как разборчивость (legibility) и удобочитаемость (readability). Под удобочитаемостью понимают качество восприятия знаков и слов при чтении связного текста (Файола, 2003). Разборчивость отражает то, насколько легко или трудно распознать отдельный типографический элемент (например, отдельную букву). О разборчивости обычно говорят по отношении к шрифту. Шрифт — это комплект визуально различных, но единообразно спроектированных знаков всего алфавита, включая буквы, цифры, знаки пунктуации и другие знаки (Файола, 2003). В шрифте также задается базовое межстрочное (интерлиньяж), межсловное и межсимвольное расстояния.
В дизайне считается, что интерлиньяж, так же, как межсловные и межсимвольные интервалы, оказывают непосредственное влияние на удобочитаемость (Крейг & Скала, 2016). При этом сам интерлиньяж определяется гарнитурой (шрифт со всеми его подвидами в отношении насыщенности букв: нормальный, жирный, курсив и т. п.), кеглем (размер букв), длиной строки и др. Помимо интерлиньяжа выделяют такие факторы, которые могут влиять на удобочитаемость, как характер контура букв, контрастность штрихов, шрифта и фона, характер засечек (перпендикулярный штрих на конце буквы, с которого начинается и которым заканчивается основной штрих знака), пропорции сторон, плотность и размер шрифта (Нестерова & Коновалов, 2014).
Из-за такого большого набора факторов, которые могут повлиять на удобочитаемость, рекомендуется интуитивно оценивать визуальное представление текста, а не опираться на какие-то численные значения данных параметров. В целом, приводятся рекомендации следующего типа: увеличение контраста улучшает удобочитаемость, но слишком сильный контраст — ее ухудшает.
Такой же подход преобладает и в отношении разборчивости. Например, есть мнение, что слишком широкие или узкие буквы снижают разборчивость (Нестерова & Коновалов, 2014), но никаких численных порогов не приводится.
При этом также считается, что в связи с богатой историей типографики, предыдущие поколения нашли оптимальные значения основных типографических параметров для конкретных шрифтов (Крейг & Скала, 2016). Это одна из причин, почему в нашем исследовании мы выбрали шрифт для исследования взаимосвязи лингвистических и графических аспектов текста.

3. Влияние визуального представления текста на лингвистические обработку при чтении у людей без нарушения чтения
В рамках психолингвистики интерес к изучению типографических черт появился совсем недавно (Slattery, 2016). На лексическом уровне (графическая обработка, орфографическая обработка, фонологическая обработка, лексический доступ) были исследованы такие лингвистические параметры в взаимосвязи с визуальным представлением текста, как частотность (Paterson & Jordan, 2010; Perea, 2013; Rayner et al., 2006; Slattery & Rayner, 2010) и предсказуемость (Rayner et al., 2006).
В исследовании (Rayner et al., 2006) было показано, что читающие сильнее опираются на предсказуемость при чтении более сложного шрифта (стилизованный под готическое написание Old English), по сравнению со стандартным шрифтом Times New Roman, но показывают схожие эффекты частотности при чтении в обоих шрифтах. При этом в целом Old English читался дольше, чем Times New Roman. В (Perea, 2013) также не было найдено взаимодействие между частотностью и такой типографической характеристикой как наличие засечек (сравнивались Lucida Serif и Lucida Sans). Также не было получено значимой разницы между чтением между вариантами шрифта c засечками и без, хотя некоторые дизайнеры считают, что шрифт с засечками обладает большей удобочитаемостью (Нестерова & Коновалов, 2014).
Slattery и Rayner (2010) исследовали разборчивость. Было показано, что стилизованные под рукописные шрифты менее разборчивы, чем стандартный шрифт Times New Roman. Но главное, что читающие больше опираются на частотность при чтении слов в таких шрифтах. Также было найдено взаимодействие между размером межсимвольного и межсловного интервала и частотностью слов (Paterson & Jordan, 2010). Для условий с увеличенными интервалами для шрифта Courier исследователи обнаружили большее влияние частотности.
В целом при исследовании межстрочных и межсимвольных интервалов (безотносительно лингвистических характеристик) было найдено подтверждение предложения дизайнеров: увеличенные в небольшой степени интервалы улучшают скорость распознавания слов (Perea et al., 2012; Perea & Gomez, 2012), однако существует порог, после которого преимущество переходит в недостаток (Paterson & Jordan, 2010; Pelli et al., 2007).
Если обратиться к цвету, то было найдено следующее. Выделение цветом отдельных слов помогает китайцам читать быстрее (Perea & Wang, 2017) и может повлиять на конкуренции между словами при лексическом доступе (Marcet et al., 2019).

В отечественной науке благодаря исследованию разборчивости шрифтов Georgia и Courier New (Алексеева et al., 2019) было показано, что по-видимому буквы в слове и буквы, предъявленные сами по себе, распознаются по-разному. В первом случае преобладает стратегия распознавания по частям (то есть буквы идентифицируются по отдельным чертам), в то время как во втором случае — образ буквы схватывается целиком.
Так как частотность — это тот показатель, которому отдается первостепенное место в моделях распознавания слов при чтении (Engbert et al., 2005; Grainger & Jacobs, 1994; Reichle & Sheridan, 2015; Rumelhart & McClelland, 1982; Whitney, 2001) и текущие результаты относительно взаимодействия визуальных характеристик и частотности неоднозначны, в рамках данного проекта на лексическом уровне мы сфокусируемся на этом факторе.
Что касается других уровней, то исследования также немногочисленны. Например, не было обнаружено взаимосвязи между размером шрифта и пониманием (семантика) набора терминов, определения для которых нужно было выделить из прочитанного текста (Tavakoli & Kheirzadeh, 2011). При этом понимание статей Википедии улучшается, если размер шрифта увеличить с 10 pt до 18 и больше (Rello et al., 2016). Уменьшение размера шрифта и увеличение слов в строке отрицательным образом сказывается на понимании прочитанного у второклассников (Katzir et al., 2013).
Добавление дефисов между слогами (фонетика) замедляет чтение слов на финском у детей, которые начинают читать, в то время как использование различных цветов для различных слогов значимо не отличается от чтения без использования цвета (Häikiö et al., 2015). Также было показано при помощи выделения цветом границ слогов и морфем в немецких словах, что ученики вторых классов скорее опираются при чтении на слоги, а ученики четвертых классов — на морфемы (грамматика) (Hasenäcker & Schroeder, 2017).
Что касается исследований на русском языке, нам удалось обнаружить следующее. Не было найдено отличий в понимании прочитанного между версиями шрифта PT с засечками и без (Akhmadeeva et al., 2012). В дополнение, Arial (без засечек) и Book Antiqua (с засечками) превзошли в понимании текста Times New Roman (с засечками) и Comic Sans (без засечек) (Морозова & Мурин, 2013), что также показывает неоднозначность влияния засечек на понимание текста.
Данные исследования показывают, что эффекты, связанные с визуальным представлением текста, могут быть обнаружены на более высоких лингвистических уровнях. Однако, в перечисленных исследованиях тот или иной графический элемент изучался в приложении к одному или двум лингвистическим уровням. В нашем проекте мы посмотрим, как шрифт влияет сразу на несколько языковых уровней. Для этого мы проанализируем ошибки чтения вслух, затрагивающие разные лингвистические уровни, в зависимости от шрифта. Анализ ошибок вслух — это одна из распространенных методик обнаружения подвидов дислексии в рамках психологии и педагогики.

4. Влияние визуального представления текста на чтении у людей с дислексией
В рамках данной области фокус исследования состоит в тестировании различных типографических характеристик на предмет поиска оптимальных для людей, испытывающих сложности с чтением. Влияние визуального представления текста на лингвистическую обработку у людей с дислексией (в отличие от нашего проекта) не является основным предметом исследования в данной подобласти.
Как было сказано выше (см. п. 1 выше), среди людей с дислексией существует подгруппа, у которой проблемы с чтением вызваны в основном или частично нарушениями зрительной обработки. Для такого рода дислексиков были разработаны специализированные шрифты. Для латинского алфавита это Dyslexie, OpenDyslexic, EasyReadingT, Sylexiad, Read Regular, Lexia Readable, Polish Doferm (Wolańska & Wolański, 2016). Наиболее популярные шрифты - это Dyslexie и OpenDyslexic (Wolańska & Wolański, 2016). Ключевыми особенностями обоих шрифтов являются разные формы для легко смешиваемых букв и утолщенные нижние части букв (для преодоления искажений восприятия, например, переворачивания букв). Для шрифта Dyslexie характерно увеличение расстояния между буквами и словами. Дизайнеры этих шрифтов, сами обладающие дислексией, инстинктивно использовали особенности, которые могли бы помочь преодолеть симптомы визуального шума и суженного поля зрительного внимания.
На сегодняшний день только три латинских шрифта были эмпирически протестированы на людях с дислексией. Это Dyslexie (Duranovic et al., 2018; Kuster et al., 2018; Leeuw, 2010; Marinus et al., 2016), OpenDyslexic (Rello & Baeza-Yates, 2013; Wery & Diliberto, 2017; Zikl et al., 2015) и EasyReadingTM (Bachmann & Mengheri, 2018). EasyReadingTM, как и Dyslexie, характеризуется увеличенным расстоянием между символами, словами и строками текста.
Контрольными шрифтами являлись Arial (Kuster et al., 2018; Leeuw, 2010; Marinus et al., 2016; Wery & Diliberto, 2017), Curlz MT (Duranovic et al., 2018) и Times New Roman (Bachmann & Mengheri, 2018; Duranovic et al., 2018; Wery & Diliberto, 2017). Rello и Baeza-Yates (2013) использовали Arial, Arial Italic, CMU, Courier, Garamond, Helvetica, Myriad, Times, Times Italic и Verdana в качестве контрольных шрифтов. География участников варьировалась от Австралии (Marinus et al., 2016), Боснии и Герцеговины (Bachmann & Mengheri, 2018), Чехии (Zikl et al., 2015) и Нидерландов (Kuster et al., 2018; Leeuw, 2010) до Италии (Bachmann & Mengheri, 2018), Испании (Rello & Baeza-Yates, 2013) и США (Wery & Diliberto, 2017). Ни в одном из этих исследований не проверялись навыки зрительной обработки у участников с дислексией.

В большинстве исследований (Kuster et al., 2018; Leeuw, 2010; Rello & Baeza-Yates, 2013; Wery & Diliberto, 2017; Zikl et al., 2015) не было найдено доказательств того, что специализированные шрифты отличаются от контрольных в плане скорости чтения. Однако в большинстве исследований (кроме Rello & Baeza-Yates, 2013) для измерения скорости чтения использовалась задача чтения вслух. Можно предположить, что стадия артикулирования могла помешать проявлению эффекта шрифта. С другой стороны, Bachmann и Mengheri (2018), Duranovic et al. (2018), и Marinus et al. (2016) также использовали тест на чтение вслух и выявили превосходство шрифтов для людей с дислексией над контрольными шрифтами в беглости чтения у участников с дислексией. Помимо скорости, Bachmann & Mengheri (2018) и Duranovic et al. (2018) измеряли точность чтения. По этому показателю люди с дислексией также показали лучшие результаты при чтении текстов, представленных шрифтами для людей с дислексией. Аналогичные результаты по точности были получены в работе (Leeuw, 2010).

Поскольку предыдущие исследования показали, что увеличенное расстояние между буквами помогает людям с дислексией преодолеть визуальную скученность (негативное влияние соседних букв; crowding) и читать быстрее (Zorzi et al., 2012), то положительное влияние специализированных шрифтов для людей с дислексией, найденное выше, может быть обусловлено исключительно увеличением расстояния между буквами — основной характеристикой специализированных шрифтов (Bachmann & Mengheri, 2018; Duranovic et al., 2018; Marinus et al., 2016). Действительно, контрольные шрифты с увеличенным расстоянием между буквами (Duranovic et al., 2018) или между буквами и словами (Marinus et al., 2016) (таким же по величине, как в шрифтах для людей с дислексией) приводили к исчезновению первоначального преимущества специализированных шрифтов перед контрольными (Duranovic et al., 2018; Marinus et al., 2016). Тем не менее, даже в такой ситуации не было обнаружено доказательств того, что шрифты для людей с дислексией работали хуже, чем контрольные шрифты, хотя первые предположительно были незнакомыми для участников исследования.
Для данного проекта особый интерес представляет работа (Leeuw, 2010). В данной работе помимо скорости чтения (см. выше) исследовалось то, как шрифт влияет на различные виды ошибок чтения вслух. Данные ошибки затрагивают различные лингвистические уровни: фонетику (пропуск одного из согласного в стечении гласных, замена звука на фонетически похожий) и графику (замену буквы на оптически похожую букву; перестановки букв внутри слова). Было показано, что люди с дислексией делают меньше ошибок как оптической, так и фонетической природы в специализированном шрифте, чем контрольном. В нашем проекте мы воспользуемся тем же методом исследования, что и в данной работе, для изучения влияния шрифта на лингвистическую обработку на разных уровнях (см. 5 ниже). Обратимся к шрифтам для дислексиков для кириллического алфавита. Кириллических шрифтов для людей с дислексией гораздо меньше, но всё же они существуют: Adys из Болгарии, Dyslexic FZF (Karovska Ristovska & Filipovska, 2018) из Македонии, Антидислексия [Antidyslexia] от русскоговорящего дизайнера, живущего в Канаде, и LexiaD из России.
На сегодняшний день протестирован только шрифт LexiaD (Alexeeva et al., 2020, 2022, на рецензировании). LexiaD — это пропорциональный шрифт без засечек, предназначенный для большего размера букв. Среди других характеристик можно выделить следующее: расстояние между буквами, словами и строками увеличено; объем белого цвета внутри букв также увеличен. В отличие от латинских аналогов, шрифт основан на сходствах букв, объективно оцененных в предварительном исследовании с применением методики регистрации движений глаз (Конина & Алексеева, 2016). Тестирование шрифта LexiaD при чтении про себя показало следующее (Alexeeva et al., 2020, 2022, на рецензировании): (a) шрифт LexiaD показывает положительный эффект при извлечении информации, необходимой для опознавания конкретных букв (далее извлечение признаков), и интеграции текста (но отрицательный эффект для лексического доступа) по сравнению с незнакомыми, но стандартными шрифтами PT Serif и PT Sans у детей младшего школьного возраста с дислексией и без нее при чтении с экрана компьютера; (b) шрифт LexiaD имеет преимущество на этапе извлечения признаков, но только после того, как участники привыкнут к шрифту (без существенной разницы в скорости чтения на этапах лексического доступа, интеграции текста и глобальной обработке прочитанного), в сравнении с Arial, популярным шрифтом без засечек с низким качеством кириллических букв у подростков с дислексией и без нее, при чтении с экрана компьютера; (c) шрифт LexiaD по глобальной скорости чтения уступает Roboto, набирающему популярность современному и схожему с Arial шрифту с хорошим качеством кириллических букв у подростков без дислексии при чтении печатного текста; (d) шрифт LexiaD по глобальной скорости чтения не отличался от Times New Roman, распространенного шрифта с засечками у подростков без дислексии при чтении печатного текста.
Более важным для данного проекта является то, что скорость чтения с экрана компьютера в исследуемых шрифтах у младших и старших школьников с дислексией и без нарушений чтения зависела от частотности слова (Alexeeva et al., 2020; Alexeeva, Zubov, & Konina, 2022). Все четыре группы показали, что для высокочастотных слов LexiaD имеет преимущество над контрольными шрифтами, в то же время на низкочастотных словах показывает схожие с контрольным шрифтом результаты (Alexeeva et al., 2020; Alexeeva, Zubov, & Konina, 2022). Это подтверждает то, что визуальное представление текста может оказывать влияние на лингвистические процессы и требует дальнейшего изучения.

5. Классификации ошибок вслух при чтении детьми с дислексией
Одним из основных способов определения подвидов дислексии является анализ ошибок вслух (Величенкова & Русецкая, 2015). Ошибки показывают сложности на разных лингвистических уровнях и в соответствии с этим в отечественном подходе у ребенка или взрослого отмечаются тот или иной подвид дислексии (например, фонематическая или грамматическая дислексия). Как мы видели в пункте 4, типографические характеристики (в частности, шрифт) могут оказывать влияние на ошибки вслух различных типов. В связи с этим, в данном проекте мы также произведем анализ ошибок вслух и посмотрим, как шрифт влияет на количество ошибок тех или иных типов. Одной из задач данного проекта на этапе написания заявки был поиск наиболее удобной и подробной классификации ошибок при устном чтении. Мы проанализировали несколько диссертаций и статей на русском и английском языках, посвященных ошибкам в чтении и устной речи для того, чтобы выявить все возможные типы ошибок вслух (Crystal, 2012; Dorofeeva et al., 2019; Goodman, 1969; Lichtenberger & Smith, 2005; Schrank et al., 2014; Stafford, 1967; Stemberger, 1989; Stuever, 1969; Weber, 1970; Завадская, 2018; Подлесская & Кибрик, 2007; Русецкая, 2003; Садовникова, 2005; Сапунова, 2009)
А. Н. Корнев выделяет основные типы ошибок, которые встречаются практически в каждом экспериментальном исследовании: замены гласных и согласных, добавления, перестановки, инверсии, ошибки угадывающего чтения и чтение по слогам (Корнев 1997). В диссертации М. Н. Русецкой о связи дислексии с нарушениями речи (2003) приведена классификация 20 типов ошибок. Она отличается от предыдущей тем, что в ней уточнены типы вовлеченных в ошибку звуков (согласные или гласные), а также причины их смешения (наличие акустико-артикуляторного или визуального сходства). В эту классификацию также входят такие типы, как аграмматизм, антиципации (замена звука на предвосхищаемый звук), "персеверация" (замена звука на персеверируемый звук) и неправильное ударение. Работа Русецкой показала сложную природу ошибок. Почти каждая ошибка в слове может быть отнесена сразу к нескольким типам; например, изменение окончания существительного — это и аграмматизм, и замена одного или нескольких звуков. Это означает, что одна и та же ошибка может отражать трудности на разных языковых уровнях.
Версия классификации С. В. Дорофеевой (Дорофеева и др., 2019) более лаконична: в ней присутствует разделение ошибок по количеству звуков, в которых есть ошибка, а также по тому, какой частью речи является слово (основной или служебной). Стоит также отметить, что в ее классификации было проведено разделение ошибок без самоисправления и с самоисправлением. В (Садовникова 2005) приведены конкретные пары акустико-артикуляторных сходных звуков, а также автором выделен новый тип ошибок ("смешение звуков по кинетическому сходству"). Пособие И. Н. Садовниковой оказалось полезным еще и потому, что в нем упоминается тот факт, что персеверации и антиципации возможны в пределах нескольких слов, а не только в пределах одного слова.
Е. М. Сапунова (2009) и А. А. Кибрик и В. И. Подлесская (2007) показали нам, что несколько слов в строке могут быть затронуты оговоркой. Кроме того, возможны и более сложные случаи. В частности, исправление неправильно произнесенного слова может сопровождаться повторением нескольких предыдущих изначально правильных слов. Фальстарты, которые часто называют "обрывами", находятся в центре типологии Ю. О. Завадской (2018). Ю. О. Завадская также приводит несколько типов возможных реакций на обрывы (вербальных и невербальных) и способы заполнения пауз в речи.
Необходимо также упомянуть классификации, разработанные для английского языка. Прежде всего, мы обратились к руководству "The Woodcock-Johnson Best of Achievement-IV" (Mathler & Wendling 2014). Это широко используемый тест для оценки когнитивных способностей, который также включает блок с чтением вслух. В руководстве к тесту выделяют такие ошибки, как замены, пропуски, вставки и возвраты звуков, что также является ключевой особенностью почти всех русских классификаций. Также были проанализированы пособия по другим англоязычным текстам на чтение вслух (Stafford 1967, Stuever 1969). К. Стефорд (1967) подчеркивает структурный аспект ошибок: находятся ли они в начале, в середине или в конце или затрагивают несколько частей слова. Среди источников ошибок устной речи следует также выделить классификацию Й. Штембергера (Stemberger 1989: 168). Он заметил, что ошибки могут быть семантически, синтаксически или фонетически (не)приемлемыми. Классификация 20 наиболее частых категорий речевых ошибок в "Кембриджской энциклопедии языка" (Crystal 2012) напомнила нам, что необходимо обращать внимание на кластеры согласных.
Проанализировав все эти источники, мы пришли к выводу, что необходимо создать собственную классификацию ошибок, соотнеся каждую ошибку, упомянутую в предыдущих исследованиях, с определенным лингвистическим уровнем.

6. Методы машинного обучения при предсказании дислексии

Для автоматической диагностики дислексии используются данные когнитивных тестов (Chakraborty & Sundaram, 2021; Latifoğlu et al., 2020; Mulakaluri & Girisha, 2020; Rello et al., 2018), параметры движений глаз при чтении (Asvestopoulou et al., 2019; Benfatto et al., 2016; Chakraborty, 2020; Rello & Ballesteros, 2015), сигналы ЭЭГ (Frid & Manevitz, 2018; Mulakaluri & Girisha, 2020; Perera et al., 2018; Rezvani et al., 2019) и ФМРТ (Cui et al., 2016; Ploński et al., 2017), аудио- записи (Radford et al., 2021; Tolami et al., 2021) и опросники (Jayasinghe, 2019). Результаты достигают точности более 95% (Chakraborty, 2020; Latifoğlu et al., 2020; Mulakaluri & Girisha, 2020). Среди лучших методов классификации выделяют K-means (Jayasinghe, 2019; Kariyawasam et al., 2019; Mulakaluri & Girisha, 2020), Random Forest (Latifoğlu et al., 2020), SVM (Benfatto et al., 2016; Chakraborty, 2020; Chakraborty & Sundaram, 2021; Rello & Ballesteros, 2015; Rezvani et al., 2019), нейронную сеть (Radford et al., 2021). Методы работают на от 5 до более 220 признаков — различных измерений когнитивного поведения людей с дислексией и без нарушения чтения (Chakraborty, 2020; Kaisar, 2020). Хотя в большинстве случаев количество участников в экспериментальной (с дислексией) и контрольной группе (без дислексии) приближается к 100 и даже больше (Kaisar, 2020), в некоторых исследованиях размер каждой группы участников составляет лишь 30-50 человек (Cui et al., 2016; Perera et al., 2018; Ploński et al., 2017; Radford et al., 2021; Rello & Ballesteros, 2015; Rezvani et al., 2019; Richard & Serrurier, 2020).
Проанализировав литературу, мы пришли к выводу, что нам необходимо как минимум 30 человек в экспериментальной группе для более или менее успешного предсказания дислексии. Помимо когнитивных тестов мы построим классификатор с учетом различных ошибок чтения вслух. Прежде всего, мы воспользуемся методом классификации SVM, так как это наиболее популярный метод в области.

Предлагаемые методы и подходы, общий план работы на весь срок выполнения проекта и ожидаемые результаты

Задача 1 (определения объекта исследования и выборки) была определена на этапе написания заявки.
Объектом исследования с точки зрения визуального представления стал шрифт. Мы остановились на данном типографическом элементе по следующей причине. Проанализированная литература (см. пункт 2, формы 4.5) показывает, что именно шрифты построены таким образом, чтобы оптимальным образом учесть как можно больше параметров, которые влияют на удобочитаемость текста. Таким образом, выбрав шрифт как основной объект исследования, мы сможем проследить его возможное влияние на лингвистические процессы в оптимальном с точки зрения дизайна виде. При этом мы решили провести исследование, привлекая 4 различных шрифта, чтобы тем не менее оценить различия с точки зрения некоторых базовых типографических характеристик. Ими стали Times New Roman, Roboto, LexiaD и Антидислексия.

Times New Roman – это широко используемый пропорциональный шрифт с засечками, Roboto (шрифт по умолчанию для Google-приложений) — это широко используемый пропорциональный шрифт без засечек. Наши исследования показывают, что по субъективной частотности использования (знакомости) данные шрифты значимо не отличаются (Alexeeva, Zubov, & Konina, 2022; Alexeeva, Zubov, & Nikonova, 2022). Тем не менее они фундаментальным образом отличаются друг от друга по наличию засечек. С точки зрения оптической дислексии важно протестировать шрифты специально созданные для людей с дислексией. В связи с этим в набор шрифтов включены LexiaD (Alexeeva et al., 2020) и Антидислексия (http://app.prostoslovo.com). Эти шрифты оба без засечек, но при этом LexiaD — пропорциональный, а Антидислексия — моноширинный. Хотя LexiaD был протестирован относительно ряда шрифтов (Alexeeva et al., 2020; Alexeeva, Zubov, & Konina, 2022; Alexeeva, Zubov, & Nikonova, 2022), он не сравнивался с Times New Roman и Roboto в группе с дислексией. Шрифт Антидислексия ранее протестирован не был.

Таким образом, мы сможем оценить в первом приближении влияние таких характеристик шрифта, как засечки (сравнив Times New Roman и Roboto), пропорциональность (сравнив LexiaD и Антидислексию) и предназначенность для людей с дислексией (сравнив Times New Roman/Roboto и LexiaD/Антидислексию), на лингвистическую обработку на разных уровнях.

В качестве основной выборки мы остановились на подростках возраста 15-17 лет по следующим причинам. Мы получили предварительное согласие на проведение исследования в Речевой школе 3 (г. Санкт-Петербург), а наши предыдущие исследования показывают (Alexeeva et al., 2020; Alexeeva, Zubov, & Konina, 2022), что в данной школе действительно учатся дети со значимо сниженной скоростью чтения, то есть с высоким риском дислексии. Следовательно, мы считаем, что мы сможем найти достаточное количество школьников с высоким риском дислексии для достоверных выводов по нашим основным вопросам. В связи с этим, мы не можем, к примеру сфокусироваться на взрослых, так как для нас нет очевидных способов нахождения людей с дислексией в этой возрастной категории. Тем не менее, мы проведем часть экспериментов и на взрослых (без нарушений чтения), чтобы подтвердить ранее найденное взаимодействие между типом шрифта и частотностью у взрослых носителей языка без проблем с чтением Paterson & Jordan, 2010; Slattery & Rayner, 2010). Мы расцениваем эту возрастную категорию как дополнительную. Что касается школьников, мы остановились на подростках, так как наше исследование предполагает прохождение множества тестов (см. ниже), которое может занять больше часа и школьникам младшего возраста будет сложно полностью его пройти. Поэтому мы решили привлечь школьников старшего возраста.

Задача 2 (оценка выборки на предмет дислексии и ее подвидов).
Для определения наличия высокого риска дислексии у того или иного подростка необходимо собрать современные нормы чтения вслух у подростков без наличия нарушений чтения. Недавние подобные нормы для детей младшего возраста были собраны (Dorofeeva et al., 2019). Воспользовавшись дизайном и процедурой данной работы, мы предполагаем собрать данные при чтении вслух у 90-100 подростков без истории диагностированных неврологических расстройств, диагностированных проблем с освоением чтения, с нормальным или скорректированным до нормального зрением (информация об этом будет собрана при помощи опроса) и нормальным уровнем невербального интеллекта и рассчитать среднюю скорость чтения. В (Dorofeeva et al., 2019) высокий риск дислексии был определен как низкая скорость чтения (соответствующая скорости меньшей, чем разницы между средним и 1,5 стандартных отклонений). Невербальный интеллект будет протестирован при помощи матриц Равена (Равен & Корт, 2002). Скорость чтения будет померена по методики СМИНЧ (Корнев & Ишимова, 2010) на одном тексте: количество правильных прочитанных слов за 1 минуту чтения. Выбор материала (текста) и вопросов на понимание к ним будет осуществлен во время консультации с логопедами Речевой школы 3.
Для определения двух интересующих нас подвидов дислексии (оптической и фонематической) мы проведем ряд тестов:
- субтест «Замена звука в псевдослове» из батареи тестов ЗАРЯ, разработанной в Центре языка и мозга НИУ ВШЭ. Он показывает сложности в фонологической обработке c наибольшей достоверностью (Dorofeeva et al., 2020).
- тест на чтение отдельных слов и псевдослов, разработанный в Центре языка и мозга НИУ ВШЭ (Дорофеева et al., 2021). Он показывает другой аспект проблем с фонологической обработкой.
- тест на проверку зрительной обработки. Мы хотим протестировать две возможных причины оптической дислексии: уменьшенное поле визуального внимания и повышенная восприимчивость к визуальному шуму. Для этого мы адаптируем тест на поиск букв в массиве с частичным отчетом (см. подробнее форму 4.5, п. 1) так, чтобы он показывал сложности в этих двух аспектах – изначально он разработан только для определения уменьшенного поля визуального внимания (Snowling, 2019). Процедура исходной версии — следующая. Участникам показывают последовательность букв, потом ее маскируют (заменяют буквы на звездочки) и стрелкой указывают на какую-то из звездочек, участник должен назвать букву, которая стояла в последовательности на этом месте. Люди с оптической дислексией выполняют эту задачу хуже, чем люди без дислексии. При этом наибольшие сложности вызывают позиции на концах последовательности (в отдалении от точки взора). В нашей версии после показа последовательности мы будем предъявлять две буквы и просить участников выбрать, какая из букв была частью ранее предъявленной последовательности. Позиция «правильной» буквы будет варьироваться в последовательности. Так мы сможем оценить сложности в поиске букв на концах последовательности. Такой дизайн будет снижать нагрузку на вербальную память (не нужно называть конкретную букву). Сниженная вербальная память сама по себе может быть причиной дислексии. Кроме того, в паре с правильной буквой мы будем показывать либо визуально похожие, либо визуально непохожие буквы. Это, по нашему мнению, поможет выявить сложности, связанные с особой восприимчивостью к визуальному шуму. Визуально похожие буквы для русского языка были определены нами ранее (Алексеева et al., 2019; Конина & Алексеева, 2016).

Таким образом, каждый участник с предполагаемой дислексией (из Речевой школы) и без предполагаемых нарушений пройдет следующие тесты: тест по методике СМИНЧ, определяющей скорость чтения, тест на невербальный интеллект, тест на замену звука в псевдослове, тест на чтение слов и псевдослов и тест на зрительную обработку. Кроме того, у каждого участника мы соберем демографическую информацию и информацию, связанную с речевыми нарушениями. Все эти тесты позволят нам выделить участников с высоким риском дислексии, а среди них участников с фонематической, оптической, смешанной и дислексией другого типа.

Задача 3. (эксперимент, нацеленный на изучение скорости распознавания слов в зависимости от типа шрифта и частотности).
В качестве методической основы мы возьмем исследование (Moret-Tatay & Perea, 2011), в котором изучалось влияние засечек в семействе шрифтов Lucida на скорость распознавания отдельных слов. Исследование было проведено методом лексического решения (участнику необходимо определить при помощи нажатия клавиш на клавиатуре, является ли предъявленная последовательность букв словом или псевдословом), измерялась скорость распознавания отдельных слов и псевдослов. Мы включим в эксперимент не менее 50 реальных слов на каждый шрифт, из них 50% будут низкочастотными и 50% высокочастотными. Мы создадим две версии эксперимента. В первой версии будут исследоваться Times New Roman, Roboto и Антидислексия, во второй — Times New Roman, Roboto и LexiaD. Включение всех четырех шрифтов в один шаблон сильно бы увеличило время прохождения эксперимента. Поэтому мы остановились на двух версиях.

Эксперимент пройдут все участники с высоким риском дислексии, а также подростки и взрослые без нарушений чтения. Мы предполагаем, основываясь на литературе (Paterson & Jordan, 2010; Slattery & Rayner, 2010), что по крайней мере для участников без нарушений фактор частотности будет сильнее выражен в новых для них шрифтах LexiaD и Антидислексия, чем для Times New Roman и Roboto. В отношении экспериментальной группы на данный момент предположений нет.

Задача 4. (эксперимент, нацеленный на изучение влияние типа шрифта на количество ошибок, относящихся к разным языковым уровням)
Как показал анализ литературы, относящийся к классификациям ошибок вслух (см. форму 4.5, п. 5), читающие могут делать большое количество разнообразных ошибок. По предварительным подсчетам не менее чем 25-30. В связи с этим, для изучения влияния типа шрифта на количество ошибок различных видов мы ограничимся исследованием двух шрифтов: Roboto и LexiaD. Мы выбрали Roboto, так как это современный популярный шрифт, кроме того, он так же, как и LexiaD, является шрифтом без засечек. Мы выбрали LexiaD, так как при изучении дислексии важно исследовать шрифты, предназначенные для дислексиков. Мы предпочли LexiaD над Антидислексией, так как мы не имеем доступа к самому шрифтовому файлу для шрифта Антидислексия, этот шрифт не распространяется в настоящий момент. Для задачи 3 (см. 4.7. «Задел исследования») автор шрифта уже прислал нам список слов, набранных в шрифте Антидислексия.

Методика эксперимента будет следующая. Участники исследования будут читать вслух два текста, один из которых будет набран в Roboto, другой — в LexiaD. В соответствии с рекомендациями СМИНЧ (Корнев & Ишимова, 2010) мы ограничимся одной минутой чтения. Мы будем вести аудиозапись, затем расшифруем записи и выделим различные виды ошибок. Воспользуясь анализом существующих классификаций ошибок (см. форму 4.5, п. 6), мы создадим собственную классификацию ошибок, в которой ошибки будут соотнесены с тем или иным лингвистическим уровнем (семантическим, грамматическим, фонетическим и прагматическим), и распределим ранее выделенные ошибки по данной классификации. Выбор материала (текста) и вопросов на понимание к ним будет осуществлен во время консультации с логопедами Речевой школы 3.

Данный эксперимент пройдут подростки с нарушением чтения и без такого.
Далее статистическим методом мы определим влияния шрифта на ошибки на различных лингвистических уровнях.

Мы предполагаем, что для Задач 3 и 4 у нас наберется достаточное количество подростков с дислексией, чтобы сравнить влияния шрифта на лингвистическую обработку у участников без нарушения чтения и с дислексией в целом. Однако, мы не можем гарантировать, что то количество оптических и фонематических дислексиков внутри экспериментальной группы, которое мы выявим по результатам задачи 2, позволит нам с уверенностью сделать выводы для отдельных подвидов дислексии.

Задача 5 (предсказание дислексии на основе ошибок вслух)
Полученная после выполнения задачи 4 таблица ошибок чтения вслух для подростков с дислексией и без нарушений чтения будет являться пространством признаков для разработки классификатора, который предсказывал бы наличие дислексии у того или иного ребенка. Мы надеемся, что в рамках Задачи 2 мы выделим не менее 30 дислексиков. При этом у нас будут расшифровки ошибок вслух для не менее 90-100 (см. выше Задача 2) подростков без нарушений чтения. И для каждого участника у нас будет от 25 до 50 измерений (различных ошибок). Далее мы попробуем предсказать дислексию на основе данных признаков при помощи SVM (наиболее популярного классификатора в области, см. форму 4.5, п. 5) с 10-ти проходной перекрестной проверкой (кросс-валидацией). Классификатор позволяет выделить наиболее диагностирующие признаки, то есть в нашем случае ошибки.
Эта задача является дополнительной, так как мы не уверены, что данных хватит для того, чтобы предсказать наличие высокого риска дислексии хотя бы с 90% точностью.

Общий план работы на весь срок проекта и ожидаемые результаты
2022 год (на этапе написания заявки):
Решена Задача 1 (см. выше), частично решена Задача 3 (см. форму 4.7 «Задел» ниже) 2023 год

- План: решена Задача 2. Результаты: рассчитаны современные нормы чтения вслух у подростков без дислексии; разработан тест на зрительную обработку; собраны когнитивные тесты у подростков из обычных и речевой школ; выявлены подростки с высоким риском дислексии в целом и ее подвидов (оптической, фонематической, смешанной из оптической и фонематической и другого рода)

- План: частично решены Задача 3 и 4. Результаты: собраны данные для эксперимента в рамках Задачи 3; подобран материал и собраны данные для эксперимента в рамках задачи 4.
2024:
- План: Решена Задача 3. Результаты: проведен статический анализ и оценено влияние типа шрифта на эффект частотности при распознавании слов у подростков с нарушениями чтения и без них, а также у подростков и взрослых без нарушений.

- План: Решена Задача 4. Результаты: составлена многофакторная классификация ошибок чтения вслух; ошибки чтения вслух распределены по классификациям; проведен статистический анализ; оценено влияние типа шрифта на ошибки, относящихся к разным лингвистическим уровням у подростков с нарушениями чтения и без них.

- План: решена Задача 5. Результаты: построен классификатор на основе ошибок вслух для предсказания дислексии; оценено наличие диагностирующих ошибок при чтении вслух.

Имеющийся у научного коллектива научный задел по проекту, наличие опыта совместной реализации проектов

В рамках Задачи 3 (см. предыдущий пункт) отобран материал, разработан шаблон эксперимента и проведен пилотный сбор данных по исследованию влияния шрифта (Roboto, Times New Roman, Антидислексия) на эффект частотности у взрослых носителей русского языка без нарушения чтения. Было показано, что взрослые носители языка в большей степени опираются на частотность при распознавании слов в Антидислексии, чем Roboto. Однако, между остальными парами шрифтов не было обнаружено подобной разницы на статически значимом уровне. Пилотный эксперимент был проведен совместно с Яной Никоновой, участницей проекта и отражен в курсовой работе (Никонова Я. Эффект шрифта при чтении взрослыми носителями русского языка. Курсовая работа 3 курса. Санкт-Петербургский государственный университет. Санкт-Петербург). Разработанный шаблон эксперимента предполагается использовать в данном проекте.

Опыт совместной реализации проекта с остальными участниками проекта.
Алиса Лезина под руководством Светланы Алексеевой (руководителя проекта) провела исследование стратегии идентификаций букв в слове носителями финского языка. Использовался метод поиска букв в слове — этот метод очень похож на метод, который лежит в основе зрительного теста, который необходимо будет адаптировать для русского языка в данном проекте. Было показано, что для носителей финского языка действует параллельная стратегия распознавания букв, а не последовательная, как предполагалось в соответствии с гипотезой М. Ктори и Н. Питчфорда (Ktori & Pitchford, 2008). Результаты исследования отражены в курсовой работе (Лезина А. Закономерности распознавания буквенного состава слова в языках с разным типом орфографии. Курсовая работа 1 курса. Национальный исследовательский университет «Высшая школа экономики». Санкт-Петербург).

Светлана Алексеева и Анастасия Шиморина являются участниками проекта OpenCorpora (opencorpora.org). Проект представляет собой ресурс для морфологической разметки текста по технологии crowdsourcing. В обязанности Светланы Алексеевой и Анастасии Шимориной входит написание инструкций по морфологической разметке и проверка разметки, выполненной другими участниками проекта. На настоящий момент Анастасией и Светланой проверено 10971 предложений (более 70000 слов).

Акроним	RSF_SRG_2023 - 2
Статус	Завершено
Эффективные даты начала/конца	1/01/24 → 31/12/24

Области исследований

чтение, подростки, визуальное представление текста, дислексия, оптическая дислексия, фонематическая дислексия, шрифты, тест на зрительную обработку, русский язык

ID: 115552989