описание

Само возникновение психологии как самостоятельной науки связано с включением в ее методологию математического моделирования и статистических расчетов. Однако, начиная с середины XIX в. и по сегодняшний день применение количественных методов для исследования психических явлений вызывает бурные дискуссии. На данный момент психология находится в стадии очередного пересмотра методологических позиций. (грант "Количественные исследования в психологии: ретроспективный анализ", РФФИ 15-06-99491) Под сомнение ставится эффективность традиционной практики статистической проверки гипотез, изменяется роль математического моделирования психических явлений и т.д. При этом остается открытым вопрос о том, какую роль в производстве психологического знания играют количественные методы? Какими знаниями в области статистики и математического моделирования должен обладать современный психолог, чтобы быть способным проводить научные исследования мирового уровня?

описание для неспециалистов

Проект направлен на выявление основных закономерностей и тенденций развития математических и статистических методов в практике психологических исследований. Основной комплекс источников составили научные статьи, опубликованные в основных международных журналах Американской психологической ассоциации (АПА) за последние более чем 100 лет, и учебная литература по математическим методам для психологов. Целью исследования было выявление ключевых характеристик современной статистической практики, отвечающей требованиям международного психологического сообщества. Для изучения интересующих нас закономерностей были использованы методы корпусной лингвистики и библиометрии, статистический анализ и математическое моделирование, которые включали моделирование структурными уравнениями (SEM), анализ временных рядов, нейросетевые технологии, байесовское моделирование и графы. Перед построением моделей статистической практики была проведена валидизация собранных данных на основе экспертной оценки части текстов и улучшение качества данных с помощью нейросетевого моделирования. Далее в результате вычисления моделей скачков затухающих колебаний была описана динамика использования математических методов. Для каждого метода были вычислены 1, 2 и 3-скачковые модели. С помощью байесовский критерий информативности WAIC для каждого математического метода была найдена лучшая модель. Затем с помощью этих моделей были сгенерированы данные прогноза статистической практики до 2040 года. Интерпретация результатов позволила описать основные характеристики современной статистической практики и пути дальнейшего развития количественного подхода в психологии.

основные результаты по проекту в целом

Общие характеристики итоговой базы статей с математическими методами

Методика выявления использованных в психологических статьях математических методов с помощью поисковых запросов позволила нам обнаружить и зафиксировать в общей сложности 126423 случая упоминания методов в 34016 статьях из 8 психологических журналов: American Psychologist (1946 – 2019, 2952 статей из 31503, WoS – Q1, Scopus CiteScore 2018 – 4.06), Journal of Abnormal Psychology (1906 – 2019, 3254 статьи из 14823, WoS – Q1, Scopus CiteScore 2018 – 5.82), Journal of Applied Psychology (1917 – 2019, 5468 статьи из 15141, WoS – Q1, Scopus CiteScore 2018 – 6.86), Journal of Comparative Psychology (1912 – 2019, 3232 статьи из 12747, WoS – Q2, Scopus CiteScore 2018 – 1.87), Journal of Educational Psychology (1910 – 2019, 2962 статьи из 14503, WoS – Q1, Scopus CiteScore 2018 – 5.81), Journal of Experimental Psychology: General (1916 – 2019, 2384 статьи из 14749, WoS – Q1, Scopus CiteScore 2018 – 4.39), Journal of Personality and Social Psychology (1965 – 2019, 6316 статей из 18187, WoS – Q1, Scopus CiteScore 2018 – 7.41), Journal of Consulting and Clinical Psychology (1937-2019, 7448 статей из 16621, WoS – Q1, Scopus CiteScore 2018 – 5.35).
В общей сложности полученная нами база содержит 34016 уникальных статей за 1906 – первую половину 2019 годов, в которых упоминается 34 наиболее часто встречаемых в психологических статьях метода анализа данных: корреляционный анализ (20864 статьи), проценты (14944 статьи), дисперсионный анализ (17142 статьи), регрессионный анализ (8185 статей), факторный анализ (11023 статьи + 2485 статей с методом главных компонент), анализ надежности (5591 статья), мета-анализ (9045 статей), t критерий Стьюдента (8212 статьи), моделирование структурными уравнениями (6608 статьи) и др. В частности, также было выявлено 1260 случаев упоминания байесовского анализа, 657 случаев упоминания нейронных сетей.
Состав списка математических методов был предварительно определен с помощью двух методов. Во-первых, путем анализа содержания учебных пособий по математическим методам для психологов 1920 – 2010-х гг. издания. (см. Морозова С.В., 2014; Морозова С.В., 2013) Во-вторых, он определялся с помощью сплошного просмотра статей журнала Journal of Experimental Psychology: General за 1980 – 1998 гг. Благодаря этому были выявлены не только основные методы, но и варианты их написания в исследовательских статьях. Всего было просмотрено 585 статей. (см. Морозова С.В., 2017)
В полученных данных есть несколько технических лакун. Отсутствуют данные для: American Psychologist за 1952 год, Journal of Comparative Psychology и Journal of Consulting and Clinical Psychology за 1946 год, Journal of Experimental Psychology: General за 1976 и 1980 годы. Общее количество проанализированных годовых комплектов 8 журналов 736 подшивок, отсутствующие 5 из них составляют всего 0.68%. Поэтому для дальнейшего моделирования мы считаем, что в случае необходимости будет достаточно заполнить лакуны средними значениями по переменным для двух ближайших лет.
Для агрегации данных определенную сложность представляла история изменения названий некоторых журналов, объединения журналов под одним названием или разделение одного журнала на несколько. Во всех случаях в наших данных указывается текущее название издающегося в настоящий момент журнала/журнала-приемника. В целом удалось выявить и учесть следующие изменения в издательской политике ассоциации: American Psychologist, Journal of Applied Psychology, Journal of Educational Psychology и Journal of Personality and Social Psychology не переименовывались и не объединялись. Journal of Abnormal Psychology (с 1965) несколько раз менял название: The Journal of Abnormal and Social Psychology (с 1925), The Journal of Abnormal Psychology (с 1906), The Journal of Abnormal Psychology and Social Psychology (с 1921). Journal of Comparative Psychology (с 1983) – переименовывался и объединялся Psychobiology (с 1921), Journal of Animal Behavior (с 1921), Journal of Comparative and Physiological Psychology (с 1947). Journal of Consulting and Clinical Psychology (с 1968) ранее назывался Journal of Consulting Psychology (с 1937). Journal of Experimental Psychology (с 1916) был разделен на несколько отдельных журналов, в нашей базе он продолжается как Journal of Experimental Psychology: General (c 1995). Для проверки генеалогии журналов использовался электронный каталог Библиотеки Конгресса США. В случаях дублирования статей под разными названиями одного журнала записи объединялись.

Специфика базы PsycARTICLES

Исследование истории создания базы PsycARTICLES показало, что аннотации в статьях появляются в 1962-1963 гг., после основания в 1960 г. Института научной информации и появления первого индекса цитирования в 1963 г. Более того, в настоящее время база PsycARTICLES объединяет в себе базу текущих изданий ассоциации, реферативную базу PsycINFO с 1967 г. и исторический архив PsycINFO за 1887–1966 гг. Подробнее см. (Beebe L., 2010)
Аннотации, написанные для статей исторического архива были созданы сотрудниками Американской психологической ассоциации в 2010-х годах. Они в целом соответствуют текущим требованиям ассоциации (т.е. содержат в себе информацию об использовавшихся математических методах и конкретные количественные результаты).
Реферативная база PsycINFO за 1967–1985 гг. включала в себя оцифровку аннотаций и ключевых слов, которые написали сами авторы статей. В современной базе PsycARTICLES сохранились исходные аннотации за этот период. Эти аннотации соответствуют требованиям ассоциации к аннотациям периодических изданий, опубликованным в 1 и 2 изданиях Publication manual of the American psychological association, 1967 и 1974 года соответственно. В первом издании говорилось: «Аннотация исследовательской статьи должна содержать (I) проблему, (II) метод, (III) результаты и (IV) выводы. Результаты наиболее важны, и каждая аннотация должна включать как минимум тенденции или направления результатов. Должно быть указано число и особенно характеристики испытуемых. Тип дизайна исследования и уровни значимости результатов также должны быть включены.» (Publication manual, 1972, р. 12) Во втором издании характеристики уточнялись: «… Точно изложить характеристики выборки испытуемых (количество, тип, возраст, пол и др.) и описать дизайн исследования, тестовые методики, исследовательскую аппаратуру или процедуры сбора данных с точностью, необходимой для отражения их важности для эксперимента. Включать все названия тестов и общие названия лекарственных препаратов, которые были использованы. Резюмировать данные или результаты, включая уровни статистической значимости, если таковые имеются. Выводы или сравнения должны быть сделаны исходя из результатов.» (Publication manual, 1981, р. 15) Как можно видеть, в целом даже аннотации 1960-1980-х годов содержали в себе статистическую информацию, но она может оказаться не полной.
В настоящий момент реализован поиск по полным текстам в объединенной базе с 1985 г., хотя распознанные pdf-файлы статей доступны и за более ранний период. Поэтому даже если в аннотации статьи, вышедшей в 1985 году или позднее, отсутствует информация об использованных в исследовании математических методах, поиск выражений в тексте статьи дает возможность зафиксировать факт их использования или упоминания.
Современные требования к описанию результатов количественного анализа данных описаны в 6 издании Publication manual of the American psychological association, 2010 года. В разделе 2.07 «Результаты» приведены правила описания статистического анализа данных. В нем говорится: «Анализ данных и изложение результатов этого анализа являются фундаментальными аспектами проведения исследования. Точное, беспристрастное, полное и проницательное изложение аналитической обработки данных (будь они количественные или качественные) должно быть компонентом всех исследовательских публикаций.» (Publication manual, 2010, р. 32–33). Этот раздел является центральным в логике системы подтверждения научных фактов. Любое описание статистического анализа не будет полным, если в нем не приведено количество испытуемых в каждой группе; групповые средние значения (или количество случаев для каждого уровня номинальной переменной), стандартные отклонения или внутригрупповые дисперсии. Также полезно указание на процентное соотношение забракованных случаев. Применение конкретных методов статистики и математического моделирования подразумевает указание специфических показателей. Для многомерных методов (SEM, MANOVA) указания объединенных средних, размера выборки и корреляционных/ковариационных матриц чаще всего достаточно. Для статистических критериев (t, F, χ 2 ) необходимо указывать значение критерия, количество степеней свободы, точное значение р-уровня и специфические показатели, например стандартную ошибку. Также рекомендуется указывать доверительные интервалы. Все перечисленные меры нацелены на то, чтобы читатель мог оценить корректность интерпретации результатов статистического анализа. Очевидно, что запросы по аннотациям и полным текстам дают исчерпывающую информацию об использованных математических методах в современных статьях.
В целом специфика базы PsycARTICLES позволяет сделать предположение, что при автоматическом анализе использования математических методов в журнальных статьях характер ошибок в данных до 1985 года и после может отличаться. Исходя из этого, все полученные автоматическим способом данные целесообразно разделить на два массива: 1906-1984 (всего 6382 случаев использования математических методов) и 1985-2019 (всего 120041 случай использования математических методов). Количество случаев использования математических методов в массивах существенно различается.
В зависимости от общего количества опубликованных в журналах статей, мы видим разное количество случаев использования математических методов: American Psychologist (1906-1984 – 239 случаев и 1985-2019 – 5006 случаев), Journal of Abnormal Psychology (1906-1984 – 668 случаев и 1985-2019 – 12962 случая), Journal of Applied Psychology (1906-1984 – 1666 случаев и 1985-2019 – 21207 случаев), Journal of Comparative Psychology (1906-1984 – 522 случаев и 1985-2019 – 9140 случаев), Journal of Educational Psychology (1906-1984 – 642 случаев и 1985-2019 – 9047 случаев), Journal of Experimental Psychology: General (1906-1984 – 710 случаев и 1985-2019 – 7315 случаев), Journal of Personality and Social Psychology (1906-1984 – 689 случаев и 1985-2019 – 28100 случаев), Journal of Consulting and Clinical Psychology (1906-1984 – 1246 случаев и 1985-2019 – 27264 случая).

Выбор информации о цитированиях

Информация о цитированиях была взята из базы Scopus. Это было вызвано более удобным доступом к файлам данных, содержащих в себе количество цитирований для всех статей в интересующих нас журналах с 1970 по 2019 годы. Доступные для скачивания из базы csv файлы были ограничены данными за 14 лет. В общей сложности для 8 журналов это 32 csv файла с информацией о всех статьях журнала, не только тех, которые были выявлены с помощью наших запросов. В базе Web of Science аналогичные csv файлы имеют ограничения по количеству статей (не более 500). Так как общее количество статей составило 137474, то из базы необходимо было бы скачать 275 csv файлов. Это намного больше, чем в случае использования информации из базы Scopus. К сожалению, автоматизировать процесс скачивания csv файлов в обеих базах оказалось крайне сложно. Поэтому было принято решение ограничиться ручным скачиванием результатов из базы Scopus с информацией за 1970-2019 годы. В любом случае это информация за полвека, а «жизненный цикл» научных статей обычно составляет всего несколько лет. Из csv файлов с информацией о цитированиях были отобраны те статьи, которые мы выявили на предыдущем этапе путем применения методики выявления использованных в психологических статьях математических методов с помощью поисковых запросов.

Формирование файла исходных данных

Исходной информацией для агрегирования данных стали RIS файлы (RIS – международный формат записи библиографической информации о статье).
RIS файлы имеют определенную структуру, в которой в строчках текстового файла расположены текстовые поля, отражающие различные библиографические данные статьи. Каждое поле начинается с типа, отраженного парой символов. Наиболее важными среди них являются: ID - Идентификационный номер в базе, AU - Автор, AU - Следующий автор <…>, T1 - Название, JF - Журнал, JO - Journal of Abnormal Psychology, Y1 - Год и месяц издания, AD - Авторы и их рабочие адреса, AB - Аннотация (Abstract), KW - Ключевое слово 1, KW - Ключевое слово 2 <…>, N1 - Дополнительные поля базы в текстовой строке, разбитой через символ <.>, после которого идет название следующего поля и символ <:>. В этом поле содержатся такие дополнительные поля базы как Дата публикации (Release Date: ), Возрастная группа (Age Group: ), Популяция выборки (Population: ), Используемые измерительные методы (Test&Measures:) и т.п. информация.
Имя RIS файла сохранялось в формате: journ_query_Num.RIS. Где Journ – имя журнала, query – тип математических методов содержащийся в запросе, Num – номер в запросе.
Для преобразования RIS файлов в таблицу, пригодную для математического анализа была разработана программа ParseRis.exe на языке Object Pascal – Delphi. Сложности в разработке и отладке программы заключались в нечеткости представления данных в полях RIS файла. Особенно проблемным было поле N1, в котором содержалось большое количество ошибок, дополнительных точек в тексте, не являющихся разделителями и т.п.
Данная программа объединяла все поля RIS файла в поля таблицы в формате csv, пригодном для загрузки в популярные статистические программы: SPSS, Statistica, Matlab, Excel, R или Python NumPy. В поле AU – объединялись все авторы статьи, а в поле KW – все ключевые поля.
Так как преобразованная таблица содержала множество упоминаний одной и той же статьи, полученной в запросах по разным математическим методам, таблица была преобразована в «сводную таблицу» в которой каждой строке соответствовала одна статья с упоминанием встречаемости в разных запросах по разным математическим методам. Данная операция была произведена с помощью инструмента «Сводная таблица» в MS Excel.
Полученную таблицу необходимо было объединить с таблицами цитируемости статей тех же журналов, скачанных в базе Scopus. Загруженные из базы Scopus таблицы представляли собой csv файлы, в которых содержалось название статьи, дата публикации, авторы и журнал. В полях, озаглавленных номером года отражающих цитируемость, указывалось количество ссылок на статью в данном году. К сожалению, можно было скачивать отдельный файл, содержащий статьи, цитируемые за ограниченное количество лет подряд (14 лет). Поэтому данные по одному журналу содержались в целой группе файлов содержащих цитируемость за разные года. Для объединения этой информации в общую таблицу была разработана программа на языке Python.
Далее обе таблицы объединялись по ключевому полю, содержащему название статьи, журнал и год и месяц издания, которое объединялось в обеих таблицах. После устранения различий в указаниях названий статей и используемых специальных символах и букв национальных алфавитов удалось объединить более 90% библиографических данных статей с их цитируемостью.
После объединения для обработки полей KW и AU и некоторых других все ключевые слова например, были составлены в единые словари, в столбцах которых были ключевые слова, а в ячейках соответствующих каждой статье в строке единицами указывалось наличие данного слова в библиографическом описании статьи. Эта процедура также была реализована на языке Python. Такие же процедуры проводились с полем Авторы, Методы измерения, Популяция, методология и некоторыми другими.

Результаты выборочной ручной проверки валидности данных

Валидность информации о характеристиках статей проверялась с помощью вычитывания выборочных статей (по 5 случайно выбранных статей за каждые 10 лет из каждого журнала, входящих в базу). Полученные путем ручной проверки результаты сравнивались с программно полученными параметрами. В итоге была оценена степень ошибки алгоритма отнесения того или иного исследования, отраженного в статье, к тому или иному классу математических методов, примененных в исследовании и других параметров, вычисленных алгоритмом.
В целом количество ошибок в данных за период с 1906 по 1984 гг. меньше, чем с 1985 по 2019 гг. Было выявлено два типа ошибок: 1) ошибка отсутствия, когда в данных информации нет, хотя по факту метод использовался, 2) ошибка наличия, когда в данных информация есть, хотя по факту метод не использовался. Наибольшее количество ошибок допущено по отношению к часто встречающимся методам: дисперсионный анализ (1906-1984: ошибка отсутствия – 0.3%, ошибка наличия – 6.4%; 1985-2019: ошибка отсутствия – 5.6%, ошибка наличия – 3.3%), корреляционный анализ (1906-1984: ошибка отсутствия – 5.6%, ошибка наличия – 11.2%; 1985-2019: ошибка отсутствия – 8.9%, ошибка наличия – 3.1%), факторный анализ (1906-1984: ошибка отсутствия – 2.6%, ошибка наличия – 0.5%; 1985-2019: ошибка отсутствия – 10.7%, ошибка наличия – 0%), мета-анализ (1906-1984: ошибка отсутствия – 0%, ошибка наличия – 0%; 1985-2019: ошибка отсутствия – 9.7%, ошибка наличия – 0%), проценты (1906-1984: ошибка отсутствия – 3.8%, ошибка наличия – 9.9%; 1985-2019: ошибка отсутствия – 10.7%, ошибка наличия – 3.6%), регрессионный анализ (1906-1984: ошибка отсутствия – 0.8%, ошибка наличия – 0.5%; 1985-2019: ошибка отсутствия – 7.1%, ошибка наличия – 1%), t критерий Стьюдента (1906-1984: ошибка отсутствия – 0.8%, ошибка наличия – 6.4%; 1985-2019: ошибка отсутствия – 3.8%, ошибка наличия – 5.4%).
Ошибка наличия чаще характерна для данных за период с 1906 по 1984 гг., то есть количество случаев использования математических методов переоценивается. Особенно это касается процентов и корреляционного анализа, что не удивительно, так как слова «процент» и «корреляция» часто используются вне контекста анализа данных. Во всех указанных случаях ошибка отсутствия чаще встречается в данных за период с 1985 по 2019 гг., то есть количество случаев использования математических методов недооценивается. В целом количество ошибок приемлемо и не превышает 28.8% (для корреляционного анализа). Также можно сказать, что общее количество зафиксированных случаев не зависит от характера допущенных ошибок или доступа к поиску по полным текстам статей, т.к. ошибки наличия характерны не для периода значительного возрастания объема информации (с 1985 г.), как можно было бы ожидать.

Улучшение качества данных с помощью нейросетевых алгоритмов

Горбунов И.А. использовал нейронные сети для улучшения качества данных. В поисковых запросах к базе были введены ключевые слова, относящиеся к 34 математическим методам.
После частичной проверки полученных данных (392 статьи из выборки были проверены экспертами) оказалось, что поисковый алгоритм PsycARTICLES выдает ошибки по различным методам: до 29% ошибочных отнесений. При этом существуют отдельные периоды времени, в которых наблюдаются систематические ошибки алгоритма поиска, которые отмечаются в других работах (Piotrowski C., Perdue B. 2003).
Исходя из этого, мы решили провести коррекцию, полученных поисковым алгоритмом данных для повышения их точности. Входными данными для корректирующего алгоритма были частоты используемых слов в названии и абстракте статьи, а также исходное решение поискового алгоритма базы об использовании этого метода.
Алгоритм разрабатывался на основе моделей нейронных сетей реализованных в пакете Deep learning в приложении Matlab v.R2019. Для обучения правильному распознаванию метода в статье мы использовали трехслойный перцептрон (функция patternnet) с функцией ошибки вычисляемой как кроссэнтропия, и алгоритмом обратного распространения ошибки с коррекцией методом масштабированного сопряженного градиента (Алгоритм Левенберга-Макквардта). Для каждого метода подбиралась наилучшая нейросеть. Так как на качество обучения влияет как размер скрытого слоя, так и начальная конфигурация весов (Хайкин С. 2008), то при обучении варьировался размер скрытого слоя от 2 до 30 нейронов, для каждого размера выбирали наилучшую из 12 сетей, по проценту ошибок распознавания. Для исключения эффекта переобучения использовано случайное разделение выборок на обучающую – 65%, тестовую – 15% и контрольную 20%.
Подбор входного набора данных. При ограничении перечня слов в абстракте до частоты встречаемости >500 раз во всей выборке, словарь слов в абстрактах достигал 1015 слов, не считая слов в названии статьи. В результате весь набор входных параметров для обучения составлял 2044. Включение всех входных параметров во входной слой было невозможно, вследствие эффектов переобучения (Хайкин C. 2008). Поэтому необходимо было произвести индивидуальный подбор входных данных для каждого метода. Мы использовали следующий алгоритм:
a) Входным параметром назначаем переменную: «результат подбора поисковым алгоритмом PsycARTICLES»
b) Обучается оптимальная сеть с перебором размеров и начальных точек
c) Если входных параметров больше 2, проверяем, лучше ли диагностирует нейросеть. Если не лучше, удаляем параметр из входных
d) Если неудачных добавлений параметров более 30 запоминаем результаты, и выходим из алгоритма
e) Вычисляется функция ошибки для всех данных.
f) Коррелируем массив ошибок со всеми возможными входными переменными.
g) Самую скоррелированную с ошибкой переменную, добавляем на вход и переходим к пункту b.
Длительность работы алгоритма на ПК с процессором Intel Xeon E3-1220 3.0Ггц порядка 32 часов. В результате обучения прирост точности диагностики каждого метода, в среднем улучшился в 2.96 раз. Удалось улучшить точность выявления использованного математического метода во всех случаях. Полученные нейросети провели диагностику на оставшихся 33627 статьях, что позволило эффективнее продолжить анализ динамики использования математических методов.

Далее была проведена коррекция динамики использования методов в статьях журнала по полугодиям. Для анализа динамики статистической практики были выведены графики зависимости частоты использования определенного метода от времени. В процессе анализа графиков было выявлено, что проблема скачка 1985 года, связанная с поиском в полных текстах, при коррекции нейронными сетями полностью не удалена. Данный скачек наблюдается для всех методов в разной степени.
Для дальнейшей коррекции данного скачка была проведена следующая процедура. Вычислялись средние частоты использования данного метода за 4 полугодия до (1983-1984) – F1, и после (1985-1986) – F2.
Далее был вычислен коэффициент корректировки K=F2/F1, отражающий среднюю степень прироста выявления использования метода при включении поиска по полному тексту статьи.
Далее все частоты использования данного метода за полугодие до 1985 года умножались на вычисленный коэффициент. При визуальном анализе графиков оказалось, что динамика использования методов стала более гладкой и поддающейся интерпретации.
Кроме рядов использования каждого метода были получены временные ряды двух основных факторов, включенных в модель SEM. Они также подвергались дальнейшему анализу выявления периодических колебаний.

Проведение эксплораторного факторного анализа (ЭФА) и вычисление значений полученных факторов и моделирование структурными уравнениями (SEM).

Морозова С.В. провела эксплораторный и, далее, конфирматорный факторный анализ. Продолжая исследование проблемы использования количественных методов в психологии, в этом исследовании мы сосредоточились на проверке гипотезы о существовании двух методологий психологии. Об этом феномене в психологии говорил еще Л. Кронбах в 1957 г. в президентском обращении к членам АПА. (Cronbach L.J., 1957) Выборку составили 24657 статей из 8 журналов (American Psychologist, Journal of Abnormal Psychology, Journal of Applied Psychology, Journal of Comparative Psychology, Journal of Educational Psychology, Journal of Experimental Psychology: General, Journal of Personality and Social Psychology, Journal of Consulting and Clinical Psychology), издающихся АПА. Анализировалось использование следующих методов: ANOVA, t Student’s test, correlational analysis, factor analysis, reliability analysis, regression analysis, SEM. Методы были объединены в две латентные переменные. Процедура исследования включала несколько этапов: 1. подготовка данных к анализу, в том числе с использованием нейронных сетей, 2. расчет общей факторной модели математических методов для всех журналов (ЭФА); 3. расчёт основной и двух альтернативных структурных моделей (SEM). Оценка полноты имеющихся данных по БД Scopus показала, что до 1985 г. удалось выявить 38,5% статей, начиная с 1985 г. уже лучше – 66,5% (в целом 24657 статей из 57491). Результат можно считать хорошим, т.к. полного совпадения быть изначально не могло, ведь далеко не во всех статьях использовались какие-либо количественные методы. Подробнее о методике сбора данных смотрите (Горбунов И.А., 2019). Модели SEM включали следующие переменные: цитирования (общая сумма цитирований по БД Scopus), методология (статьи из журналов смешенной методологии – 0, или из Journal of Experimental Psychology – 1), информация о годе выхода статьи (до 1957, 1958-1985, после 1985). Альтернативные модели отличалась направлением связей между факторами и методологией, или тем, что переменная методология была исключена. Полученная основная структурная модель имеет характеристики: X^2=17.079, df=22, p=0.759, X^2/df=0.776, CFI=1.000, GFI=1.000, RMSEA<0.001, PCOLOSE = 1.000. Интерпретация этой структурной модели показала, что корреляционные методы менее часто встречаются в Journal of Experimental Psychology, чем ANOVA (β = -0.07 против β = 0.11). Общее количество цитирований статей зависит от использования методов выборочного сравнения (β = 0.08), а также непосредственно от двух методов: ANOVA (β = -0.04) и корреляций (β = 0.02). В целом количество случаев использования методов выборочного сравнения положительно зависит от количества случаев использования корреляционных методов (β = 0.69). Также было обнаружено влияние года на конкретные методы. В целом модель подтверждает идею существования двух методологий в психологии.

Значения полученных факторов были вычислены с помощью регрессионных уравнений и сохранены в отдельные переменные. Далее, мы проверили гипотезу о различии журналов по частоте использования методов анализа групповых различий и корреляционных методов. Для этого предварительно были рассчитаны годовые средние для обоих факторов. Также в анализе использовались две номинальные переменные: journals ("AP", "JAbP", "JApP", "JCompP", "JCCP", "JEdP", "JExP", "JPSP") и years ("befor 1958", "1958-1984", "1958 and later"). Для анализа групповых различий мы использовали Н критерий Кроскалла-Уоллеса, для апостериорных попарных сравнений тест Вилкоксона с поправкой fdr (пакет stats в R).
В целом журналы отличаются по обоим факторам: F1: Chi-squared = 133.43, df = 7, p-value < 2.2e-16; F2: Chi-squared = 167.37, df = 7, p-value < 2.2e-16. Апостериорные попарные сравнения показывают статистически значимые различия между журналами. Также наблюдаются различия факторов по годам: F1: Chi-squared = 465.16, df = 2, p-value < 2.2e-16; F2: Chi-squared = 475.05, df = 2, p-value < 2.2e-16. С течением времени среднегодовые значения факторов увеличиваются.
Для уточнения результатов мы проанализировали различия по журналам отдельно в каждого из периодов. До 1958 года значения обоих факторов для журналов статистически значимо различаются: F1: chi-squared = 86.437, df = 3, p-value < 2.2e-16 (AP и JExP журналы статистически значимо не отличаются); F2: chi-squared = 82.668, df = 3, p-value < 2.2e-16 (все журналы статистически значимо различаются).
Между 1958 и 1984 гг. оба фактора имеют разную выраженность у различных журналов: F1: chi-squared = 95.966, df = 7, p-value < 2.2e-16; F2: chi-squared = 78.051, df = 7, p-value = 3.437e-14. Апостериорные сравнения позволяют сделать вывод, что большинство журналов отличаются друг от друга по обоим факторам, за исключением журнала JCompP. По F1 также статистически значимо не отличаются: AP и JExP; JApP и JCCP. Также не наблюдается статистически значимых различий по F2: AP и JExP; JAbP и JEdP; JCCP и JApP, JEdP.
Начиная с 1985 года журналы также статистически значимо отличаются по обоим факторам: F1: chi-squared = 214.65, df = 7, p-value < 2.2e-16; F2: chi-squared = 209.37, df = 7, p-value < 2.2e-16. Согласно апостериорным сравнениям, статистически значимо не различаются по F1 журнал JEdP и JCCP, JExP; по F2 – JApP с JCCP и JExP, а также JCCP с JExP.
Таким образом можно говорить, что до 1985 года низкие сходные среднегодовые показатели по F1 имеют журналы American Psychologist и Journal of Experimental Psychology: General. Начиная с 1985 года средними сходными среднегодовыми значениями по F2 обладают Journal of Consulting and Clinical Psychology и Journal of Applied Psychology.

Графы системы математических методов и изменения центральности

Анализ популярности математических методов был проведен Морозовой С.В. с помощью графов. Исходными данными стала информация о среднем числе взаимной встречаемости различных математических методов в конкретных журналах относительно всех опубликованных за интересующий нас период статей в этом журнале, то есть взвешенные частоты взаимной встречаемости. Имеются ввиду только статьи с математическими методами, вошедшие в нашу базу и имеющие информацию о цитированиях. Выборку составили 24657 статей из 8 журналов за 1906-2019 годы.
Здесь важно отметить, что данные не включали в себя полный перебор пар, а только частоты пар типа «метод*журнал». Информация для пар «метод*метод» и «журнал*журнал» в матрице отсутствовали. Это необходимо учитывать при интерпретации коэффициента ассортативности, так как вероятность наличия ребра у узла, соответствующего журналу, в целом несколько выше, чем у узла, соответствующего математическому методу. Особенно это касается данных за 1906-1957, где имеется информация о 4 журналах и 8 математических методах. За более поздний период картина одинаковая – 8 журналов и 9 методов, соответственно, для графов за 1958-1985 и 1986-2019 годы коэффициенты ассортативности можно сравнивать.
Были построены три математических графа, для данных за 1906-1957 (1309 статей), 1958-1984 (3286 статей) и 1986-2019 (20094) гг. Для всех графов использовались общие принципы построения. Графы обычные, неориентированные, взвешенные, количество вершин определялось произвольно. Для позиционирования узлов графа на графике использовался алгоритм spring layout (укладка Фрюхтермана-Рейнгольда). Во всех графах при визуализации учитывались частоты взаимной встречаемости более 0 раз.
1. Характеристики графа для данных за 1906-1957 годы: 12 узлов, 26 ребер, плотность 0.394, ассортативность -0.797. Узлы графа включают журналы (American Psychologist, Journal of Applied Psychology, Journal of Experimental Psychology, Journal of Educational Psychology), а также следующие математические методы: дисперсионный анализ, t критерий Стьюдента, проценты, анализ надежности, регрессионный анализ, Chi2 критерий, корреляции, факторный анализ.
2. Характеристики графа для данных за 1958-1985 годы: 17 узлов, 61 ребро, плотность 0.449, ассортативность -0.295. Узлы графа включают журналы (American Psychologist, Journal of Abnormal Psychology, Journal of Applied Psychology, Journal of Comparative Psychology, Journal of Consulting and Clinical Psychology, Journal of Experimental Psychology, Journal of Educational Psychology, Journal of Personality and Social Psychology), а также следующие математические методы: дисперсионный анализ, t критерий Стьюдента, моделирование структурными уравнениями, проценты, анализ надежности, регрессионный анализ, Chi2 критерий, корреляции, факторный анализ.
3. Характеристики графа для данных за 1986-2019 годы: 17 узлов, 71 ребро, плотность 0.522, ассортативность -0.753. Узлы графа полностью сответствуют графу для данных за 1958-1985 годы.
Как можно видеть, плотность графов, то есть отношение ребер и узлов, с течением времени увеличивается. оценка взаимозависимости между степенями смежных вершин. Значение коэффициента ассортативности выше всего для графа за 1958-1985 годы. Однако, для всех трех графов коэффициенты ниже нуля. Следовательно, вершины с большими степенями соединяются ребрами в основном с вершинами с меньшими степенями. Другими словами, для всех трех графов характерно дизассортативное смешивание. Этот результат был ожидаемым, так как исходные данные имели описанную выше специфику.
Далее к описанным выше графам был применен алгоритм выявления сообществ Лувейн, разбиение на две части, разбиение на основе модулярности, разбиение алгоритмом Гирвана-Ньюмана. Наилучшие показатели модулярности были получены для алгоритма Лувейн.
Результаты анализа сообществ позволяют сделать вывод, что в 1906-1957 годы было разбиение математических методов на группу тех, которые используются для анализа групповых различий и на все остальные методы. При этом методы анализа различий чаще встречаются на страницах журналов, с большей вероятностью публиковавших статьи с результатами экспериментов. В период с 1958 по 1985 годы эти два выявленных ранее сообщества дополнились соответствующими методами и журналами. Исключение составляет лишь журнал Journal of Personality and Social Psychology, в котором часто встречались статьи с анализом надежности и t критерием Стьюдента. По-видимому, для этого журнала в указанный период были характерны статьи с информацией о проверке надежности и валидности психологических методик. На последнем этапе мы видим четкое разбиение математических методов на три группы: анализ различий, анализ взаимосвязей и непараметрические методы. Вероятно, первые две группы включают в себя в метрические методы анализа. Таким образом в сети математических методов и психологических журналов с 1985 года произошла реструктуризация. Однако, общая тенденция сохраняется – в журналах, чаще публикующих экспериментальные статьи, более вероятно увидеть методы анализа различий, а в журналах, которые с большей вероятностью публикуют исследования с корреляционным или квазиэкспериментальным дизайном, чаще встречаются методы анализа взаимосвязей.
Отдельный интерес для нас представляет изменение с течением времени центральности узлов. Были обнаружены статистически значимые различия в выраженности центральности узлов в различные периоды времени (Friedman chi-squared = 23.246, df = 2, p-value = 8.958e-06). Апострериорные сравнения показали, что статистически значимо отличается центральность узлов графа, описывающего данные за 1986-2019 годы (для 1958-1985: W = 57, p-value = 0.002; для 1906-1957: W = 37, p-value = 0.004).
В целом можно говорить о том, что в последней четверти ХХ – начале XXI века наблюдается рост центральности для регрессионного анализа, Chi2 критерия, анализа надежности и, особенно, моделирования структурными уравнениями. Такой результат дает нам основание предполагать, что перечисленные методы начинают играть в указанный период более важную роль в регуляции статистической практики, чем прежде.

Визуализация временных изменений паттернов совместного использования математических методов (1980-2019) и дисциплинарные различия

Морозова С.В. оценила динамику изменений в совместном использовании математических методов. В целом она свидетельствует о том, что чем ближе к современности, тем больше методов встречаются совместно в одной статье. Для того, чтобы убедиться, что эта тенденция не вызвана исключительно доступностью обработки данных с помощью персональных компьютеров и статистических программ, мы рассчитали симметричные матрицы частной корреляции Спирмена, взяв в качестве переменной исключения сумму использованных в статье методов.
Для всех периодов также был рассчитан индекс энтропии, для чего мы взяли постатейные данные о наличии методов.
Хордовые диаграммы для всех десятилетий оказались весьма похожи, а энтропия в рассматриваемые периоды сначала увеличивается, но позднее стабилизируется. Здесь стоит оговориться, что речь идет только о тех методах, которые оказались включены в анализ.
Не смотря на общую схожесть, все-же есть некоторые различия в использовании нейронных сетей. Также обращает на себя внимание факт, что фактор «Анализ различий» на хордовых диаграммах не имеет статистически значимых положительных связей с методами, которые вошли в фактор «Анализ взаимосвязей».
Количество энтропии в системе математических методов с течением времени постепенно повышалось с 1980-х по начало 2000-х годов. Далее, в 2000-е и 2010-е годы уровень энтропии оставался практически неизменным, то есть стабилизировался. Поэтому можно предположить, что этот уровень энтропии для системы математических методов является своеобразным оптимумом (при учете стабильности статистической практики).
Важно, что в период с 1980-х по 2010-е годы произошло существенное изменение статистической практики. Для психологов стали значительно более доступны сложные расчеты после массового распространения ПК и статистических программ. Однако, энтропия системы математических методов с 1980-х по 2010-е годы выросла лишь на 20%.
Можно предположить, что система математических методов в течение всего рассматриваемого времени регулировалась, чтобы поддерживать оптимум энтропии, находящийся в пределах 5-6. Источником регуляции, с учетом специфики данных, могут выступать редакционные коллегии журналов, отбирающие или отклоняющие статьи, и сами ученые, в зависимости от их соответствия текущим представлениям о «хорошей науке».
Полученные результаты позволяют сделать вывод, что в целом в каждом из рассматриваемых периодов была своя специфика совместного использования математических методов.
Попарные сравнения матриц кросскорреляций свидетельствуют о том, что каждый переход из одного десятилетия в другое сопровождался увеличением скоррелированности одних методов и снижением скоррелированности других. Этот механизм регуляции системы вполне соответствует нашим ожиданиям и имеет следующую специфику наиболее выраженных взаимосвязей:
1980-е/1990-е: Повышение между SEM и факторным анализом. Снижение между SEM и дисперсионным анализом.
1990-е/2000-е: Повышение между дисперсионным анализом и t критерием Стьюдента. Понижение между дисперсионным анализом и мета-анализом.
2000-е/2010-е: Повышение между нейронными сетями и корреляциями, мета-анализом, анализом надежности; МРА и t критерием Стьюдента. Снижение между SEM и факторным анализом; нейронными сетями и Chi2 Пирсона, байесовским анализом.
Таким образом можно говорить о том, что с 1980-х по 2010-е годы поддержание упорядоченности системы математических методов связано в первую очередь с изменением характеристик частоты использования дисперсионного анализа, SEM, нейронных сетей, мета-анализа и t критерия Стьюдента с другими методами.
Для всех рассматриваемых журналов более характерны положительные корреляции между математическими методами. Впрочем, даже в случаях, когда они статистически значимы, большая часть из этих связей слаба и не превышает rs = 0.1. Наиболее часто встречающаяся положительная корреляция средней выраженности (rs > 0.3) наблюдается между SEM и мета-анализом. Также есть случаи средней корреляции между SEM и факторным анализом, дисперсионным анализом и t критерием Стьюдента. Эта особенность данных соответствует результатам, описанным выше.
Журналы отличаются по показателю энтропии. Исходя из этого можно говорить о том, что несколько более равновероятно одновременное использование различных методов в журналах: Journal of Abnormal Psychology, Journal of Applied Psychology, Journal of Consulting and Clinical Psychology. В остальных журналах наблюдаются некоторые предпочтения статей, в которых совместно использованы определенные методы:
Journal of Comparative Psychology (дисперсионный анализ), Journal of Experimental Psychology (дисперсионный анализ, факторный анализ и SEM), Journal of Personality and Social Psychology (дисперсионный анализ, факторный анализ, SEM и t критерий Стьюдента), American Psychologist (дисперсионный анализ и SEM), Journal of Educational Psychology (SEM).
Подводя итог, мы можем говорить о том, что с 1980-х годов дисперсионный анализ, SEM, нейронные сети, мета-анализ и t критерий Стьюдента в различные периоды времени являлись «парадигмальными» математическими методами (то есть маркерами господствующих исследовательских парадигм в психологических дисциплинах). Другими словами, именно особенности их использования и сочетания с другими математическими методами отражали специфику методологических позиций исследователей. Предпочитая или отвергая статьи, в которых использованы эти методы для количественного анализа данных, журнальные редакции и авторы формировали актуальное на конкретный период времени представление о «хорошей» науке.
Очевидно, что дисперсионный анализ является «парадигмальным» для таких психологических дисциплин, как экспериментальная психология, когнитивная психология, сравнительная психология. Моделирование структурными уравнениями, напротив, может интерпретироваться как «парадигмальный» метод прикладной психологии, психологии личности, социальной психологии и т.д. Как будет показано ниже, мета-анализ можно рассматривать как один из «парадигмальных» методов в клинической психологии и психологии здоровья. Что же касается нейронных сетей, то этот метод анализа безусловно имеет все шансы стать «парадигмальным» для быстро развивающихся цифровой психологии и количественной нейронауки.
Разумеется, возникает вопрос, а чем собственно говоря «пардигмальные» методы отличаются от всех прочих? И отвечая на этот вопрос мы обратимся к специфике «прямой» и «обратной» логики исследования, характерной для разных методологических позиций. Именно различия в характеристиках методологических позиций и класс математических задач, которые решаются с помощью этих методов, с нашей точки зрения делают эти методы особенными. Ниже описана специфика «парадигмальных» методов и соответствующих им исследовательских моделей: экспериментальной, корреляционной, мета-аналитической и модели больших данных.

Генеративная модель динамики использования математических методов в журнальных статьях

И.А. Горбуновым была предложена генеративная модель динамики использования математических методов в журнальных статьях.
На графиках большинства методов наблюдаются скачки, похожие на затухающие гармонические колебания маятников. В качестве примеров можно указать графики корреляционного анализа, дисперсионного анализа, t-критерия Стьюдента, Процентных соотношений, Анализа надежности.
Возможно, за развитием статистической практики определенного метода стоят скачки затухающих колебаний, вызванные определенными событиями, такими как появление учебных и методических пособий, обучающих применению данного метода, появление компьютерных программ, позволяющих использовать данный метод с разной степенью трудоемкости, публикации об ограничениях метода и правилах статистических отчетов, наиболее успешные и цитируемые публикации, использующие данный метод.
Появление затухающих колебаний после скачка возможно связано с временным рассогласованием появления информации о популярности метода (его успешности в обработке и репрезентации результатов, влияющей на цитируемость) и качества публикуемых статей, в связи с нарастающим, или снижающимся количеством ученых, использующих данный метод.
Чаще всего первыми начинают использование метода более успешные ученые, которые повышают средний рейтинг публикаций с этим методом. За ними подключаются остальные, что несколько снижает средний рейтинг публикаций, а значит и популярность метода. Снижение популярности, ведет к плавному уменьшению количества работ, но зато работы опять становятся более качественными, так как метод используется именно там, где он действительно нужен. Вслед за этим опять повышается рейтинг, и как следствие, популярность метода. По сути мы можем интерпретировать описанный процесс в терминах периодического накопления и разрешения противоречий внутри статистической практики.
Такую публикационная активность была смоделирована в MatLab с помощью генеративной модели (вычислительной).
процедура генерирует для каждого из 100 временных отрезков некое количество публикаций, выпускаемых группой из N=10000 ученых, и усредненный рейтинг метода, и выводит эту информацию на график. Количество публикаций, выпущенных в каждый новый период, зависит от случайных и детерминированных явлений, таких как успешность каждого ученого (нормально распределенная случайная величина (μ=0, ϭ=1), текущая популярность метода (вещественное число от 0 до 1), и общий вес метода – K, который несколько снижается со временем.
Вычислив решение о публикации статьи каждым из 10000 ученых, мы считаем количество выпущенных ими публикаций. Также мы считаем рейтинги их публикаций, которые зависят от их успешности. Посчитав суммарный рейтинг публикаций в этом периоде, можно скорректировать популярность метода, которая меняется плавно (зависит от коэффициента zad, чем он больше, тем больший вес имеет предыдущая популярность, и меньший - новая). Далее популярность и количество статей собирается в массивы динамики публикационной активности.
Сглаженная динамика также иллюстрирует колебания публикационной активности после быстрого всплеска. Она тоже скоррелирована с динамикой популярности данного метода, и имеет сходство с представленными реальными данными использования различных математических методов.

Моделирование динамики использования основных математических методов в психологии с помощью скачков с затухающими колебаниями

После создания генеративной модели, И.А. Горбуновым Была проведена подгонка параметров таких скачков для динамики использования каждого из методов. Так как таких скачков могло быть несколько, подгонялись модели с одним, двумя и тремя скачками. При наблюдении за воспроизведением графиков моделью скачков можно сказать, что в основном сглаженные графики динамики статистической практики лучше описываются моделями с 3-мя скачками. Все сглаженные графики описываются моделями из трех скачков на более 90% дисперсии. Двумя скачками на 90% дисперсии можно описать все кроме Байесовского анализа, Факторного анализа, мета-анализа, анализа надежности, которые также описываются более чем на 80% дисперсии. Одним скачком описываются выше 80% дисперсии методов: дисперсионный анализ, goodness of fit (метод согласия), ShiSquare test, Регрессионный анализ, Моделирование структурными уравнениями, Т-тест Стьюдента.
Затем была проведена оценка вероятности всех полученных моделей для каждого метода с помощью Байесовский критерий информативности WAIC (Широко применимый информационный критерий). Лучшими оказались модели с 3-мя скачками для всех методов, кроме нейронных сетей, которые корректрее описываются моделью с 2-мя скачками.

Кластерный анализ типов затухающих колебаний модели трех скачков

Горбунов И.А. кластеризовал параметры именно трех скачков затухающих колебаний на метод. Таким образом, сформировалась матрица 4x38 (4 параметра – T, A, W, B на 38 скачков затухающих колебаний). Прежде чем кластеризовать данные, для исключения влияния различных масштабов измерений, мы нормализовали данные, вычислив Z-оценки по каждому параметру скачка затухающих колебаний. Последовательно увеличивая количество групп, мы добились, чтобы в фактор группы, достоверно влиял на все 4 параметра. В итоге была получена модель из 4х кластеров.
Четвертый кластер, отражает самые ранние колебания, начинающиеся в период 1920-х – 1930-х годов. Такой скачек имеет достаточно сильный коэффициент затухания, и самую медленную частоту колебаний (T=2*π/W, T≈29 лет). Предположим, этот скачек проявляется у методов, наиболее рано возникающих в статистической практике и отражающих основную волну их популярности среди психологов, и последующую, достаточно устойчивую стабилизацию с медленной периодикой, возможно связанной с обратным взаимовлиянием популярности метода, и некоторым снижением качества работ, массированно использующих этот метод. Так как эти колебания происходят в начале и середине прошлого века, они как правильно медленные, из-за низкой скорости перетекания информации о качестве работ внутри научного сообщества. На гистограмме (Рисунок 6) приведены частоты встречаемости скачков данного кластера в разных методах. Мы видим, что это в основном самые первые статистические методы, разработанные в начале прошлого века – Корреляционный анализ, Дисперсионный анализ, t-критерий Стьюдента, и Процентные соотношения.
Третий кластер относится к колебаниям, начинающимся приблизительно в 1969 году. Период их T≈24.3 года, Амплитуда не высока, а затухание достаточно слабое. Видимо данный кластер, отражает волны первого появления относительно более новых методов, и включение традиционных в обычную практику простых исследований, возможно при распространении этих методов на большее количество методических пособий. Это такие методы как: факторный анализ, Байесов анализ, подгонка кривых, χ2 критерий, анализ надежности, t-критерий, множественный регрессионный анализ, моделирование структурными уравнениями.
Второй кластер, отображает скачки отрицательной амплитуды, то есть явления, снижающие частоту использования методов, которые, возможно связаны с появлением негативной информации о методе, или новых данных, снижающих вероятность его использования, например, дополнительных ограничений метода, относительно распределения входных данных, равенства дисперсий, ковариационных матриц и т.п., появления нового программного обеспечения, представляющего трудности для освоения новых возможностей метода.
Сходство по первому проявлению и периодике со скачками из третьего кластера, позволяет предположить, что отрицательный вклад в старые методы, которые на данный момент становятся уже не популярными, возникает из-за использования более новых методов, скачки которых отражены в третьем кластере. Возможно также, что отрицательные скачки разной формы, корректируют модельную динамику гармонического затухающего колебания к реальной динамике, на самом деле несколько отличающейся от гармонических колебаний.
Среднее начало скачков второго кластера приходится на 1970 год, а период приблизительно равен 19 годам. Данный тип колебаний затухает быстрее, чем все остальные. К такому типу скачков колебаний относятся 2 скачка в Дисперсионном анализе, и по одному скачку в динамике корреляционного анализа, подгонки кривых, χ2 критерия, Процентных соотношениях, t-критерия, нейронных сетей.
Первый кластер соответствует самому позднему скачку затухающих колебаний, начинается в 1993 году и имеет самый малый период (T≈6,5 лет). Видимо он происходит в первую очередь с новыми, недавно введенными в употребление, методами и имеет высокую частоту за счет быстрого обмена информации, в научном сообществе и большого количества внешних факторов, таких как модификация программного обеспечения, публикация новых пособий, содержащих новые возможности методов, появление новых данных об успешности, или неуспешности применения метода в разных областях. Как видно в первый кластер входят в основном скачки затухающих колебаний использования новых методов: Мета-анализ, Байесов анализ, Множественный регрессионный анализ, Моделирование структурными уравнениями, Нейронные сети, Анализ надежности. Также в этот кластер вошел один скачек χ2 критерия, который возможно связан с использованием этого критерия при проверке моделей в моделировании структурными уравнениями.

Содержательная интерпретация скачков моделей затухающих колебаний

Морозова С.В. интерпретировала содержательно результаты кластерного анализа типов затухающих колебаний.
Во всех случаях первый скачек мы интерпретировали как скачек, источником запуска которого являлось время начала публикации статей, в которых могли встречаться случаи использования метода. Это было возможно благодаря тому, что время начала первого скачка для методов часто совпадает с началом их использования в психологических исследованиях (если обратиться к сырым данным).
Второй тип скачков с нашей точки зрения подразумевал включение метода в учебные пособия в качестве основного или дополнительного.
Скачки третьего типа имеют отрицательную амплитуду. Мы интерпретировали их как скачки, вызванные изменением технической стороны статистической практики. Отрицательная амплитуда говорит о том, что эти скачки снижают вероятность использования математических методов.
К последнему типу скачков, вызванных регламентацией содержания статистических отчетов, мы отнесли скачек 1995-го года кривой вероятности использования мета-анализа.
Обоснование корректности содержательной интерпретации скачков полностью описаны в 5 главе рукописи монографии (см. приложение).

Прогноз динамики использования математических методов (2020-2040)

Были сгенерированы графики модельных данных для "парадигмальных" методов и байесовскго анализа.
Модельные данные позволяют говорить о том, что частота использования дисперсионного анализа после 2020 года может войти в состояние стабильности. Ситуация с t критерием Стьюдента менее однозначна, но динамика изменений имеет значительно меньшую частоту колебаний, чем у других методов. Следовательно, практика его использования также носит более предсказуемый характер, чем у более новых методов. Хотя в последние годы участились случаи использования t критерия Стьюдента для сравнения качества разных моделей, например, множественного регрессионного анализа и нейросетевой модели.
Иная картина наблюдается у кривых, прогнозирующих вероятность использования в психологических исследованиях моделирования структурными уравнениями, нейронных сетей и мета-анализа. Для этих методов характерна высокая частота колебаний. При этом кривые каждого из рассматриваемых методов имеют свои особенности.
Для кривой мета-анализа на графике мы наблюдаем начало процесса затухания колебаний. Это позволяет прогнозировать возможный переход практики использования мета-анализа в состояние стабильности. Характер кривой моделирования структурными уравнениями позволяет уверенно говорить о дальнейшем плавном росте популярности метода с течением времени. Ситуация с нейронными сетями, напротив, противоречива – мы видим стабильную, но не затухающую динамику, которая свидетельствует о том, что, вероятнее всего, периодически в журнальных статьях будут появляться статьи, в которых описаны результаты нейросетевого моделирования.
Важно отметить, что описанные прогнозы основаны на уже имеющейся и включенной в модели информации и не учитывают возможные технические изменения в статистической практике, которые потенциально могут нарушить текущее состояние системы математических методов. Если такие существенные изменения произойдут, мы можем ожидать изменения характера колебаний вероятностных кривых, вызванных появлением очередных скачков.
В частности, можно ожидать четвертый скачек для кривой мета-анализа, так как в последние годы вышло много книг по использованию R для мета-аналитических расчетов. Особенно интересны варианты байесовского мета-анализа и мета-аналитического подхода к моделированию структурными уравнениями. (Harrer M. et al, 2021) В случае дальнейшего распространения практики репликаций исследований этот метод в итоге может стать актуальным для всех психологических дисциплин.
Аналогичным образом, если говорить о будущем нейронных сетей, то вероятности использования этого метода, как уже говорилось выше, прекрасно описывается моделью с двумя скачками. При этом в последнее время мы можем видеть массу литературы по нейросетевому моделированию в Python или Matlab. Это позволяет нам сделать вывод о том, что в ближайшее время может произойти третий скачек, связанный с техническим прогрессом.
В обоих случаях мы можем ожидать сначала временное падение, а затем, после включения методов в учебные пособия для психологов, рост популярности мета-анализа и нейронных сетей в различных психологических дисциплинах, а не только в клинической психологии, психологии здоровья и вычислительной нейронауке.
С нашей точки зрения будущее нейронных сетей в психологии во многом зависит от развития цифровой психологии и развития практики анализа больших данных. Нейронные сети, безусловно, могут оказаться полезным инструментом для решения задач улучшения качества данных, построения моделей классификации и предсказаний, анализа семантических характеристик вербальной, визуальной и аудиоинформации и пр. (Woo S.E. et al., 2020; Kruschke J.K., 2021)

основные результаты по этапу (подробно)

Визуализация временных изменений паттернов совместного использования математических методов (1980-2019) и дисциплинарные различия

Морозова С.В. оценила динамику изменений в совместном использовании математических методов. В целом она свидетельствует о том, что чем ближе к современности, тем больше методов встречаются совместно в одной статье. Для того, чтобы убедиться, что эта тенденция не вызвана исключительно доступностью обработки данных с помощью персональных компьютеров и статистических программ, мы рассчитали симметричные матрицы частной корреляции Спирмена, взяв в качестве переменной исключения сумму использованных в статье методов.
Для всех периодов также был рассчитан индекс энтропии, для чего мы взяли постатейные данные о наличии методов.
Хордовые диаграммы для всех десятилетий оказались весьма похожи, а энтропия в рассматриваемые периоды сначала увеличивается, но позднее стабилизируется. Здесь стоит оговориться, что речь идет только о тех методах, которые оказались включены в анализ.
Не смотря на общую схожесть, все-же есть некоторые различия в использовании нейронных сетей. Также обращает на себя внимание факт, что фактор «Анализ различий» на хордовых диаграммах не имеет статистически значимых положительных связей с методами, которые вошли в фактор «Анализ взаимосвязей».
Количество энтропии в системе математических методов с течением времени постепенно повышалось с 1980-х по начало 2000-х годов. Далее, в 2000-е и 2010-е годы уровень энтропии оставался практически неизменным, то есть стабилизировался. Поэтому можно предположить, что этот уровень энтропии для системы математических методов является своеобразным оптимумом (при учете стабильности статистической практики).
Важно, что в период с 1980-х по 2010-е годы произошло существенное изменение статистической практики. Для психологов стали значительно более доступны сложные расчеты после массового распространения ПК и статистических программ. Однако, энтропия системы математических методов с 1980-х по 2010-е годы выросла лишь на 20%.
Можно предположить, что система математических методов в течение всего рассматриваемого времени регулировалась, чтобы поддерживать оптимум энтропии, находящийся в пределах 5-6. Источником регуляции, с учетом специфики данных, могут выступать редакционные коллегии журналов, отбирающие или отклоняющие статьи, и сами ученые, в зависимости от их соответствия текущим представлениям о «хорошей науке».
Полученные результаты позволяют сделать вывод, что в целом в каждом из рассматриваемых периодов была своя специфика совместного использования математических методов.
Попарные сравнения матриц кросскорреляций свидетельствуют о том, что каждый переход из одного десятилетия в другое сопровождался увеличением скоррелированности одних методов и снижением скоррелированности других. Этот механизм регуляции системы вполне соответствует нашим ожиданиям и имеет следующую специфику наиболее выраженных взаимосвязей:
1980-е/1990-е: Повышение между SEM и факторным анализом. Снижение между SEM и дисперсионным анализом.
1990-е/2000-е: Повышение между дисперсионным анализом и t критерием Стьюдента. Понижение между дисперсионным анализом и мета-анализом.
2000-е/2010-е: Повышение между нейронными сетями и корреляциями, мета-анализом, анализом надежности; МРА и t критерием Стьюдента. Снижение между SEM и факторным анализом; нейронными сетями и Chi2 Пирсона, байесовским анализом.
Таким образом можно говорить о том, что с 1980-х по 2010-е годы поддержание упорядоченности системы математических методов связано в первую очередь с изменением характеристик частоты использования дисперсионного анализа, SEM, нейронных сетей, мета-анализа и t критерия Стьюдента с другими методами.
Для всех рассматриваемых журналов более характерны положительные корреляции между математическими методами. Впрочем, даже в случаях, когда они статистически значимы, большая часть из этих связей слаба и не превышает rs = 0.1. Наиболее часто встречающаяся положительная корреляция средней выраженности (rs > 0.3) наблюдается между SEM и мета-анализом. Также есть случаи средней корреляции между SEM и факторным анализом, дисперсионным анализом и t критерием Стьюдента. Эта особенность данных соответствует результатам, описанным выше.
Журналы отличаются по показателю энтропии. Исходя из этого можно говорить о том, что несколько более равновероятно одновременное использование различных методов в журналах: Journal of Abnormal Psychology, Journal of Applied Psychology, Journal of Consulting and Clinical Psychology. В остальных журналах наблюдаются некоторые предпочтения статей, в которых совместно использованы определенные методы:
Journal of Comparative Psychology (дисперсионный анализ), Journal of Experimental Psychology (дисперсионный анализ, факторный анализ и SEM), Journal of Personality and Social Psychology (дисперсионный анализ, факторный анализ, SEM и t критерий Стьюдента), American Psychologist (дисперсионный анализ и SEM), Journal of Educational Psychology (SEM).
Подводя итог, мы можем говорить о том, что с 1980-х годов дисперсионный анализ, SEM, нейронные сети, мета-анализ и t критерий Стьюдента в различные периоды времени являлись «парадигмальными» математическими методами (то есть маркерами господствующих исследовательских парадигм в психологических дисциплинах). Другими словами, именно особенности их использования и сочетания с другими математическими методами отражали специфику методологических позиций исследователей. Предпочитая или отвергая статьи, в которых использованы эти методы для количественного анализа данных, журнальные редакции и авторы формировали актуальное на конкретный период времени представление о «хорошей» науке.
Очевидно, что дисперсионный анализ является «парадигмальным» для таких психологических дисциплин, как экспериментальная психология, когнитивная психология, сравнительная психология. Моделирование структурными уравнениями, напротив, может интерпретироваться как «парадигмальный» метод прикладной психологии, психологии личности, социальной психологии и т.д. Как будет показано ниже, мета-анализ можно рассматривать как один из «парадигмальных» методов в клинической психологии и психологии здоровья. Что же касается нейронных сетей, то этот метод анализа безусловно имеет все шансы стать «парадигмальным» для быстро развивающихся цифровой психологии и количественной нейронауки.
Разумеется, возникает вопрос, а чем собственно говоря «пардигмальные» методы отличаются от всех прочих? И отвечая на этот вопрос мы обратимся к специфике «прямой» и «обратной» логики исследования, характерной для разных методологических позиций. Именно различия в характеристиках методологических позиций и класс математических задач, которые решаются с помощью этих методов, с нашей точки зрения делают эти методы особенными. Ниже описана специфика «парадигмальных» методов и соответствующих им исследовательских моделей: экспериментальной, корреляционной, мета-аналитической и модели больших данных.

Генеративная модель динамики использования математических методов в журнальных статьях

И.А. Горбуновым была предложена генеративная модель динамики использования математических методов в журнальных статьях.
На графиках большинства методов наблюдаются скачки, похожие на затухающие гармонические колебания маятников. В качестве примеров можно указать графики корреляционного анализа, дисперсионного анализа, t-критерия Стьюдента, Процентных соотношений, Анализа надежности.
Возможно, за развитием статистической практики определенного метода стоят скачки затухающих колебаний, вызванные определенными событиями, такими как появление учебных и методических пособий, обучающих применению данного метода, появление компьютерных программ, позволяющих использовать данный метод с разной степенью трудоемкости, публикации об ограничениях метода и правилах статистических отчетов, наиболее успешные и цитируемые публикации, использующие данный метод.
Появление затухающих колебаний после скачка возможно связано с временным рассогласованием появления информации о популярности метода (его успешности в обработке и репрезентации результатов, влияющей на цитируемость) и качества публикуемых статей, в связи с нарастающим, или снижающимся количеством ученых, использующих данный метод.
Чаще всего первыми начинают использование метода более успешные ученые, которые повышают средний рейтинг публикаций с этим методом. За ними подключаются остальные, что несколько снижает средний рейтинг публикаций, а значит и популярность метода. Снижение популярности, ведет к плавному уменьшению количества работ, но зато работы опять становятся более качественными, так как метод используется именно там, где он действительно нужен. Вслед за этим опять повышается рейтинг, и как следствие, популярность метода. По сути мы можем интерпретировать описанный процесс в терминах периодического накопления и разрешения противоречий внутри статистической практики.
Такую публикационная активность была смоделирована в MatLab с помощью генеративной модели (вычислительной).
процедура генерирует для каждого из 100 временных отрезков некое количество публикаций, выпускаемых группой из N=10000 ученых, и усредненный рейтинг метода, и выводит эту информацию на график. Количество публикаций, выпущенных в каждый новый период, зависит от случайных и детерминированных явлений, таких как успешность каждого ученого (нормально распределенная случайная величина (μ=0, ϭ=1), текущая популярность метода (вещественное число от 0 до 1), и общий вес метода – K, который несколько снижается со временем.
Вычислив решение о публикации статьи каждым из 10000 ученых, мы считаем количество выпущенных ими публикаций. Также мы считаем рейтинги их публикаций, которые зависят от их успешности. Посчитав суммарный рейтинг публикаций в этом периоде, можно скорректировать популярность метода, которая меняется плавно (зависит от коэффициента zad, чем он больше, тем больший вес имеет предыдущая популярность, и меньший - новая). Далее популярность и количество статей собирается в массивы динамики публикационной активности.
Сглаженная динамика также иллюстрирует колебания публикационной активности после быстрого всплеска. Она тоже скоррелирована с динамикой популярности данного метода, и имеет сходство с представленными реальными данными использования различных математических методов.

Моделирование динамики использования основных математических методов в психологии с помощью скачков с затухающими колебаниями

После создания генеративной модели, И.А. Горбуновым Была проведена подгонка параметров таких скачков для динамики использования каждого из методов. Так как таких скачков могло быть несколько, подгонялись модели с одним, двумя и тремя скачками. При наблюдении за воспроизведением графиков моделью скачков можно сказать, что в основном сглаженные графики динамики статистической практики лучше описываются моделями с 3-мя скачками. Все сглаженные графики описываются моделями из трех скачков на более 90% дисперсии. Двумя скачками на 90% дисперсии можно описать все кроме Байесовского анализа, Факторного анализа, мета-анализа, анализа надежности, которые также описываются более чем на 80% дисперсии. Одним скачком описываются выше 80% дисперсии методов: дисперсионный анализ, goodness of fit (метод согласия), ShiSquare test, Регрессионный анализ, Моделирование структурными уравнениями, Т-тест Стьюдента.
Затем была проведена оценка вероятности всех полученных моделей для каждого метода с помощью Байесовский критерий информативности WAIC (Широко применимый информационный критерий). Лучшими оказались модели с 3-мя скачками для всех методов, кроме нейронных сетей, которые корректрее описываются моделью с 2-мя скачками.

Кластерный анализ типов затухающих колебаний модели трех скачков

Горбунов И.А. кластеризовал параметры именно трех скачков затухающих колебаний на метод. Таким образом, сформировалась матрица 4x38 (4 параметра – T, A, W, B на 38 скачков затухающих колебаний). Прежде чем кластеризовать данные, для исключения влияния различных масштабов измерений, мы нормализовали данные, вычислив Z-оценки по каждому параметру скачка затухающих колебаний. Последовательно увеличивая количество групп, мы добились, чтобы в фактор группы, достоверно влиял на все 4 параметра. В итоге была получена модель из 4х кластеров.
Четвертый кластер, отражает самые ранние колебания, начинающиеся в период 1920-х – 1930-х годов. Такой скачек имеет достаточно сильный коэффициент затухания, и самую медленную частоту колебаний (T=2*π/W, T≈29 лет). Предположим, этот скачек проявляется у методов, наиболее рано возникающих в статистической практике и отражающих основную волну их популярности среди психологов, и последующую, достаточно устойчивую стабилизацию с медленной периодикой, возможно связанной с обратным взаимовлиянием популярности метода, и некоторым снижением качества работ, массированно использующих этот метод. Так как эти колебания происходят в начале и середине прошлого века, они как правильно медленные, из-за низкой скорости перетекания информации о качестве работ внутри научного сообщества. На гистограмме (Рисунок 6) приведены частоты встречаемости скачков данного кластера в разных методах. Мы видим, что это в основном самые первые статистические методы, разработанные в начале прошлого века – Корреляционный анализ, Дисперсионный анализ, t-критерий Стьюдента, и Процентные соотношения.
Третий кластер относится к колебаниям, начинающимся приблизительно в 1969 году. Период их T≈24.3 года, Амплитуда не высока, а затухание достаточно слабое. Видимо данный кластер, отражает волны первого появления относительно более новых методов, и включение традиционных в обычную практику простых исследований, возможно при распространении этих методов на большее количество методических пособий. Это такие методы как: факторный анализ, Байесов анализ, подгонка кривых, χ2 критерий, анализ надежности, t-критерий, множественный регрессионный анализ, моделирование структурными уравнениями.
Второй кластер, отображает скачки отрицательной амплитуды, то есть явления, снижающие частоту использования методов, которые, возможно связаны с появлением негативной информации о методе, или новых данных, снижающих вероятность его использования, например, дополнительных ограничений метода, относительно распределения входных данных, равенства дисперсий, ковариационных матриц и т.п., появления нового программного обеспечения, представляющего трудности для освоения новых возможностей метода.
Сходство по первому проявлению и периодике со скачками из третьего кластера, позволяет предположить, что отрицательный вклад в старые методы, которые на данный момент становятся уже не популярными, возникает из-за использования более новых методов, скачки которых отражены в третьем кластере. Возможно также, что отрицательные скачки разной формы, корректируют модельную динамику гармонического затухающего колебания к реальной динамике, на самом деле несколько отличающейся от гармонических колебаний.
Среднее начало скачков второго кластера приходится на 1970 год, а период приблизительно равен 19 годам. Данный тип колебаний затухает быстрее, чем все остальные. К такому типу скачков колебаний относятся 2 скачка в Дисперсионном анализе, и по одному скачку в динамике корреляционного анализа, подгонки кривых, χ2 критерия, Процентных соотношениях, t-критерия, нейронных сетей.
Первый кластер соответствует самому позднему скачку затухающих колебаний, начинается в 1993 году и имеет самый малый период (T≈6,5 лет). Видимо он происходит в первую очередь с новыми, недавно введенными в употребление, методами и имеет высокую частоту за счет быстрого обмена информации, в научном сообществе и большого количества внешних факторов, таких как модификация программного обеспечения, публикация новых пособий, содержащих новые возможности методов, появление новых данных об успешности, или неуспешности применения метода в разных областях. Как видно в первый кластер входят в основном скачки затухающих колебаний использования новых методов: Мета-анализ, Байесов анализ, Множественный регрессионный анализ, Моделирование структурными уравнениями, Нейронные сети, Анализ надежности. Также в этот кластер вошел один скачек χ2 критерия, который возможно связан с использованием этого критерия при проверке моделей в моделировании структурными уравнениями.

Содержательная интерпретация скачков моделей затухающих колебаний

Морозова С.В. интерпретировала содержательно результаты кластерного анализа типов затухающих колебаний.
Во всех случаях первый скачек мы интерпретировали как скачек, источником запуска которого являлось время начала публикации статей, в которых могли встречаться случаи использования метода. Это было возможно благодаря тому, что время начала первого скачка для методов часто совпадает с началом их использования в психологических исследованиях (если обратиться к сырым данным).
Второй тип скачков с нашей точки зрения подразумевал включение метода в учебные пособия в качестве основного или дополнительного.
Скачки третьего типа имеют отрицательную амплитуду. Мы интерпретировали их как скачки, вызванные изменением технической стороны статистической практики. Отрицательная амплитуда говорит о том, что эти скачки снижают вероятность использования математических методов.
К последнему типу скачков, вызванных регламентацией содержания статистических отчетов, мы отнесли скачек 1995-го года кривой вероятности использования мета-анализа.
Обоснование корректности содержательной интерпретации скачков полностью описаны в 5 главе рукописи монографии (см. приложение).

Прогноз динамики использования математических методов (2020-2040)

Были сгенерированы графики модельных данных для "парадигмальных" методов и байесовскго анализа.
Модельные данные позволяют говорить о том, что частота использования дисперсионного анализа после 2020 года может войти в состояние стабильности. Ситуация с t критерием Стьюдента менее однозначна, но динамика изменений имеет значительно меньшую частоту колебаний, чем у других методов. Следовательно, практика его использования также носит более предсказуемый характер, чем у более новых методов. Хотя в последние годы участились случаи использования t критерия Стьюдента для сравнения качества разных моделей, например, множественного регрессионного анализа и нейросетевой модели.
Иная картина наблюдается у кривых, прогнозирующих вероятность использования в психологических исследованиях моделирования структурными уравнениями, нейронных сетей и мета-анализа. Для этих методов характерна высокая частота колебаний. При этом кривые каждого из рассматриваемых методов имеют свои особенности.
Для кривой мета-анализа на графике мы наблюдаем начало процесса затухания колебаний. Это позволяет прогнозировать возможный переход практики использования мета-анализа в состояние стабильности. Характер кривой моделирования структурными уравнениями позволяет уверенно говорить о дальнейшем плавном росте популярности метода с течением времени. Ситуация с нейронными сетями, напротив, противоречива – мы видим стабильную, но не затухающую динамику, которая свидетельствует о том, что, вероятнее всего, периодически в журнальных статьях будут появляться статьи, в которых описаны результаты нейросетевого моделирования.
Важно отметить, что описанные прогнозы основаны на уже имеющейся и включенной в модели информации и не учитывают возможные технические изменения в статистической практике, которые потенциально могут нарушить текущее состояние системы математических методов. Если такие существенные изменения произойдут, мы можем ожидать изменения характера колебаний вероятностных кривых, вызванных появлением очередных скачков.
В частности, можно ожидать четвертый скачек для кривой мета-анализа, так как в последние годы вышло много книг по использованию R для мета-аналитических расчетов. Особенно интересны варианты байесовского мета-анализа и мета-аналитического подхода к моделированию структурными уравнениями. (Harrer M. et al, 2021) В случае дальнейшего распространения практики репликаций исследований этот метод в итоге может стать актуальным для всех психологических дисциплин.
Аналогичным образом, если говорить о будущем нейронных сетей, то вероятности использования этого метода, как уже говорилось выше, прекрасно описывается моделью с двумя скачками. При этом в последнее время мы можем видеть массу литературы по нейросетевому моделированию в Python или Matlab. Это позволяет нам сделать вывод о том, что в ближайшее время может произойти третий скачек, связанный с техническим прогрессом.
В обоих случаях мы можем ожидать сначала временное падение, а затем, после включения методов в учебные пособия для психологов, рост популярности мета-анализа и нейронных сетей в различных психологических дисциплинах, а не только в клинической психологии, психологии здоровья и вычислительной нейронауке.
С нашей точки зрения будущее нейронных сетей в психологии во многом зависит от развития цифровой психологии и развития практики анализа больших данных. Нейронные сети, безусловно, могут оказаться полезным инструментом для решения задач улучшения качества данных, построения моделей классификации и предсказаний, анализа семантических характеристик вербальной, визуальной и аудиоинформации и пр. (Woo S.E. et al., 2020; Kruschke J.K., 2021)

основные результаты по этапу (кратко)

В результате вычисления моделей скачков затухающих колебаний была описана динамика использования математических методов. Для каждого метода были вычислены 1, 2 и 3-скачковые модели. С помощью байесовский критерий информативности WAIC для каждого математического метода была найдена лучшая модель. Затем с помощью этих моделей были сгенерированы данные прогноза статистической практики до 2040 года. Интерпретация результатов позволила описать основные характеристики современной статистической практики и пути дальнейшего развития количественного подхода в психологии.

описание вклада в работу каждого из участников (учётная форма ЦИТиС)

Морозова С.В. - 50%
Горбунов И.А. - 50%

передача полной копии отчёта третьим лицам для некоммерческого использования: разрешается/не разрешается (учётная форма ЦИТиС)

не разрешается

проверка отчёта на неправомерные заимствования во внешних источниках: разрешается/не разрешается (учётная форма ЦИТиС)

разрешается

обоснование междисциплинарного подхода

Обусловлено спецификой целей и задач исследования.

обоснование межотраслевого подхода

Обусловлено спецификой целей и задач исследования.
Краткое названиеИмплицитные аспекты
АкронимRFBR_a_2019 - 3
СтатусЗавершено
Эффективные даты начала/конца24/03/2128/12/21

    Области исследований

  • математические методы, методология психологии, PsycARTICLES, Американская психологическая ассоциация

ID: 75371610