Журнал "Вопросы философии" - Байесовский разум: новая перспектива в когнитивной науке

В статье обсуждается новая амбициозная программа в современных когнитивных исследованиях, характеризующая перцептивные механизмы разума как вероятностную статистическую машину, пытающуюся минимизировать расхождения между своими предсказаниями положения дел в среде и идущими из мира сигналами. Автор утверждает, что данная программа предоставляет наиболее систематический способ дополнить экологическую стратегию в исследованиях восприятия и познания, развитую в работах Дж.Дж. Гибсона и приверженцев современного энактивизма.

КЛЮЧЕВЫЕ СЛОВА: байесовский разум, внимание, восприятие, действие, ожидания, предсказывающая обработка, прямая модель.

СУЩИН Михаил Александрович – кандидат философских наук, старший научный сотрудник Института научной информации по общественным наукам Российской академии наук, старший научный сотрудник кафедры философии и социологии Юго-Западного государственного университета.

sushchin@bk.ru

Цитирование: Сущин М.А. Байесовский разум: новая перспектива в когнитивной науке // Вопросы философии. 2017. № 3.

Voprosy Filosofii. 2017. Vol. 3.

The Bayesian Mind: A New Theory in Cognitive Investigations

Mikhail A. Sushchin

This article discusses a new intriguing possibility in contemporary cognitive investigations which proposes that the perceptual machinery of the mind is a probabilistic knowledge-driven inference machine that tries to reduce discrepancies between its predictions and actual sensory signals. Though lacking sufficient empirical evidence for its full justification, Bayesian modeling is still the most systematic way to approach old significant problems of cognitive science and, as I will argue, it is necessary to complement an ecological and actionist perspective elaborated by J.J. Gibson and modern enactivists.

KEY WORDS: action, attention, Bayesian brain, forward model, perception, predictive processing, prior expectations.

SUSHCHIN Mikhail A. – CSc in Philosophy, Senior Research Fellow of the Institute of Scientific Information on Social Sciences of the Russian Academy of Sciences, Senior Research Fellow of Department of Philosophy and Sociology of Southwest State University.

sushchin@bk.ru

Received at October, 10 2016.

Citation: Sushchin, Mikhail A. (2017) “The Bayesian Mind: A New Theory in Cognitive Investigations”, Voprosy Filosofii, Vol. 3 (2017).

Новая масштабная и перспективная теория стремительно обретает популярность в современных исследованиях познания и мозга. Известная преимущественно как «Предсказывающая обработка/Предсказывающее кодирование» (англ. Predictive processing/Predictive coding) [Clark 2013^a] или же «подход минимизации ошибки в предсказании» [Hohwy 2013, 49, 65, 147], данная теория, по утверждению одного из авторов, претендует на звание «наиболее полной к настоящему моменту концептуальной рамки для объяснения восприятия, познания и действия в терминах фундаментальных теоретических принципов и нейрокогнитивных архитектур» [Seth 2015]. Кроме того, в последнее время на основе ее ключевых принципов были предложены попытки объяснения (по крайней мере, частичного) столь разнообразных когнитивных, психофизических и ментальных феноменов, как внимание [Hohwy 2013, 191–206], иллюзии, психические расстройства [Fletcher, Frith 2009], опыт, сознание, Я [Hohwy 2013] и эмоции.

Важной посылкой, разделяемой большинством исследователей в этой области, является то, что перцептивные процессы оперируют в условиях существенной неопределенности, имеющей своим источником неопределенность воспринимаемых стимулов и/или шум/случайные ошибки в процессе нейронной обработки сигналов, результаты которого, с этой точки зрения, и стремится нивелировать перцептивная система. Поэтому восприятие, рассмотренное с позиции реализующих его субличностных процессов и механизмов, согласно сторонникам байесовской программы, является, в сущности, не чем иным, как вероятностным выводом.

Данная идея имеет долгую и богатую историю. Так, еще арабский ученый-энциклопедист XI в. Ибн аль-Хайсам (Альхазен) придерживался точки зрения, что «многие видимые свойства воспринимаются посредством суждения и вывода» [Hohwy 2013, 5]. Кант, постулировавший априорные структуры (априорные формы пространства и времени и априорные категории рассудка) для оформления предоставляемого чувственностью материала, также иногда рассматривается в качестве одного из предтеч данного направления. С другой стороны, основоположниками математической теории вероятностей Т. Байесом и П.С. Лапласом было введено строгое формальное правило для интерпретации новых данных с учетом уже имеющегося знания – так называемое правило Байеса (или теорема Байеса)[i], активно используемое ныне в качестве модели работы процессов восприятия и познания.

И все же ключевая роль в развитии этого направления отводится знаменитому немецкому врачу, физику и физиологу Герману фон Гельмгольцу. Именно Гельмгольц впервые в ясном виде сформулировал представление о восприятии как об (индуктивных) умозаключениях, производимых нервной системой без участия сознания. «Психические активности, – указывал он, – которые ведут нас к заключению, что перед нами в определенном месте существует определенный объект определенного характера являются в общем не сознательными активностями, а бессознательными. По эффектам они аналогичны умозаключениям (курсив автора. – М.С.) в той мере, что наблюдаемое действие на наши чувства позволяет нам формировать идею возможной причины этого действия; хотя на самом деле просто неизменно нервные стимуляции воспринимаются прямо, т.е. действия, но никогда не сами внешние объекты» [Helmholtz 1962, 4].

Помимо этого, Гельмгольц по аналогии со значением экспериментов в науке в весьма современном ключе подчеркивал роль и необходимость действий и двигательной активности, которые, как он указывал, играют неоценимую роль в усилении корректности суждений о причинах наших восприятий. В XX в. заложенная Гельмгольцем конструктивистская традиция в исследованиях восприятия была продолжена в работах таких известных исследователей, как Р. Грегори [Gregory 1980; Gregory 1997], И. Рок [Rock 1983], У. Найссер [Neisser 2014], Дж. Брунер [Брунер 1977], Г. Канизза [Kanizsa 1985] и др.

Другая важная составляющая центрального постулата предсказывающего кодирования, идея минимизации (или коррекции) ошибки в предсказании (англ. prediction error), как указывает философ Энди Кларк [Clark 2013^a, 182–183], была концептуально навеяна разработанными в 1950-х гг. инженерами Лаборатории Белла техниками сжатия данных в процессе передачи и обработки сигналов. Например, для передачи большого объема данных (предположим, большого изображения) было предложено использовать кодирование только тех его частей (тех самых «ошибок в предсказании»), которые отличаются от типичных и не ожидаются получателем. Все остальное должно быть успешно предсказано и декодировано надлежащим образом информированным получателем, позволяя достичь существенной экономии ресурсов каналов связи (наследники данной стратегии, отмечает Кларк, в настоящее время используют её в JPEG и других методах сжатия данных).

Коротко говоря, в начале 1990-х гг. исследователи из университетов США и Великобритании, работавшие на стыке математики и психологии, опираясь на байесовскую теорию принятия решений и методы математической статистики, начали разрабатывать детальные модели восприятия, перцептивных процессов и сенсорно-моторного контроля [Rescorla 2015]. Постепенно, аккумулируя на этом фундаменте идеи и принципы многих областей и дисциплин (включая кибернетику, теорию информации, генеративные подходы в машинном обучении и теории искусственных нейронных сетей), приверженцы возникшей программы, как уже говорилось в самом начале, стали в той или иной степени применять байесовские конструкты для объяснения широкого круга когнитивных и психофизических феноменов и процессов.

В настоящей статье мы планируем рассмотреть основные принципы байесовской программы в когнитивных исследованиях, преимущественные области ее приложения, перспективы развития, наиболее острые проблемы, а также отношение к некоторым другим известным традициям в когнитивной науке. В частности, особый интерес представляет отношение возникшего поля исследований к традиции, восходящей к работам Дж.Дж. Гибсона, а в современной литературе представленной исследованиями сторонников так называемого «ситуативного/воплощенного познания» [Сущин 2014] и «энактивизма» [O’Regan, Noe 2001]. При всей революционности исследований Гибсона [Лекторский 2009, 31] его подход часто обоснованно критиковался за парадоксальное отсутствие внимания к роли «внутренних» психофизиологических факторов в восприятии и познании. Байесовская теория восприятия на текущий момент занимает наиболее видные позиции среди теорий, пытающихся отдать должное этим факторам.

Основные принципы: функциональная инверсия прямой и обратной сенсорной связи

Начнем с наиважнейшей части байесовской программы в исследованиях познания, посвященной анализу проблемы восприятия (прежде всего, конечно же, внешнего мира, или экстероцепции). В основании данного направления исследований лежит совокупность теоретических принципов, радикальным образом отличающих его от другой известной традиции в изучении восприятия, получившей распространение в нейронауке, когнитивной психологии и исследованиях компьютерного зрения в 1960–1980-х гг. К сторонникам этого лагеря относят прежде всего Нобелевских лауреатов Д. Хьюбеля и Т. Визеля, а также известных ученых в области исследований нейронауки и машинного зрения Д. Марра [Марр 1987] и И. Бидермана [Biederman 1987]). Традиционная модель восприятия, взятая в несколько упрощенном виде, представляет его как восходящий последовательный процесс аккумуляции и объединения свойств и элементов зрительных сцен (базовых примитивов изображений таких, как линии, границы, распределение яркости, группирующихся и организующихся в формы и отношения по мере распространения сигнала вверх по нейровычислительной иерархии от начальных сенсорных «станций» вроде сетчатки и таламуса к высшим отделам коры головного мозга). «На определенном этапе эти сложные формы и отношения активируют массивы хранящегося знания, превращая поток ощущений в раскрывающие мир восприятия: видение кофе, пара и чашки, с паром, ассоциируемым с кофе, красным цветом, связываемым с чашкой и т.д. Назовем эту модель перцептивных процессов «пассивной аккумуляцией», – пишет известный философ и когнитивист Э. Кларк [Clark 2013^b].

Совершенно иначе представляет весь процесс предсказывающая нисходящая модель восприятия, основные принципы которой были изложены в классических работах знаменитого математика Дэвида Мамфорда [Mumford 1992; Lee, Mumford 2003], работе нейроученых Р. Рао и Д. Баллард [Rao, Ballard 1999] (а также работах некоторых других авторов [Kawato, Hayakawa, Inui 1993]). C этой (возможно, контринтуитивной) точки зрения многоуровневая иерархия перцептивных механизмов разума/мозга еще до столкновения с начальным потоком входящей сенсорной информации располагала определенными сенсорными ожиданиями (или, как их также часто называют, априорными ожиданиями) относительно того, с чем может иметь дело непосредственно сенсорный вход.

Например, согласно модели Д. Мамфорда для связанных между собой отделов (регионов) коры головного мозга иерархически более высокоуровневый регион A будет генерировать предсказания (в терминологии Мамфорда «шаблоны») относительно того, с какого рода сенсорной информацией будет иметь дело более низкоуровневый регион B (например, лицо, дом, кот, дорожный знак и т.п.). Высокоуровневый регион сообщает свое «видение» сенсорного входа нижестоящему слою, где оно переводится в «понятную» ему форму и сопоставляется непосредственно с поступившей от органов чувств текущей сенсорной информацией. И либо предсказание региона A с учетом определенного уровня шума является исчерпывающим, и вся система в целом почти совершенно предсказывает сенсорный вход, либо нижестоящий регион B будет вынужден вычислить «…остаток, описание той части мира, которая не ожидалась или предсказывалась (т.е. ту самую пресловутую ошибку в предсказании. – М.С.)» [Mumford 1992, 247]. Этот «остаток» (или ошибка в предсказании) затем отправляется наверх для внесения соответствующих корректив в гибкие шаблоны высокоуровневого региона с целью порождения более точных предсказаний воспринимаемых объектов. В случае же, если мы удивлены чем-либо и не имеем соответствующих предшествующих перцептивных ожиданий и гипотез, указывает Мамфорд, «…алгоритм стартует с чистого листа в зоне A. Затем B просто отправляет A всю свою картину мира, которая возбуждает некоторые возможные высокоуровневые объекты. На каждом этапе A выписывает на доске свои лучшие догадки на собственном языке (объекты и их параметры) о характере высокоуровневых объектов, найденных в картине B» [Ibid.].

Поразительной особенностью предложенной Мамфордом когнитивной архитектуры, сообщившей импульс для последующих аналогичных теоретических разработок, является фактическая инверсия функциональных ролей систем прямой и обратной сенсорной связи в мозге. Это означает, как свидетельствуют развившие эту тему адепты предсказывающей обработки, что восприятие в содержательном плане почти всецело определяется потоком нисходящих предсказывающих сигналов. Они пошагово спускаются по «ступеням» перцептивной нейровычислительной иерархии (где каждый вышестоящий уровень пытается предсказать активность ближайшего ему нижнего уровня) и блокирующих любую восходящую информационную активность, кроме той, которая содержит неучтенные нисходящими предсказаниями аспекты среды (ошибки в предсказании). Стало быть, именно инициируемая разумом/мозгом нисходящая вычислительная активность, если предположить, что данная модель является корректной, в функциональном отношении предстает как прямая, в то время как идущая из мира активность выступает здесь как источник обратной связи.

Как уже отмечалось нами в самом начале статьи, согласно ключевой исходной посылке современных байесовских моделей перцептивные процессы происходят в условиях существенной неопределенности, будь то, как утверждается, неопределенность, связанная с шумом/случайными ошибками в процессе сенсорного кодирования сигналов, или же неопределенность непосредственно воспринимаемых сцен и объектов (возникающая, например, когда различные модальности могут предоставлять нуждающуюся в интеграции противоречивую информацию). В полном согласии с идеями Гельмгольца приверженцы современных байесовских подходов исходят из предположения о непрямом характере перцептивных процессов: перцептивная система не имеет прямого доступа к воздействовавшим на ее вход «скрытым причинам». Все, чем располагает мозг и нервная система, есть лишь поступившие на вход сигналы, которые подлежат сопоставлению с производимым генеративной моделью мозга потоком нисходящих предсказывающих сигналов. Чтобы порождаемые разумом/мозгом предсказания в лучшей степени соответствовали входящему потоку сигналов, мозг, согласно общепринятой среди сторонников предсказывающей модели, вынужден полагаться на процессы иерархического байесовского вывода, осуществляющие отбор наилучшей гипотезы для предсказания текущего сенсорного входа.

Предполагается, что весь процесс селекции гипотез происходит в примерном соответствии с упомянутым ранее правилом Байеса[ii], которое представляет собой формальный метод вычисления условных вероятностей (т.е. вероятности какого-либо события A при условии наступления события B; например, вероятности того или иного заболевания при наличии определенных симптомов). Обобщенно говоря, смысл правила Байеса (или теоремы Байеса) заключается в определении апостериорной вероятности гипотезы с учетом имеющихся у нас данных (функция правдоподобия) и, прежде всего, нашего предшествующего знания о том, насколько данная гипотеза вероятна в принципе. Мы используем наше предшествующее знание (в формальном отношении известное как априорная вероятность) для интерпретации новых данных и итоговом приписывании апостериорной вероятности интересующей нас гипотезе.

Например, нас может интересовать вопрос о том, является ли присутствующий на зрительной сцене объект выпуклым или вогнутым. В таком случае определенный зрительный вход I (данные) может быть совместим как с гипотезой выпуклого, так и с гипотезой вогнутого объекта. Тогда в дело вступает априорная вероятность, которая говорит, что ceteris paribus мозг склонен исходить из предположения, что источник света должен располагаться над головой и что в этом случае существует более высокая степень вероятности, что находящийся перед ним объект является выпуклым (что, соответственно, влечет за собой приписывание данной гипотезе более высокой апостериорной вероятности). Наконец, гипотезе, получившей наибольшую апостериорную вероятность (так называемый апостериорный максимум), согласно байесовской модели, дозволяется контролировать нисходящую динамику процесса восприятия и предсказывать эволюцию сенсорного входа при дальнейшем взаимодействии с объектами.

Так, например, если была принята гипотеза, что на зрительной сцене в данный момент находится дом, то при смене перспектив мозг будет исходить из предположения, что данный объект на самом деле является домом, а не, скажем, только фасадной стеной, за которой ничего не скрывается. Принятые гипотезы являются чувствительными к текущей обстановке и доходящим из мира сигналам в интерактивной манере – если во время осмотра зрительной сцены «гипотеза дома» постепенно получает подтверждение, то ее вероятность возрастает все более, и наоборот, вызванный гипотезой поток ошибок инициирует новый этап селекции гипотез и т.д.

Нужно сказать, что представленная выше схема является, конечно же, в высокой степени идеализированной. Так, начальное пространство гипотез, из которого мозг, согласно сторонникам этой модели, должен выбирать гипотезы для предсказания сенсорного входа, для множества ситуаций является неисчислимым [Rescorla 2015], что делает байесовскую схему неправдоподобной в качестве действительного алгоритма, которому мог бы следовать мозг. В конце концов, отнюдь не ясен общенаучный статус утверждений, что мозг или разум могут осуществлять вычисления того или иного рода. Согласно одной точке зрения «байесовская модель только приблизительно описывает действительные (здесь и далее курсив автора. – М.С.) ментальные процессы. Модель пытается описать, возможно идеализированным образом, как перцептивная система в действительности переходит от сенсорного входа к перцептивным оценкам», – отмечает специалист в области философии математики Майкл Рескорла [Ibid.].

Впрочем, подобного рода схемы все же широко привлекались для объяснения целого круга перцептивных, сенсорно-моторных и когнитивных феноменов, включая мультисенсорную интеграцию (интеграцию информации, поступающей от различных сенсорных модальностей), бистабильное восприятие (куб Неккера, бинокулярное соперничество и т.п.), а также действие и моторный контроль, полное освещение и оценка которых выходит далеко за рамки настоящего рассмотрения.

Действие: активный вывод vs оптимальный контроль

Приведенный выше панорамный обзор основных принципов предсказывающей обработки был сфокусирован лишь на одной стороне общего механизма минимизации ошибки в предсказании, а именно восприятии. В соответствии с представленной картиной, разум и мозг руководствуются (или действуют в примерном соответствии с) процессами иерархического байесовского вывода для выбора гипотез с целью предсказания входящих сенсорных сигналов и, собственно, порождения перцептивного опыта как такового. Если же, как мы видели, предсказания системы оказываются неточны, входящий поток ошибочных сигналов используется, чтобы внести необходимые коррективы во внутреннюю генеративную модель мира для установления лучшего соответствия между ее гипотезами и самим миром.

Очевидно, что данное видение процессов минимизации ошибок в предсказании нуждается в надлежащей оценке и учете роли действия и двигательной активности, поскольку тривиальное обстоятельство заключается в том, что мы в максимально возможной степени используем потенциал своих двигательных навыков, чтобы делать перцептивный мир доступным нашим органам чувств и «…что мы, разумеется, используем способ нашего восприятия мира, чтобы информировать и направлять нашу способность действовать» [Hohwy 2013, 75–76].

Мы уже говорили, что еще основоположник всей конструктивистской программы в исследованиях восприятия Г. фон Гельмгольц подчеркивал значимость двигательной активности для усиления корректности производимых нервной системой бессознательных умозаключений о причинах воздействия на органы чувств. В этом аспекте своей теории Гельмгольц активно прибегал к аналогии со значением экспериментов в науке, в рамках которых, утверждал он, благодаря нашему непосредственному вмешательству и контролю условий возникновения интересующих нас событий, представляется единственно возможным установить надежную причинную связь между событиями. В противном случае, указывал Гельмгольц, если бы мы были лишены нашей способности активно исследовать мир при помощи действий и могли лишь пассивно созерцать, как объекты проходят перед нашим взором без малейшей возможности повлиять на них «…вероятно, мы никогда бы не смогли найти свой путь среди подобной оптической фантасмагории» [Helmholtz 1962, 31]. (Позднее к аналогичной метафоре, уподоблявшей восприятия проверяемым в науке гипотезам, обращался также и Р. Грегори [Gregory 1978, 225; Gregory 1997, 1121].)

Таким образом, в рамках семейства байесовских подходов к когнитивным процессам в широком смысле были разработаны две основные теории действия, двигательной активности и связи сенсорных и моторных механизмов. Однако, прежде чем переходить к их рассмотрению, необходимо оговориться, что в рамках этих теорий действие и моторные процессы исследуются под другим углом, нежели в другой известной когнитивистской традиции, восходящей к работам М. Мерло-Понти и Дж.Дж. Гибсона и достигшей кульминации в исследованиях приверженцев того самого «ситуативного и воплощенного познания» [Сущин 2014, 44–57] и «энактивизма» [Noe 2004; Сущин 2015, 191–210].

С точки зрения последних речь могла идти о фактическом размывании границ между восприятием, действием и познанием или же о том, что, например, перцептивное сознание может определяться с качественной стороны владением особым сенсорно-моторным знанием (сенсорно-моторными зависимостями), благодаря которым, как утверждают адепты энактивизма, мы и в состоянии воспринимать мир [O’Regan, Noe 2001]. С другой стороны, в рамках характерной для байесовских теорий проблематизации действия и моторных процессов речь идет скорее о том, что Д. Марр в рамках своей методологической схемы анализа систем обработки информации называл общей целью вычислительного процесса [Марр 1987]: байесовские модели принципиальным образом стремятся прояснить общую цель моторной активности (например, ее роль в рамках механизма минимизации ошибки в предсказании), фактически оставляя вопрос о конкретных алгоритмах и деталях физической реализации вне рамок своей компетенции.

Итак, первая интересующая нас байесовская модель моторных процессов была развита как часть программы «предсказывающей обработки» и получила (по аналогии с базовыми процессами перцептивного вывода) наименование «активного вывода». Ее смысл, обобщенно говоря, заключается в том, что когнитивная система, как постулируется, способна минимизировать ошибки в предсказании не только посредством пересмотра и обновления внутренней генеративной модели мира (когда ее предсказания оказываются неверны), но и при помощи двигательной активности и действий (например, локомоций), через изменение своего положения в мире и/или активное воздействие на текущее положение вещей, чтобы сенсорный вход в лучшей степени соответствовал предсказаниям модели [Hohwy 2013, 77]. (Например, чтобы устранить двусмысленность наблюдаемой сцены и/или увеличить достоверность определенной перцептивной гипотезы.)

С этой точки зрения восприятие и действие оказываются двумя гранями единого механизма минимизации ошибок в предсказании сенсорного входа, подчиненными общей важнейшей стратегии и координирующимися для ее реализации в примерном соответствии со следующей схемой. Вначале перцептивная система просто-напросто следует описанным выше механизмам отбора гипотез для предсказания сенсорного входа, останавливается на гипотезе, получившей наибольшую апостериорную вероятность, и пытается предсказать, как сенсорный вход может изменяться, исходя из того, что эта гипотеза является верной. (Допустим, если была принята гипотеза дома, система пытается предсказать, что она сможет увидеть благодаря двигательной активности.) Поскольку в данный конкретный момент положение вещей отличается от предсказанного, единственный способ устранения ошибки заключается в попытке реализации предсказаний модели с целью их подтверждения или опровержения. Если, как уже говорилось, гипотеза находит подтверждение, ее вероятность усиливается. В противном случае система возвращается к механизмам «пассивного» перцептивного вывода и пытается выбрать иную более подходящую гипотезу. Таким образом, с этой точки зрения, «…действие не осуществляется через определенное сложное вычисление (курсив мой. – М.С.) моторных команд, которые контролируют мускулы тела. Попросту говоря, напротив, происходит то, что мускулы двигаются до тех пор, пока существует ошибка в предсказании. Мускулы тела, поэтому, находятся во власти ошибки в предсказании, возникающей вследствие того, что мир не является таким, каким он должен быть в соответствии с моделью мозга. Ошибка в предсказании в таком случае является простым механизмом, который управляет действием» [Ibid., 81].

В отличие от подобного рода механистического видения недавно возникшей концепции «активного вывода», более ранняя ветвь байесовского моделирования двигательной активности, известная как «оптимальный моторный контроль», рассматривала задачу реализации действия именно как вычислительную активность, основанную на использовании нескольких типов внутренних моделей. В этом отношении программа оптимального контроля расширяет концепцию Гельмгольца до моторного контроля, постулируя бессознательные выводы, которые оценивают состояния среды, и процессы бессознательного принятия решений , которые выбирают моторные команды [Rescorla 2016].

Ключевым здесь является изначально развитое в области управления сложными системами понятие прямой модели. В общем виде предполагается, что контроль и управление действиями (с вычислительной точки зрения) происходит в соответствии со следующей схемой: вначале система на сознательном уровне устанавливает цель действия (допустим, взять стоящую на столе чашку чая). Затем (уже, разумеется, на субличностном уровне, при помощи так называемой обратной модели) вычисляется необходимая траектория движений для достижения установленной цели, которая посылается эффекторам (непосредственным физиологическим исполнителям действия). При этом на пути к эффекторам копия моторных команд (эфферентная копия), как предполагается, направляется той самой прямой модели, которая еще до появления действительных сигналов обратной связи на моторные команды системы создает своего рода вычислительную симуляцию, пытающуюся предвосхитить содержание сигналов будущей обратной связи. Смысл подобной процедуры заключается в том, что система нуждается в максимально надежной оценке результатов своих действий, в то время как сигналы обратной связи часто бывают либо запоздалыми, либо излишне подверженными шуму/искажениям. Таким образом, «главное преимущество прямых моделей заключается в том, – замечает признанный классик исследований моторного познания нейроученый Марк Жанро, – что они способны оценить желаемое состояние машины еще до ее действия» [Jeannerod 2006, 20].

Каким образом с этой точки зрения система останавливается на какой-либо одной траектории для реализации моторной цели из бесконечного множества всех возможных траекторий и почему не бывает двух абсолютно идентичных движений даже для одного и того же агента? Коротко говоря, моторная система, как постулируют сторонники данной модели, выбирает оптимальную траекторию, исходя из своей оценки положения дел в среде, и отслеживает отклонения от предписанной последовательности команд, которые могут проистекать от того же «…шума, усталости или внешнего вмешательства. Всякий раз, когда случается отклонение, система сталкивается с выбором: скорректировать отклонение или игнорировать его… Оптимальная стратегия заключается в том, чтобы скорректировать отклонение от средней траектории, только если отклонение релевантно цели задачи» [Rescorla 2016].

Именно способность теории оптимального контроля объяснить (или, по крайней мере, предложить определенное объяснение), как система выбирает единственную уникальную траекторию для реализации цели, была недавно использована сторонниками этого направления как аргумент в споре с приверженцами альтернативной модели «активного вывода». В её рамках, как утверждается, проблема избыточности степеней свободы [Бернштейн 1997] вовсе не получает адекватного рассмотрения [Rescorla 2016]. Так или иначе, но в рамках настоящего рассмотрения нет ни малейшей возможности рассудить спор этих двух направлений. Наша цель состояла всего лишь в том, чтобы продемонстрировать потенциал общей байесовской теории в свете непреложного факта тесной взаимозависимости систем восприятия и действия.

Внимание и другие области приложения

Мы уже неоднократно подчеркивали, что восприятие и действие, безусловно, представляют собой центральный объект интереса для байесовских моделей в когнитивной науке, однако этим их амбиции отнюдь не ограничиваются. Так, недавно получили развитие попытки с позиции байесовского подхода раскрыть возможную роль внимания и специфику/источники некоторых психических расстройств (прежде всего, шизофрении).

В основании байесовского подхода к объяснению функций внимания лежит следующая мотивация: система минимизации ошибки в предсказании сенсорных сигналов функционирует в мире, изобилующем шумом или неопределенными сигналами. Поскольку ошибочные сигналы играют неоценимую роль в обучении мозга и совершенствовании порождаемых предсказаний сенсорного входа, очевидно, что система должна располагать надежным механизмом фильтрации и отделения не имеющего значения шума от действительных ошибочных сигналов. Именно с выполнением этой важной задачи было предложено связать процессы внимания, которые при обнаружении подлинных ошибочных сигналов ранжируют их, наделяя более точные сигналы большим весом, благодаря этому позволяя последним распространяться до верхних «этажей» перцептивной иерархии и вносить необходимые коррективы в модель мира, чтобы она могла генерировать более точные и адекватные репрезентации положения дел в среде.

В связи с данной оригинальной интерпретацией функций внимания известным нейроученым и популяризатором науки К. Фритом и его соавтором П. Флетчером было предложено интересное объяснение происхождения и природы такого серьезного психического расстройства, как шизофрения. «Наиболее разительными и характерными особенностями расстройства, – замечают Флетчер и Фрит, – являются галлюцинации и ложные выводы. Галлюцинации являются ложными восприятиями такого рода, что пациенты слышат других людей, разговаривающих о них, или слышат их мысли, [как будто] проговаривающиеся вслух. Ложные выводы есть устойчивые причудливые или иррациональные убеждения, которые не поддаются простому пониманию в терминах социального или культурного фона индивида. Например, пациенты могут верить, что другие люди способны слышать их мысли или что правительство следит за каждым их действием» [Fletcher, Frith 2009, 48]. Данные «позитивные симптомы» также усугубляются чувством «пассивности», когда индивидам кажется, что их действиями на самом деле руководят другие, а также чрезмерным вниманием к совершенно несущественным окружающим их предметам или событиям.

Флетчер и Фрит полагают, что источники подобной симптоматики могут быть рассмотрены сквозь призму понятийного аппарата байесовской теории восприятия и программы минимизации ошибки в предсказании. Поскольку не только не существует непроходимой границы между низкоуровневыми сенсорными механизмами и высокоуровневыми структурами знания (интеллектом), но и наоборот, как утверждается, структуры знания в существенной степени определяют сами восприятия и их содержание [Gregory 1997], то и характерные для шизофрении галлюцинации (восприятие) и ложные выводы (знание), полагают Флетчер и Фрит, могут быть связаны с нарушениями в работе общего механизма коррекции ошибок в предсказании.

Ключевая идея здесь заключается в следующем. Из исследований нейробиологических оснований шизофрении известно, что расстройство может быть обусловлено нарушениями работы системы, регулирующей активность нейромодулятора дофамин (который, предположительно, отвечает за оценку точности сигналов об ошибке, т.е. за работу процессов внимания, согласно представленной выше гипотезе). Это означает, что в работе механизма оценки точности сигналов об ошибке происходят нарушения, когда незначительным или ложным ошибочным сигналам присваивается несоразмерно большой вес, что коррелирует с упомянутой выше склонностью больных шизофренией к излишнему сосредоточению на совершенно несущественных вещах (например, на приоткрытом окне или замочной скважине). Ложному сигналу об ошибке в силу его неверно оцененной значимости дозволяется распространяться на верхние уровни перцептивной иерархии и вносить «роковые корректировки» в модель мира. Все это запускает самоподдерживающийся порочный цикл, где искаженная модель мира будет генерировать неадекватные предсказания и интерпретации положения дел в среде, приводя, таким образом, к образованию столь характерных для шизофрении видов опыта.

Флетчер и Фрит полагают, что язык байесовской теории необходим для наведения концептуального «моста» между физическими (нарушения работы подсистем мозга) и феноменальными (искаженным опытом в виде галлюцинаций и навязчивых бредовых состояний) уровнями в деле изучения столь нуждающихся в объяснении феноменов человеческого опыта. Любые изолированные исследования, подчеркивают авторы, неизбежно будут упираться в вопросы вроде: «Как дофамин может вызвать голос или убеждение?» [Fletcher, Frith 2009, 49]). Вопрос о возможном вкладе байесовской теории в объяснение феноменальных аспектов когнитивных процессов является, без сомнения, важным, но, к сожалению, выходящим за рамки настоящего обсуждения. Сейчас же мы вкратце остановимся на еще одном аспекте байесовских моделей восприятия, а именно на предполагаемом ими характере отношения перцептивных процессов к миру.

Отношение к реализму и теориям прямого восприятия

Если байесовские модели восприятия постулируют, что содержание перцептивного опыта определяется гипотезой, получившей апостериорный максимум и предвосхищающей поступающие сигналы, в то время как сам мир всегда является скрытым от нас за завесой сенсорного входа, то не означает ли это, что байесовский подход в эпистемологическом плане оказывается разновидностью скептицизма или антиреализма? Именно к такому скептическому выводу в своих недавних работах склоняется один из ярых приверженцев байесовской программы в когнитивных исследованиях философ и когнитивист Я. Хохви. Восприятие, утверждает он в полном согласии с идеями Гельмгольца, является непрямым и удаленным от мира на расстояние одного шага (сенсорного входа), за границами которого находятся скрытые причины, воздействующие на наши органы чувств и устанавливаемые мозгом в процессе его каузальных бессознательных выводов. Более того, настаивает Хохви, только с учетом такого понимания отношения перцептивных процессов к миру возможна сама программа минимизации ошибки в предсказании: «Это, – пишет он, – становится подтверждением простого картезианского скептицизма. Поскольку мы не можем получить независимую от нашей позиции в мире точку зрения, мы не можем исключить скептическую гипотезу, что получаемый нами сенсорный вход вызван злонамеренным, обманывающим ученым, а не внешними положениями вещей, в которые мы обычно верим. Байесовская программа, поэтому, подразумевает скептицизм. Следовательно, отрицание скептицизма влечет за собой отрицание байесовского вывода, а значит, и ММО (механизма минимизации ошибки. – М.С.)» [Hohwy 2014].

И хотя возможно, что в метафизическом отношении данная точка зрения является неопровержимой, мы исходим из того, что конкретная научная программа исследований не должна находиться в противоречии со связанными с ней метафизическими предпосылками. Более продуктивной и перспективной в научном отношении нам представляется вовсе не скептицизм или «методологический солипсизм», а неплохо зарекомендовавшая себя за последнюю четверть XX в. в когнитивных исследованиях обычная реалистическая установка, постулирующая существование внешнего мира, вносящего ограничения на наши внутренние модели и знания. И сам Хохви в другом месте признает, что мир является истиной, посредством посылаемых им ошибочных сигналов выступает в роли естественного внешнего надзирателя над процессами восприятия [Hohwy 2013, 48–51].

Мы, таким образом, полагаем, что байесовская программа исследований восприятия и познания должна быть в фундаментальном смысле совместима с реалистической установкой. Более того, только реалистическая установка позволяет проложить дорогу к объяснению того, как формируются сами вычислительные механизмы разума и откуда берутся его априорные ожидания и гипотезы (что рассматривается в числе основных затруднений байесовских моделей восприятия). Если кто-либо всерьез и вознамерился бы принять скептическую установку за ориентир для реализации своей научной программы, любые исследования эволюционных, телесных и социокультурных оснований познания (включая рассмотренную нами выше байесовскую теорию действия) для него просто потеряли бы актуальность. Манипулируемый злонамеренным ученым «мозг в бочке», очевидно, не нуждается в двигательной активности, для него не существует ни социума, ни создаваемых им интеллектуальных артефактов и орудий.

Именно реалистическое понимание байесовских моделей когнитивных процессов было предложено в работах таких известных ее новоиспеченных сторонников, как Э. Кларк и Д. Деннет. Кларк, размышляя над отношением байесовской программы к «ситуативному/воплощенному познанию», утверждает, что создание и эксплуатация специальных интеллектуальных культурных сред в виде слов, дорожных знаков, книг, компьютеров и т.д. позволяет нам более эффективно минимизировать ошибки в предсказаниях [Clark 2013^a, 194–195].

Деннет предположил, что набор перцептивных ожиданий, играющих ключевую роль в байесовской схеме, может быть связан с тем, что имеет для организма наибольшую значимость и составляет его мир, который складывается из того, что Дж.Дж. Гибсон называл «возможностями». Иначе говоря, это объекты среды, которые могут сыграть роль укрытия, использованы в качестве пищи и т.д. (т.е. в наиболее общем смысле принести пользу или вред) [Dennett 2013].

Здесь может возникнуть возражение: но ведь Гибсон, долгое время отстаивавший точку зрения прямого (или наивного) реализма, считается едва ли не главным антиподом гельмгольцевского вычислительного понимания восприятия – разве могут эти позиции быть хоть в малейшей степени объединены? (Особенно с учетом того обстоятельства, что Гибсон, как известно, подчеркивал, что восприятие возможностей является прямым.) На это мы должны еще раз заметить, что, хотя байесовская теория и расходится кардинально с теорией Гибсона по вопросу о характере отношения восприятия к миру, она все же является совместимой с реализмом в широком смысле. Иначе говоря, байесовская (иная вычислительная) программа выиграет больше, если будет отталкиваться от реалистической установки, а экологическая (ситуативная, воплощенная) программа – если не будет отрицать роль памяти и структур знания в процессах восприятия мира. Попытки примирить эти два лагеря предпринимались еще У. Найссером [Найссер 1981] и Д. Марром [Марр 1987].

Главные вызовы для байесовской программы

Байесовское моделирование когнитивных процессов является интригующим подходом к наболевшим проблемам когнитивной науки, уже получившем поддержку многих известных ученых и философов, возлагающих большие надежды на его успешное развитие и разработку. Тем не менее все это, разумеется, не означает, что возникшее направление вовсе свободно от каких бы то ни было затруднений или проблем. Даже более того, рядом авторов была поставлена под сомнение принципиальная верность и перспективность курса, предлагаемого байесовскими моделями когнитивных процессов.

Так, в обстоятельном обзоре с говорящим названием «Байесовские сказки в психологии и нейронауке» Дж. Бауэрс и К. Дэвис детально рассмотрели и подвергли острой критике буквально каждое ключевое положение. С их точки зрения, байесовский подход к изучению разума и мозга является ошибочным, поскольку байесовские модели восприятия, моторного контроля и высокоуровневого познания являются слишком гибкими и часто конструируемыми post hoc, чтобы «объяснить» фактически любые наблюдаемые данные, что, как следствие, на практике влечет их нефальсифицируемость. Например, в известных байесовских моделях восприятия скорости, распознавания слов и принятия решений ключевые компоненты теоремы Байеса (функция правдоподобия, априорная вероятность, а также добавляемая к ним так называемая функция полезности), как было убедительно показано в обзоре Бауэрса и Дэвиса, могут быть использованы произвольным образом, чтобы подстроиться практически под любые данные так, что «если бы оказалось, что данные являются другими, была бы построена отличная байесовская модель, чтобы оправдать заключение, что работа человеческого познания является оптимальной» [Bowers, Davis 2012, 410].

Как верно было замечено этими авторами, конкретные нейробиологические свидетельства в пользу того, что мозг в действительности по преимуществу следует байесовским вычислительным схемам, являются крайне слабыми (можно сказать, почти отсутствующими), а само положение об избыточном шуме в процессе сенсорного кодирования и нейронной обработки сигналов, как минимум, нуждается в дополнительном подтверждении.

Бауэрс и Дэвис оспорили лежащую в основании байесовского моделирования методологию «рационального анализа», являющуюся, по сути, развитием программы исследований зрения Д. Марра, подчеркивавшего, как известно, приоритет и большую значимость уровня вычислительной задачи (т.е. общего смысла деятельности информационной или когнитивной системы) по сравнению с уровнями алгоритмической и физической реализации этой задачи. Однако важнейшие для исследующих работу разума и мозга дисциплин свидетельства и ограничения могут быть продиктованы соображениями чисто эмпирического характера (например, анатомическим устройством сетчатки и зрительных путей в мозге, далекими от совершенства «эволюционными решениями» в общем), не мыслимыми и не выводимыми исключительно из рационального анализа задачи, которую выполняет система.

Резюмируя, нужно сказать, что критикам, безусловно, удалось наглядно показать слабые места байесовской программы в изучении восприятия и когнитивных процессов (особенно в аспекте чрезмерной общности и нефальсифицируемости байесовских моделей). В результате остаются открытыми вопросы о том, в какой степени работа когнитивных механизмов человека и других агентов в действительности подвержена шуму/искажениям и сопряжена ли она со следованием/реализацией вычислительных схем, постулируемых байесовскими моделями. Представляется, что решающий вклад в разрешение этих вопросов способны внести будущие нейрокогнитивистские исследования оснований работы сенсорно-моторных механизмов познания. Однако пока эмпирические исследования не склонили чашу весов в определенную сторону, байесовская программа остается наиболее целостной и систематичной среди теорий, которые предлагают объяснение того, что происходит «в голове» когнитивных агентов (пусть в плане спецификации общей вычислительной задачи), а не только того, внутри чего эта голова находится [Mace 1977]. В данном случае речь идёт о воспринимаемом внешнем мире, как предполагал Гибсон и предполагается ныне во многом перенявшими гибсонианскую установку приверженцами «энактивизма». Или же в противном случае нужны всеобъемлющие доказательства, что то, что происходит «внутри черепной коробки», не имеет значения для понимания восприятия и познания. Насколько мы можем судить, до сих пор таких доказательств не было представлено [Сущин 2015].

Примечания

¹ Данное правило было сформулировано Байесом и Лапласом независимо друг от друга.

²Для упрощения изложения мы опускаем определенные технические детали, не имеющие здесь принципиального значения.

Источники и переводы – Primary Sources and Russians Translations

Бернштейн 1997 – Бернштейн Н.А. Биомеханика и физиология движений. Под редакцией В.П. Зинченко. М.: Институт практической психологии; Воронеж: МОДЭК, 1997 (Bernstein N.A. Biomechanics and the Physiology of Movements. In Russian).

Брунер 1977 – Брунер Дж. О готовности к восприятию // Брунер Дж. Психология познания. М.: Прогресс, 1977. С. 13–64 (Bruner J.S. On Perceptual Readiness. Russian Translation 1977).

Марр 1987 – Марр Д. Зрение. Информационный подход к изучению представления и обработки зрительных образов. М.: Радио и связь, 1987 (Marr D. Vision. Russian Translation 1987).

Найссер 1981 – Найссер У. Познание и реальность: смысл и принципы когнитивной психологии. М.: Прогресс, 1981 (Neisser U. Cognition and Reality: Principles and Implications of Cognitive Psychology. Russian Translation 1981).

Helmholtz, Hermann von (1925) “Concerning the Perceptions in General”, Treatise on Physiological optics, Vol. 3, Ch. 26, 3rd edn, Translated by J.P.C. Southall, Op. Soc. Am., Section 26, reprinted Dover, New York, pp. 1–37.

Ссылки – References in Russian

Лекторский 2009 – Лекторский В.А. Реализм, антиреализм, конструктивизм и конструктивный реализм в философии и науке // Конструктивистский подход в эпистемологии и науках о человеке. Отв. ред. акад. РАН В.А. Лекторский. М.: Канон+: Реабилитация, 2009. С. 5–40.

Сущин 2014 – Сущин М.А. Концепция ситуативного познания в когнитивной науке: критический анализ: дис. … канд. филос. наук. М., 2014.

Сущин 2015 – Сущин М.А. Вы – это Ваш мозг? Почему когнитивная нейронаука нуждается в поведенческой и ситуативной перспективе // Аршинов В.И. Асеева И.А., Буданов В.Г., Гребенщикова Е.Г., Гримов О.А., Каменский Е.Г., Москалев И.Е., Пирожкова С.В., Сущин М.А., Чеклецов В.В. Социо-антропологические измерения конвергентных технологий. Методологические аспекты: Коллективная монография / Отв. ред. И.А. Асеева, В.Г. Буданов. Курск: Университетская книга, 2015. С. 191–210.

« Пред.		След. »

Вернуться