Например, Бобцов

Использование вейвлетной фильтрации входного изображения для изучения механизмов возникновения зрительной иллюзии Мюллера–Лайера

УДК 159.938.2: 612.843.721: 612.821.89
ИСПОЛЬЗОВАНИЕ ВЕЙВЛЕТНОЙ ФИЛЬТРАЦИИ ВХОДНОГО ИЗОБРАЖЕНИЯ ДЛЯ ИЗУЧЕНИЯ МЕХАНИЗМОВ ВОЗНИКНОВЕНИЯ ЗРИТЕЛЬНОЙ ИЛЛЮЗИИ МЮЛЛЕРА–ЛАЙЕРА
© 2011 г. И. И. Шошина*, канд. биол. наук; С. В. Пронин**; Ю. Е. Шелепин**, доктор мед. наук
** Сибирский федеральный университет, г. Красноярск
** Институт физиологии им. И.П. Павлова РАН, Санкт-Петербург
** Е-mail: shoshinaii@mail.ru
Путем цифровой фильтрации получили различные изображения фигур Мюллера– Лайера. Фильтрованные изображения содержали определенный спектр пространственных частот, преимущественно – низкие, средние или высокие. Фильтрацию проводили сверткой изображений с вейвлетами, представляющими собой разность двух гауссоид с отличающейся в два раза полушириной. Измеряли порог уравнивания фигур Мюллера–Лайера при предъявлении изображений, подвергнутых цифровой обработке и без таковой, тем самым измеряли порог возникновения иллюзии. Иллюзию Мюллера–Лайера вызывали все стимулы, но она была достоверно больше в ответ на предъявление изображения с преимущественно низкочастотной составляющей. Моделирование иллюзии Мюллера–Лайера должно учитывать пространственночастотный спектр тестового изображения, характеристики полосовой фильтрации в пространственно-частотных каналах не только первичных, но и высших отделов зрительной системы, осуществляющих построение огибающей на основе первичной фильтрации изображения.
Ключевые слова: зрение, анализ изображений, вейвлеты, пространственночастотная фильтрация, иллюзия Мюллера–Лайера.
Коды OCIS: 070.2615, 110.2960, 110.7410, 170.5380, 330.6110, 330.5370, 330.7323.
Поступила в редакцию 08.08.2011.

Введение
Термин “зрительные иллюзии” объединяет широкий круг феноменов, касающихся разных аспектов зрительного восприятия. Отличительной особенностью зрительных иллюзий по сравнению с обычными ошибками является их бо′льшая величина, устойчивость и неподвластность волевым, сознательным усилиям избавиться от них. Эта особенность является наглядным свидетельством их возникновения вследствие базовых механизмов зрительного восприятия. Наибольший интерес исследователей вызывают геометрические иллюзии, проявляющиеся в неточном восприятии геометрических параметров стимула, в частности размера, наклона, пространственного расположения элементов, параллельности. К их числу относятся широко известные иллюзии Мюллера–Лайера, Эббингхауза, Поггендорфа, Понцо и другие.

Иллюзия Мюллера–Лайера является одним из наиболее известных примеров геометрических иллюзий. Она состоит в том, что наблюдателю предъявляют два одинаковых отрезка с дополнительными стрелками на концах: отрезок с остриями стрелок на концах и с оперениями на обоих концах. Отрезок с оперениями на концах кажется длиннее, чем такой же отрезок со стрелками, обращенными наружу (рис. 1а). Данной иллюзии посвящено огромное количество исследований, вероятно, много больше, чем всем остальным. Однако вопрос о механизме ее возникновения до сих пор остается нерешенным.
В настоящее время активно обсуждается несколько гипотез: теория перспективы или неправильного использования механизма константности восприятия [1], теория усреднения или ассимиляции сравниваемых отрезков с контекстными элементами [2, 3], теория некорректного кодирования позиций вершин

70 “Оптический журнал”, 78, 12, 2011

(а) (б)

(в)

Рис. 1. Изображения фигуры Мюллера–Лайера, использованные в исследовании. а – нефильтрованное изображение, б – изображение, содержащее высокие частоты, в – изображение с низкими пространственными частотами.

наконечников [4], теория низкочастотной фильтрации изображения зрительной системой [5–10] и дополняющая ее “центроидная” гипотеза [11]. Каждая из перечисленных теорий имеет экспериментальное подтверждение, однако ни одна из них не является общепризнанной.
Одна из наиболее проработанных моделей механизма возникновения данной иллюзии основана на теории пространственно-частотной фильтрации, предложенной Артуром Гинзбургом [6–9, 12]. Искаженной, согласно модели Гинзбурга, является низкочастотная составляющая самого исходного изображения отрезков. Вследствие многоканальной фильтрации в зрительной системе наблюдателя эта низкочастотная составляющая становится видимой наблюдателю. Иными словами, это не искажение восприятия, а восприятие истинного изображения, определяемое самой структурой изображения. Наблюдатель видит не два отрезка и дополнительно к ним стрелки, а целостное изображение – отрезок и его концы (с острием или с оперением). Очень близка к модели Гинзбурга [6–9, 12] центроидная теория, которая, по существу, является ее частным случаем. Центроидная гипотеза объясняет, что в результате низкочастотной фильтрации оценка длины линий производится не по точкам, выбранным экспериментатором (концам отрезка), а по центрам тяжести низкочастотного описания фигуры [11]. В пользу теории фильтрации свидетельствуют данные о влиянии на величину иллюзии Мюллера–Лайера длины сравниваемых линий, а также длины и угла наклона отрезков, образующих концы стрелок [12–17].

Нас интересует многоканальная организация зрительной системы, ее работа в норме и при патологии, поэтому из ряда гипотез о причинах возникновения иллюзии Мюллера– Лайера нами выбрана модель пространственно-частотной фильтрации, учитывающая роль низкочастотной составляющей в возникновении иллюзии Мюллера–Лайера, хотя эта модель вызывает серьезные возражения [18].
Цель данной работы – измерить пороги возникновения иллюзии Мюллера–Лайера в определенных пространственно-частотных диапазонах у здоровых испытуемых. Поэтому тестовые изображения должны содержать определенный диапазон пространственных частот. При этом важно получить оптимальный стимул, т. е. изображение, на которое реагировала бы лишь небольшая группа нейронов с близкими по характеристикам рецептивными полями. Очевидно, что такой стимул должен иметь небольшой угловой размер, не превышающий размер рецептивных полей данной группы нейронов, и его спектр должен лежать внутри полосы пространственных частот, на которую они реагируют. Этим требованиям отвечают вейвлеты, имеющие хорошую локализацию как в пространственной, так и в частотной областях.
Методика
Измерения проводили в помещении с уровнем освещенности 8 кд/м2. Стимулы предъявляли на экране монитора 17′ Samsung Samtron 76Е (с яркостью 90 кд/м2). В качестве стимулов использовали классический вариант фигуры Мюллера–Лайера (рис. 1а). Отрезок

“Оптический журнал”, 78, 12, 2011

71

линии с крыльями стрел, направленными внутрь, был референтным. Второй отрезок линии, с крыльями стрел, направленными наружу, – тестовым. Длина сравниваемых отрезков составляла 6 см, крыльев – 2 см. Угол между отрезками, образующими стрелку, составлял 45° и 135°.
Цифровую фильтрацию изображений производили путем его свертки с DoG-функциями – вейвлетами, представляющими собой разность двух гауссоид с отличающейся в два раза полушириной:

DoG(x, y) = 2G(x, y, σ) − G(x, y, 2σ),

G(x, y, σ) =

1 2πσ2

exp⎜⎜⎝⎜⎛⎜−

x2 + y2 2σ2

⎠⎞⎟⎟⎟⎟⎟,

где σ – полуширина более узкой гауссоиды. В результате вейвлетной фильтрации ис-
ходного изображения были получены три изображения фигуры Мюллера–Лайера. Средние частоты спектров составляли для исходного изображения 16 цикл/град, для высокочастотного – 23 цикл/град, для среднечастотного – 3 цикл/град и для низкочастотного – 0,426 цикл/град. Примеры результатов низкочастотной и высокочастотной вейвлетной фильтрации исходного изображения показаны на рис. 1б и 1в.
В ходе исследования каждому испытуемому в четырех сериях измерений в центре экрана монитора последовательно предъявляли четыре изображения фигуры Мюллера–Лайера: одно в нефильтрованном виде и три фильтрованных изображения. Испытуемый должен был нажатием правой клавиши компьютерной мыши уравнять величину тестового отрезка с референтным. Длиной тестового отрезка испытуемый мог управлять, а референтный был фиксирован. Измерения проводили методом пределов. Порог возникновения (он же компенсации) иллюзии (h) рассчитывали в процентах по формуле h = W1/W2×100, где W1 – длина тестового отрезка в момент, когда у испытуемого возникало ощущение, что он равен референтному, W2 – длина референтного отрезка. Таким образом, чем больше порог иллюзии, тем менее склонен испытуемый к зрительному искажению длины отрезка в фигуре Мюллера– Лайера.
Для фиксации положения головы испытуемого использовали стандартную лобноподбородную подставку, называемую в офтальмологической литературе “лицевой установ-

кой”. Наблюдение осуществляли бинокулярно. В исследованиях участвовал 61 здоровый испытуемый в возрасте от 18 до 55 лет (мужчин – 30). Острота зрения всех испытуемых была нормальной или скорректированной до нормы. Условия проведения исследований соответствовали Хельсинкской декларации Всемирной медицинской ассоциации.
Статистическую обработку полученных данных осуществляляли с помощью пакета статистических программ SPSS-13 (ANOVA). Проверку выборки на нормальность распределения выполняли с помощью критерия Колмогорова– Смирнова. Для каждой выборки значение критерия было значительно больше 0,05, что указывало на соответствие распределения нормальному виду. Оценку достоверности различий осуществляли с помощью однофакторного дисперсионного анализа (ANOVA).
Результаты
В ходе проведенного исследования были измерены пороги возникновения иллюзии Мюллера–Лайера при предъявлении обычного и фильтрованных изображений фигуры. Изображения были получены путем вейвлетной фильтрации. Каждое фильтрованное изображение содержало определенный спектр пространственных частот – низкие, средние или высокие. Результаты измерений представлены на рис. 2.

h, %
90

80

70

60

50
(а) (б) (в)
Предъявляемое изображение

(г)

Рис. 2. Влияние предварительной фильтрации изображения на порог иллюзии Мюллера– Лайера. Пороги иллюзии Мюллера–Лайера при предъявлении изображений, содержащих преимущественно спектр низких (а), средних (б) и высоких (в) пространственных частот, и исходного нефильтрованного изображения (г). Вертикальные линии у каждого столбца – планки погрешностей с относительными ошибками.

72 “Оптический журнал”, 78, 12, 2011

Из рисунка видно, что иллюзия Мюллера– Лайера возникает в ответ на предъявление всех использованных изображений. Однако порог возникновения (или порог компенсации) иллюзии на разные изображения различен. В ответ на предъявление нефильтрованного изображения тестовой фигуры (классического изображения фигуры Мюллера–Лайера) порог иллюзии составил 88,1%. Очень близкие значения порогов (89,6% и 87,9%) получены при предъявлении изображений, содержащих соответственно только высокие и только средние пространственные частоты. Порог иллюзии Мюллера–Лайера при предъявлении низкочастотного изображения был достоверно ниже, чем в ответ на более высокочастотное изображение, и составил 78,0%.
Результаты оценки достоверности различий с помощью однофакторного дисперсионного анализа между порогами иллюзии, возникающей в ответ на предъявление изображения со спектром низких пространственных частот, и изображения с высокими частотами, свидетельствуют о высоком уровне значимости различий между сравниваемыми группами. Уровень значимости различий составил р < 0,000001 при F-отношении (эмпирическом значении критерия Фишера), равном 28,2. Критерий Фишера является результатом сравнения дисперсий двух выборок.
Таким образом, при предъявлении низкочастотного изображения фигуры Мюллера– Лайера иллюзия была достоверно наибольшей.
Обсуждение
Использование предварительной вейвлетной фильтрации изображения фигуры Мюллера– Лайера позволило получить сведения о раздельном вкладе низких и высоких пространственных частот в формирование иллюзии. Иллюзия возникала при предъявлении как нефильтрованного, так и фильтрованных изображений. Однако при предъявлении изображения с низкими пространственными частотами величина возникающей иллюзии была достоверно больше.
Полученные нами данные согласуются с результатами исследования, выполненного с помощью другой методики [18]. Однако, как показало наше исследование, при предъявлении изображения, содержащего преимущественно низкие пространственные частоты, порог иллюзии на 10% меньше. Это, в свою очередь, сви-

детельствует о ведущей роли в формировании иллюзии Мюллера–Лайера низкочастотной составляющей изображения.
Имеются работы и других авторов, подтверждающие роль низких пространственных частот [15]. Для разделения пространственночастотных каналов М. Carrasco с соавторами использовали способность нейронных каналов адаптироваться к определенной полосе пространственных частот, которую показали еще C. Blakemore и F. Campbell [19]. Результаты исследований М. Carrasco с соавторами [15] свидетельствуют о том, что адаптация к вертикальным решеткам низкой пространственной частоты сопровождается снижением величины иллюзии Мюллера–Лайера. Авторы предположили, что адаптация к низким пространственным частотам снижает чувствительность зрительных каналов к этим частотам, а это, возможно, приводит к доминированию в восприятии высокочастотной составляющей изображения, что, в свою очередь, способствует уменьшению величины иллюзии.
С нашей точки зрения, нейрофизиологический механизм усиления выраженности иллюзии по мере снижения пространственной частоты, вероятно, определяется особенностями ориентационной и пространственно-частотной настройки рецептивных полей нейронов зрительной коры – она выше в высокочастотном диапазоне [20–22]. Нейроны, оптимально реагирующие на низкие пространственные частоты, вообще редко встречаются в первичной зрительной коре [23]. Поэтому для понимания механизма возникновения иллюзии Мюллера– Лайера необходимо принимать во внимание еще и работу нейронов внестриарной коры, настройка рецептивных полей которых лежит в низкочастотной области [23–30]. Эти нейроны не только обрабатывают информацию о низкочастотной составляющей изображения, но и строят огибающую отдельных фрагментов изображения. Вероятно, именно они обеспечивают целостное описание изображения. Иными словами, внестриарные нейроны определяют статистику изображения, в том числе строят низкочастотную огибающую по модулированному высокочастотному каналу, определяют центр тяжести фигуры и т. д. [23–30].
Поэтому, если в самом тестовом изображении усилить низкочастотную составляющую, зрительной системе будет легче рассчитать центр тяжести фигуры Мюллера–Лайера или рассчитать распределение оптической плот-

“Оптический журнал”, 78, 12, 2011

73

ности изображения по площади фигуры. Таким образом, использование предварительной вейвлетной фильтрации изображений фигуры Мюллера–Лайера позволило нам показать, что ключевым в правильном распознавании фигуры является согласование статистики тестового изображения и характеристик рецептивных полей, обеспечивающих распознавание этого сигнала.
Тот факт, что иллюзия сохраняется при предъявлении изображения фигуры Мюллера–Лайера, содержащего после фильтрации только высокие пространственные частоты, свидетельствует о роли не только низкочастотной составляющей, но еще и о роли некой более сложной оценки с использованием высоких пространственных частот. Данные исследования, предпринятого С. Carlson с соавторами [31], также свидетельствуют о том, что классическая иллюзия Мюллера–Лайера является результатом не только восприятия низких пространственных частот. При предъявлении точечного высокочастотного изображения фигуры Мюллера–Лайера иллюзия сохранялась [31].
На наш взгляд, зрительное искажение длины отрезков в иллюзии Мюллера–Лайера действительно может быть описано с помощью модели, объединяющей согласованную со статистикой изображений многоканальную полосовую низкочастотную фильтрацию и расчет центра тяжести элементов фигуры, определяемый геометрией изображения фигуры Мюллера–Лайера (например углом наклона кончиков стрелы и оперения к оцениваемому отрезку). Перспектива [1] и взаимодействие между ориентационно-оппонентными каналами [26–27] являются вторичными, но должны учитываться при работе испытуемого с изображениями сцен не как искажающие, а как

корректирующие геометрию механизмы восприятия изображения объектов при построении перспективы.
Интерпретация полученных экспериментальных данных о роли восприятия низких пространственных частот, представленных в самом изображении, и результатов, свидетельствующих в пользу центроидной концепции [11], должны быть дополнены, так как иллюзия сохраняется и при высокочастотной фильтрации тестового изображения [31]. Представленные в нашей статье данные наглядно показывают, что выраженность иллюзии при высокочастотной фильтрации много меньше не только по сравнению с низкочастотными стимулами, но и по сравнению с исходными стимулами.
Следовательно, слабая выраженность (и тем не менее сохранность) иллюзии Мюллера– Лайера после высокочастотной фильтрации должна быть объяснена другим механизмом. Мы предположили, что этот механизм напоминает фильтр низких частот, но организованный не на первичных каскадах зрительной системы, а на ее следующем (экстрастриарном) уровне зрительной системы. Имеются веские нейрофизиологические данные, полученные нами ранее, демонстрирующие локализацию механизма глобального анализа изображения во внестриарных областях коры головного мозга [23–27]. Глобальный анализ изображения, представляющий собой построение огибающей, напоминает низкочастотную фильтрацию нейронами внестриарных областей коры головного мозга, осуществляющих построение огибающей на основе предварительной работы рецептивных полей первичной (стриарной) зрительной коры [23–30].
Исследование выполнено при поддержке Сибирского федерального университета.

** ** *

ЛИТЕРАТУРА
1. Грегори Р.Л. Глаз и мозг: психология зрительного восприятия. М.: Прогресс, 1970. 230 с. 2. Predebon J. Length illusions in conventional and single wing Müller-Lyer stimuli // Percept. Psychophys. 2000.
V. 62. № 5. P. 1086–1098. 3. Pressay A.W., Pressay C.A. Attentive fields are related to focal and contextual features: A study of Müller-Lyer
distortions // Percept. Psychophys. 1992. V. 51. P. 423–432.
4. Morgan M.J., Hole G.J., Glennerster A. Biases and sensitivities in geometrical illusion // Vision. Res. 1990. V. 30. P. 1793–1810.
5. Ginsburg A.P., Carl J.W., Kabrisky M., Hall C.F., Gill R.A. Psychological Aspects of a Model for the Classification of Visual Image // Advances in Cybernetics and Systems / Ed. J. Rose. London: Gordon and Breach, 1976. P. 1289–1305.

74 “Оптический журнал”, 78, 12, 2011

6. Ginsburg A.P. Specifying relevant spatial information for image evaluation and display design: an explanation of how see certain objects // Proc. of the SID. 1980. V. 21. № 3. P. 219–227.
7. Ginsburg A.P. Perceptual capabilities, ambiguities and artifacts in man and machine // Proc. SPIE. 1981. V. 283. P. 78–82.
8. Ginsburg A.P. On a filter approach to understanding the perception of visual form // Recognition of Pattern and Form / Ed. D G Albrecht. Berlin: Springer, 1982. P. 175–192.
9. Ginsburg A.P. Visual form perception based on biological filtering // Sensory Experience, Adaptation and Perception / Ed. L. Spillmann, B.R. Wooten. Hillsdale, NJ: Lawrence Erlbaum Associates, 1984. P. 53–72.
10. Ginsburg A.P., Evans D.W. Predicting visual illusions from filtered images based upon biological data // J. Opt. Soc. Am. 1979. V. 69. P. 1443–1450.
11. Булатов А.Н., Бертулис А.В., Белявичус А., Булатова Н. Иллюзии длины и их описание на основе центроидной концепции // Сенсорные системы. 2009. Т. 23. № 1. С. 3–12.
12. Di Maio V. Perceptual versus Cognitive processing in visual perception of geometrical figures: A Short review // Sistema nervoso e Riabilitazione. 2000. V. 1. P. 35–44.
13. Булатов А.Н., Бертулис А.В., Мицкене Л.И. Количественные исследования геометрических иллюзий // Сенсорные системы. 1995. Т. 9. № 2–3. С. 79–93.
14. Огнивов В.В., Рожкова Г.И., Токарева В.С., Бастаков В.А. Средняя величина и вариабельность иллюзии Мюллера–Лайера в сравнении с глазомером у детей и взрослых // Сенсорные системы. 2006. Т. 20. № 4. С. 288–299.
15. Carrasco M., Figueroa J.G., Willen J.D. A test of the spatial-frequency explanation of the Müller–Lyer Illusion // Perception. 1986. V. 15. № 5. P. 553–562.
16. Gutauskas A., Bertulis A., Bulatov A. Shape recognition thresholds: Correlation with spatial frequency spectrum of the stimuli // Perception. 1993. V. 22. № 1. P. 99–108.
17. Di Maio V., Lansky P. The Müller–Lyer Illusion in interpolated figures // Perception. Mot. Skills. 1998. V. 87. № 2. P. 499–504.
18. Skottun B.C. Amplitude and phase in the Müller–Lyer illusion // Perception. 2000. V. 29. P. 201–209.
19. Blakemore C., Campbell F.W. On the Existence of Neurons in the Human Visual System Selectivity Sensitive to the Orientation and Size of Retinal Images // J. Physiol. (London). 1969. V. 203. P. 237–260.
20. Tolhurst D.J., Thompson I.D. On the variety of spatial frequency selectivities shown by neurons in area 17 of the cat // Proc. R. Soc. Lond. 1982. V. 213. P. 183–199.
21. DeValois R.L., Albrecht D.G., Thorell L.G. Spatial frequency selectivity of cells in macaque visual cortex // Vision Res. 1982. V. 22. P. 545–559.
22. Bredfeldt C.E., Ringach D.L. Dynamics of Spatial Frequency Tuning in Macaque V1 // The Journal of Neuroscience. 2002. V. 22. № 5. P. 1976–1984.
23. Шелепин Ю.Е. Пространственно-частотные характеристики рецептивных полей нейронов латеральной супрасильвиевой области // Нейрофизиология. 1982. Т. 14. № 6. С. 608–614.
24. Шелепин Ю.Е. Сопоставление топографических и пространственно-частотных характеристик латеральной супрасильвиевой и стриарной коры кошки // Нейрофизиология. 1984. Т. 16. № 1. С. 35–41.
25. Шелепин Ю.Е. Локализация областей зрительной коры кошки, дающих инвариантный ответ при изменении размера изображения // Нейрофизиология. 1973. Т. 5. № 2. С. 115–121.
26. Шелепин Ю.Е. Фильтрационные свойства рецептивных полей нейронов зрительной коры // Доклады АН СССР. 1981. Т. 261. № 6. С. 1506–1509.
27. Шелепин Ю.Е. Колесникова Л.Н. Левкович Ю.И. Визоконтрастометрия (Измерение пространственных передаточных функций зрительной системы). Л.: Наука, 1985. 104 с.
28. Шелепин Ю.Е., Макулов В.Б., Красильников Н.Н., Чихман В.Н., Пронин С.В., Даниличев В.Ф., Коскин С.А. Иконика и методы оценки функциональных возможностей зрительной системы // Сенсорные системы. 1998. № 3. С. 319–328.
29. Шелепин Ю.Е., Чихман В.Н., Фореман Н. Анализ исследований восприятия фрагментированных изображений: целостное восприятие и восприятие по локальным признакам // Физиологический журнал. 2008. Т. 94. № 7. С. 758–776.
30. Шелепин Ю.Е., Чихман В.Н. Локальный и глобальный анализ в зрительной системе // Современная психофизика / Под. ред. Барабанщикова В.А. М.: Институт психологии РАН, 2009. С. 310–335.
31. Carlson C.R., Moeller J.R., Anderson C.H. Visual illusions without low spatial frequencies // Vision. Res. 1984. V. 24. № 10. P. 1407–1413.

“Оптический журнал”, 78, 12, 2011

75