Например, Бобцов

Пространственная избирательность зрительных механизмов, чувствительных к модуляции контраста

УДК 159.938 + 612.84
ПРОСТРАНСТВЕННАЯ ИЗБИРАТЕЛЬНОСТЬ ЗРИТЕЛЬНЫХ МЕХАНИЗМОВ, ЧУВСТВИТЕЛЬНЫХ К МОДУЛЯЦИИ КОНТРАСТА

© 2011 г. В. В. Бабенко, доктор биол. наук; Д. В. Явна; А. А. Соловьев; М. Б. Мифтахова Южный федеральный университет, г. Ростов-на-Дону Е-mail: babenko@sfedu.ru

Работа посвящена исследованию параметров пространственной настройки зрительных механизмов, чувствительных к модуляции контраста. Определялись полосы настройки на пространственную частоту, фазу и ориентацию огибающей. Для решения данной задачи использовалась парадигма маскировки. Обнаружено, что по всем указанным параметрам имеет место полосовая настройка. Ширина полос пропускания в задаче обнаружения модуляции контраста оказалась несколько шире, чем для механизмов, чувствительных к модуляциям яркости.

Ключевые слова: модуляция контраста, порог, пространственная частота, фаза, ориентация, настройка, полоса.

Коды OCIS: 330.5510.

Поступила в редакцию 09.02.2011.

Исследования зрительного восприятия имеют более чем вековую историю. Однако действительный прорыв в этом направлении произошел в середине прошлого века, когда были предложены новые нейрофизиологические и психофизические методики исследования начальных стадий обработки зрительной информации. В результате были определены передаточные характеристики зрительной системы человека [1] и получены доказательства ее многоканальности [2]. Последующее изучение пространственной избирательности зрительных путей и определение их настроечных характеристик [3–5] позволили перейти к созданию моделей раннего зрения [6, 7]. В результате начальный этап зрительной обработки представлялся в виде набора параллельных линейных фильтров, чувствительных к градиентам яркости и избирательных к их локализации, ориентации и пространственной частоте. В качестве таких фильтров рассматривались простые стриарные нейроны. И хотя психофизические показатели характеризуют одновременную работу множества параллельных путей от сетчатки до коры, эти показатели
Примечание. Статья является развитием доклада “Настройка зрительных фильтров второго порядка на ориентацию огибающей”, представленного на конференции “Прикладная оптика – 2010”.

достаточно близко совпадали с параметрами избирательности отдельных стриарных нейронов [8, 9].
Однако впоследствии выяснилось, что далеко не все, даже весьма простые, зрительные задачи могут быть решены с помощью такой системы фильтров. На рис. 1 приведены изображения случайно-точечных паттернов, модулированных по яркости (а) и по контрасту (б). Наша зрительная система легко обнаруживает обе модуляции. Но если изменения яркости действительно могут быть обнаружены рассмотренными выше механизмами, то изменения контраста остаются ими незамеченными. Это происходит потому, что суммарная энергия стимула внутри антагонистических субполей остается неизменной. Такая задача может быть решена лишь путем пространственного объединения и сравнения выходов соседних фильтров. Было получено и множество других фактов, объяснить которые позволяла лишь операция пространственного группирования. В результате родился термин “фильтры второго порядка”.
Согласно существующим сегодня представлениям зрительная обработка начинается с локальной линейной фильтрации, в результате которой описывается несущая (признаки локальных элементов изображения). Выходы

10 “Оптический журнал”, 78, 12, 2011

(а) (б)

Рис. 1. Случайно-точечные паттерны, модулированные по яркости (а) и по контрасту (б).

этих фильтров подвергаются нелинейным преобразованиям (полу- или полноволновое выпрямление) и объединяются на операторах следующего уровня. Эти фильтры второго порядка обеспечивают описание огибающей (пространственные модуляции признаков).
Чтобы выделить информацию о характеристиках огибающей, фильтры второго порядка должны быть избирательны к ее параметрам. И действительно было показано, что они чувствительны к ориентации огибающей [10] и ее пространственной частоте [11].
Однако для создания математической модели зрительных механизмов второго порядка простой констатации их пространственной избирательности недостаточно. Необходимо определение полос настройки фильтров. Это и стало целью нашего исследования. Мы исследовали настроечные характеристики фильтров второго порядка, чувствительных к модуляции контраста. Для решения поставленной задачи была использована парадигма маскировки.
При этом необходимо было решить ряд методических проблем. Во-первых, при модуляции контраста несущей не должны меняться спектральные характеристики стимула. В противном случае эти изменения будут обнаруживаться уже фильтрами первого порядка. Именно по этой причине невозможно использовать в качестве несущей такой общепринятый стимул, как синусоидальная решетка. Если

в качестве несущей использовать случайноточечный паттерн, то его контрастная модуляция не меняет исходный спектр, поскольку он включает фактически все частоты. Однако воздействие такой маски на фильтры первого порядка настолько велико, что оказывается сложным вычленить ее влияние на фильтры второго порядка. Использование в качестве несущей отфильтрованного полосового шума снижает воздействие маски на фильтры первого порядка, но проблема разделения влияний сохраняется. Отсюда следует, что необходимы такие паттерны, которые при модуляции контраста не меняют исходный спектр, а их маскирующий эффект направлен именно на фильтры второго порядка. Мы сформировали такой паттерн, что и позволило решить поставленную задачу.
Методика экспериментов
Аппаратура. Основу экспериментальной установки составлял персональный компьютер с процессором Intel Celeron 2,5 гГц, видеоадаптером Intel Graphics Media Accelerator 900 и монитором LG Flatron FT 775 с диагональю 17”. Размер экрана в пикселах составлял 1024×768, размер зерна – 0,24 мм, частота кадровой развертки – 85 Гц. Применялся режим, позволяющий использовать 256 градаций серого. Монитор был откалиброван с помощью люксметра.

“Оптический журнал”, 78, 12, 2011

11

Стимуляция. В качестве стимулов были использованы шахматные текстуры, составленные из габоровских микропаттернов, которые описываются формулой
Gλθϕσγ (x, y) =
(( ) )= exp x′2 + γ2y′2 /2σ2 cos(2πx′/λ + ϕ),
где x′ = xcosθ + ysinθ,
y′= −xsinθ + ycosθ,
( )σ = λ (ln2/2 2b +1)/ (2b −1)π .
Здесь σ – стандартное отклонение гауссовой составляющей, λ – длина волны косинусоидальной составляющей ядра, θ – ориентация микропаттерна, ϕ – фазовый сдвиг косинусоидальной составляющей, γ “эллиптичность” гауссовой составляющей, b – полоса пропускания пространственной частоты.
В исходной текстуре ориентация элементов была вертикальной, а контраст составлял 0,44. Микропаттерны размещались по всему экрану монитора в шахматном порядке по центру нечетных клеток. Размер условных клеток шахматного поля составлял 0,44°×0,44°. Основная пространственная частота несущей (функция изменения яркости в исходной текстуре вдоль горизонтальной оси) составляла 3,5 цикл/град.
Тестовая текстура формировалась путем модуляции контраста элементов исходной текстуры. Модуляция производилась путем перемножения несущей и огибающей (двумерная синусоидальная функция модуляции контраста; ось модуляции перпендикулярна ориента-
(а)

ции микропаттернов). Амплитуда огибающей плавно снижалась к краям экрана в результате ее умножения на двумерную полуволну косинусоиды. Пространственная частота огибающей составляла 0,3 цикл/град. Огибающая не вносила существенных изменений в спектр стимула: изменение суммарного спектра при максимальной амплитуде модуляции не превышало 5%, центральная частота не менялась. Амплитуда модуляции контраста (диапазон изменения контраста в текстуре от исходного до максимального и минимального значений) в тестовой текстуре была переменной и изменялась от 0 до 1,5 дБ с шагом 0,1 дБ.
Маска формировалась путем перемещения микропаттернов из нечетных в четные клетки условного шахматного поля. Такая исходная маска по всем параметрам соответствовала тестовой текстуре (на графиках рис. 3–5 пороговые значения, полученные при использовании этой маски, обозначены на оси абсцисс цифрой 0).
В зависимости от задачи эксперимента в исходной маске менялись пространственная частота, фаза или ориентация модуляции. В эксперименте 1 пространственная частота маски увеличивалась и уменьшалась на 2 октавы с шагом в 1 октаву. В эксперименте 2 фаза маски смещалась относительно теста с шагом 0,25π до максимально возможного сдвига в 1π. В эксперименте 3 изменялась ориентация оси функции модуляции от горизонтальной до вертикальной с шагом 22,5°. Амплитуда модуляции контраста во всех масках была максимальной (1,5 дБ). Примеры использованных текстур показаны на рис. 2. Фоновая яркость экрана поддерживалась на уровне 135 кд/м2.
(б)

Рис. 2. Примеры использованных текстур. а – тестовая текстура, б – одна из маскирующих текстур (сдвиг ориентации огибающей на 45°).
12 “Оптический журнал”, 78, 12, 2011

Процедура. Испытуемые располагались на расстоянии 130 см от экрана монитора. При этом угловые размеры экрана составляли 14°×10,5°. Для определения пороговой амплитуды модуляции контраста использовалась процедура двухальтернативного вынужденного выбора. В каждом из двух временных окон, разделенных интервалом 750 мс, предъявлялась сначала тестовая, а затем маскирующая текстура. Длительность теста составляла 200 мс, длительность маски – также 200 мс. В одном из этих окон тестовая текстура была модулирована, в другом – нет. Фаза огибающей в каждом предъявлении случайным образом сдвигалась на 0,25π, 0, +0,25π параллельно в тесте и маске. Нажатием соответствующей клавиши испытуемый сообщал о том, в каком из временных окон тестовая текстура была модулированной.
Каждый из трех экспериментов включал 5 тестов соответственно числу масок. Порядок следования тестов носил случайный характер. Для каждого испытуемого по каждому тесту усреднялись результаты не менее 20 проб. При

этом результаты первых 3–4 проб не учитывались.
Испытуемые. В экспериментах приняли участие 3 испытуемых в возрасте от 20 до 30 лет с нормальным или корригируемым до 1 зрением. Все испытуемые были проинформированы о процедуре проводимых испытаний, убеждались в безопасности экспериментов для здоровья и давали согласие на участие в исследованиях. Исследования выполнялись с соблюдением этических норм.
Результаты экспериментов и их обсуждение
Избирательность к пространственной частоте огибающей
На рис. 3 показаны зависимости, отражающие изменение пороговой амплитуды модуляции (АМпор) при расхождении пространственной частоты (Δf) тестового и маскирующего стимулов. Наибольшая маскировка обеспечивается маской, совпадающей с тестовой тексту-

(а) ММБ
–2 –1

0,90 АМпор, дБ 0,80

0,70

0,60

0,50 0

12 Δf, октавы

(б) ЯДВ 0,90 АМпор, дБ
0,80
0,70

0,60

0,50

–2 –1 0

12

Δf, октавы

(в) САА

0,90 АМпор, дБ
0,80

0,70

(г)

ММБ

ССА ЯДВ

0,60

–2 –1

0

12 Δf, октавы

–2

–1

0

12 Δf, октавы

Рис. 3. Зависимости пороговой амплитуды модуляции контраста от расхождения теста и маски по пространственной частоте огибающей для трех испытуемых (а, б, в). По оси абсцисс – сдвиг изменяемого параметра маски относительно теста, по оси ординат – пороговая амплитуда модуляции. На графиках, отражающих индивидуальные результаты, вертикальными линиями показаны доверительные интервалы. г – суперпозиция результатов; точечным пунктиром показаны значения, используемые для определения полосы настройки.

“Оптический журнал”, 78, 12, 2011

13

рой по пространственной частоте. Увеличение или уменьшение частоты огибающей в маске (при неизменной частоте теста) приводит к выраженному снижению маскирующего эффекта. Статистически значимое снижение порога наблюдается при расхождении частот уже на 2 октавы.
Таким образом, все испытуемые имели полосовую настройку зрительных механизмов на пространственную частоту модуляции контраста. Причем характеристики полученных кривых весьма сходны, что иллюстрируется их суперпозицией (при наложении значений, отражающих минимальную маскировку – при снижении частоты маски на 2 октавы).
Стандартная процедура определения полосы пропускания фильтра на середине разницы между минимальным и максимальным значениями порога позволила установить, что полоса настройки фильтров второго порядка на пространственную частоту составляет около 1,5 октав: 0,6–0,7 октавы в сторону снижения пространственной частоты и 0,7–0,8 октавы в сторону ее увеличения. Полученные результаты указывают на достаточно узкую избирательность фильтров второго порядка к пространственной частоте модуляции контра-

ста. Однако она несколько шире аналогичных значений, полученных для фильтров второго порядка, избирательных к пространственной частоте модуляции яркости.
Вместе с тем обращают на себя внимание более высокие значения порога при увеличении частоты маски на 2 октавы по сравнению с симметричными значениями. Это может быть связано с эффектами тормозного взаимодействия между фильтрами второго порядка, настроенными на близкие частоты модуляции. Точнее, речь может идти об однонаправленном торможении со стороны фильтров, избирательных к более высокой пространственной частоте модуляции контраста.
Избирательность к фазе огибающей
Сдвиг фазы огибающей в маскирующем стимуле относительно огибающей в тестовой текстуре приводит к снижению порога обнаружения модуляции. Снижение продолжается до тех пор, пока тест и маска не оказываются в противофазе (сдвиг фазы на 1,0π). Полученные результаты представлены на рис. 4. У испытуемого ММБ достоверное снижение порогов наблюдается при относительном сдвиге

(а)
1,00
0,90

АМпор, дБ ММБ

0,80

0,70

0,60

0,50 0

0,25 0,5

(б)
0,70

0,60 0,50

0,75 1 Δϕ, π

0,40 0

ЯДВ
0,25 0,5 0,75

1

(в)
1,10
1,00 0,90
0,80 0,70
0

САА
0,25 0,5 0,75

(г)
1,00 0,90
0,80 0,70 0,60 1 0,50 0

y = –0,16x + 1,0

y = –0,16x + 0,8

y = –0,16x + 0,6

0,25 0,5 0,75

1

Рис. 4. Зависимости пороговой амплитуды модуляции контраста от расхождения теста и маски по фазе огибающей (а, б, в). г – суперпозиция результатов; формулы описывают линии тренда.

14 “Оптический журнал”, 78, 12, 2011

фазы Δϕ уже на 0,5π, у испытуемого ЯДВ – на 0,75π, а у САА – на 1,0π. Это может указывать на разную чувствительность испытуемых к фазовым сдвигам модуляции контраста.
Однако если мы построим линии тренда для каждой полученной зависимости, то окажется, что эти линейные функции имеют одинаковый наклон (см. уравнения на графике). При этом у всех испытуемых порог снижается наполовину при расхождении фаз на 0,5π. Это позволяет сделать вывод, что полоса пропускания фильтров второго порядка по фазе в среднем составляет примерно ±0,5π.
Изменение фазовых характеристик периодических стимулов часто рассматривается как синоним изменения локализации. В этом случае избирательность к фазе выступает в качестве интегральной характеристики исследуемого механизма, поскольку решение о смещении стимула принимается системой на основе анализа ответов множества операторов. В наших экспериментах сдвиг фазы не сопровождался смещением маски относительно теста. Это позволило, во-первых, оценить именно фазовую чувствительность механизма, а вовторых, получить подтверждение линейности

фильтров второго порядка, на что указывается в ряде моделей данного механизма [см., например, 12].
Избирательность к ориентации огибающей
Что касается избирательности к ориентации огибающей, то мы получили неоднозначные результаты (рис. 5). Два испытуемых демонстрируют весьма выраженную избирательность, тогда как третий – ее отсутствие.
Наличие избирательности к ориентации градиента контраста может свидетельствовать о том, что исследуемые фильтры имеют вытянутые рецептивные поля, построенные по оппонентному принципу. Отсутствие избирательности, напротив, скорее указывает на концентрическую организацию их рецептивных полей. Можно ли предположить, что у разных испытуемых действуют разные правила объединения фильтров первого порядка? Это выглядит маловероятным.
Более логичным представляется другое объяснение. По всей видимости, исследуемый нами уровень пространственного группирования зрительной информации не является

(а)
0,90 0,80

АМпор, дБ

ММБ

(б)
0,90 0,80

ЯДВ

0,70 0,70

0.60 0.60

0,50 0,50

0,40 0 22,5 45 67,5 90

0,40 0

22,5 45 67,5 90

Δθ, угл. град

(в)
1,10 1,00 0,90 0,80 0,70 0,60 0,50 0

САА
22,5 45

(г)

67,5 90

0

22,5 45

67,5 90

Рис. 5. Зависимости пороговой амплитуды модуляции контраста от расхождения теста и маски по ориентации огибающей (а, б, в). г – суперпозиция результатов.

“Оптический журнал”, 78, 12, 2011

15

последним. На этот счет уже высказывались предположения [13]. В одной из своих работ мы также обосновываем целесообразность объединения выходов фильтров второго порядка, настроенных на разные ориентации огибающей [14]. Именно эта операция позволяет дать полное описание выделенного объекта. Данное предположение позволяет взглянуть на результаты ЯДВ по-иному. Отсутствие избирательности к ориентации может быть обусловлено влиянием на полученный результат следующей стадии обработки, на которой осуществляется объединение ориентационноизбирательных фильтров. Однако ответить на вопрос, почему эта операция по-разному влияет на результаты разных испытуемых, на данном этапе работы не представляется возможным.
Если исходить из предположения, что фильтры второго порядка действительно избирательны к ориентации, но это не всегда обнаруживается экспериментально (возможно, в силу методических причин), то вопрос о полосе пропускания этих фильтров остается актуальным.

Рассмотрим результаты двух испытуемых, демонстрирующих такую избирательность. Их суперпозиция путем совмещения минимальных значений порога позволяет определить полосу пропускания. Она приблизительно равна ±22,5°.
Заключение
В результате проведенного исследования установлено, что зрительные механизмы второго порядка, чувствительные к модуляции контраста, избирательны к пространственной частоте, фазе и ориентации огибающей. Это подтверждает многоканальность стадии пространственного группирования локальной зрительной информации. Определены также характеристики пространственной настройки этих фильтров. Их полосы пропускания оказались несколько шире аналогичных полос для фильтров первого порядка. Полученные результаты являются необходимым звеном в создании математической модели зрительных механизмов второго порядка.

** ** *

ЛИТЕРАТУРА
1. Van Nes F.L., Bouman M.A. Spatial modulation transfer in the human eye // J. Opt. Soc. Amer. 1967. V. 57. P. 401–406.
2. Blakemore C., Campbell F.W. On the existence of neurons in the human visual system selectively sensitive to the orientation and size of retinal images // J. Physiol. 1969. V. 203. P. 237–269.
3. Mostafavi H., Sakrison D.J. Structure and properties of a single channel in the human visual system // Vision Res. 1976. V. 16. P. 957–968.
4. Legge G.E., Foley J.M. Contrast masking in human vision // J. Opt. Soc. Amer. 1980. V. 70. № 12. P. 1458– 1471.
5. Burr D.C. Sensitivity of spatial phase // Vision Res. 1980. V. 20. P. 391–396.
6. Sachs M.B., Nachmias J., Robson J.G. Spatial-frequency channels in human vision // J. Opt. Soc. Amer. 1971. V. 61. P. 1176–1186.
7. Глезер В.Д. Зрение и мышление. Л.: Наука, 1985. 246 с.
8. De Valois R.L., Albrecht D.G., Thorell L.G. Spatial frequency selectivity of cells in macaque visual cortex // Vision Res. 1982. V. 22. P. 545–549.
9. Blake R., Holopigian K. Orientation selectivity in cats and humans assessed by masking // Vision Res. 1985. V. 25. P. 1459–1467.
10. Ellemberg D., Allen H.A., Hess R.F. Second-order spatial frequency and orientation channels in human vision // Vision Res. 2006. V. 46. № 17. P. 2798–2803.
11. Landy M.S., Henry C.A. Critical-band masking estimation of 2nd-order filter properties // Perception. 2007. V. 36. Suppl. P. 61.
12. Sutter A., Beck J., Graham N. Contrast and spatial variables in texture segregation: testing a simple spatialfrequency channels model // Percept. Psychophys. 1989. V. 46. № 4. P. 312–332.
13. Arsenault A.S., Wilkinson F., Kingdom F.A. Modulation frequency and orientation tuning of second-order texture mechanisms // J. Opt. Soc. Am. A Opt. Image Sci. Vis. 1999. V. 16. № 3. P. 427–435.
14. Бабенко В.В., Кульба С.Н. Модель механизма зрительной сегментации // Сенсорные системы. 2002. Т. 16. № 3. С. 179–189.

16 “Оптический журнал”, 78, 12, 2011