Например, Бобцов

ОПРЕДЕЛЕНИЕ ФУНКЦИИ КОНТРАСТНОЙ ЧУВСТВИТЕЛЬНОСТИ ДЛЯ СИСТЕМ ТЕХНИЧЕСКОГО ЗРЕНИЯ

ОПТИЧЕСКОЕ ПРИБОРОСТРОЕНИЕ
УДК 004.932.2
В. В. БЕЗЗУБИК, Н. Р. БЕЛАШЕНКОВ
ОПРЕДЕЛЕНИЕ ФУНКЦИИ КОНТРАСТНОЙ ЧУВСТВИТЕЛЬНОСТИ ДЛЯ СИСТЕМ ТЕХНИЧЕСКОГО ЗРЕНИЯ
Рассматривается математическая модель определения функции контрастной чувствительности для систем технического зрения, базирующаяся на представлении о работе рецептивных полей зрительной системы человека. Предложена количественная мера контраста цифрового изображения. Приведены результаты сравнительного анализа разработанной модели и экспериментальных данных.
Ключевые слова: цифровое изображение, мера контраста, функция контрастной чувствительности, зрительная система человека, системы технического зрения, искусственный интеллект.
Введение. На вопрос о том, можно ли машину научить воспринимать окружающий мир так же, как его воспринимает человек, в конце прошлого века был получен положительный ответ. Причем этот ответ был дан не писателями-фантастами, а физиками и инженерами, создавшими разнообразные высокочувствительные датчики для регистрации акустических сигналов (слух) и определения состава газов и жидкостей (обоняние и вкус), а также пьезоэлектрические преобразователи (осязание) и матричные фотоэлектронные приемники (зрение). Однако установление связи между восприятием явлений и созданием их чувственных образов — по-прежнему чрезвычайно трудная задача. Сложнейшие нейрофизиологические механизмы формирования виртуальной реальности в человеческом мозге на основе сигналов, поступающих в него от органов чувств, являются предметом изучения современной науки. Нужно ли человеку создавать искусственный интеллект, который обрабатывает поступающую информацию аналогично его собственному? Если мы стремимся к тому, чтобы реакция машин на окружающую реальность была подобна человеческой, то да, нужно.
В настоящей статье рассматривается частный случай работы системы технического зрения с позиции ее адекватности зрительной системе человека.
Постановка задачи. Одной из важнейших характеристик зрительной системы человека является ее контрастная чувствительность. Эта характеристика определяет способность наблюдателя воспринимать детали изображения с различными угловыми размерами при разной относительной освещенности. Функция контрастной чувствительности (ФКЧ) тесно связана с понятием остроты зрения. Хорошо известно, что одним людям присуща способность различать предметы, которые не воспринимаются другими. Эта способность определяется особенностями зрения, связанными с наличием или отсутствием дефектов оптического тракта зрительной системы. Но даже у человека с идеальным оптическим трактом острота зрения варьируется в широких пределах. Объяснение этому факту в рамках оптической парадигмы найти сложно. Для построения теории зрительного восприятия необходимо детально рассмотреть
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 9

74 В. В. Беззубик, Н. Р. Белашенков
особенности строения сетчатки глаза, определить роль и значение отдельных ее клеток и установить связи между ними.
В настоящей статье представлена математическая модель для определения ФКЧ системы технического зрения, в максимальной степени приближенной к ФКЧ зрительной системы человека. На примере матричных фотоэлектронных приемников, входящих в состав систем технического зрения, рассматриваются алгоритмы обработки и анализа цифровых изображений, наиболее полно соответствующие функциям зрительной системы человека. Для решения этой задачи введено понятие искусственных рецептивных полей и аналогов ганглиозных клеток сетчатки глаза человека как интерфейса между матричным фотоэлектронным приемником изображения и искусственным интеллектом, выполнено моделирование их функций и установлена природа различий в особенностях центрального и периферического зрения.
Описание метода. Прежде чем сформулировать базовые принципы теории контрастной чувствительности применительно к системе технического зрения, следует определиться с понятием меры контраста. Авторы многочисленных работ, посвященных анализу цифровых изображений, эту величину определяют по-разному. В классической работе [1] понятие глобального контраста было введено для изображений интерференционной картины, затем были сформулированы определения локальных контрастов [2], которые в той или иной степени соответствовали требованиям, предъявляемым к оценке качества цифровых изображений.
Наиболее широко применяемым определением стала формула для расчета меры контраста K , учитывающая статистические параметры яркости Ii, j пикселов изображения в виде
отношения дисперсии σ яркостей пикселов изображения к их среднему значению µ [3]:

K = σ; σ= µ

PQ
∑ ∑(Ii, j −µ) 2

PQ
∑ ∑ Ii, j

i=1 j=1
PQ

;

µ

=

i=1 j=1
PQ

,

(1)

где P и Q — число пикселов изображения по горизонтали и вертикали соответственно.
Для большинства практических задач такое определение меры контраста вполне приемлемо, однако степень его соответствия контрасту изображения, воспринимаемому глазом человека, может быть подвергнута сомнению. Например, если рассматривать изображение как двумерный массив пикселов с различной яркостью, рассчитать меру его контраста K , а затем хаотически перераспределить пикселы в пределах изображения, не изменяя их яркость, то результат расчета параметра K окажется одинаковым, несмотря на то что первоначально информативное изображение в результате пространственного перераспределения пикселов обратится в шум.
В работе [4] впервые была отмечена необходимость учитывать связь между мерой контраста цифрового изображения и ФКЧ зрительной системы человека. В этой работе было введено понятие меры локального контраста для различных диапазонов пространственных частот (local band-limited contrast), при вычислении которой осуществлялся переход в пространство фурье-образов изображений. Результаты работы [4] послужили теоретическим базисом для последующих исследований, открывших ряд закономерностей восприятия изображения человеком, однако предложенный в ней подход представляется неоптимальным, так как фурье-анализ сложно соотнести с механизмом работы клеточных структур сетчатки глаза, которые вряд-ли могут выполнять операции сложнее, чем сложение и вычитание аналоговых сигналов.
Как известно [5], физиология зрительного восприятия у человека основана на передаче сигналов от фоторецепторов, в роли которых выступают особые клетки — палочки и колбочки, к ганглиозным клеткам сетчатки и далее по зрительному нерву в мозг. В сетчатке глаза

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 9

Определение функции контрастной чувствительности для систем технического зрения 75
обычно насчитывается до 125 млн. фоторецепторов и порядка 1 млн. ганглиозных клеток, каждая из которых соединена с фиксированной группой фоторецепторов. Эта группа образует рецептивное поле ганглиозной клетки. Рецептивные поля в сетчатке имеют преимущественно круглую форму и различные размеры (разное число входящих в него клеток), причем в центре сетчатки, где отмечается наибольшая контрастная чувствительность, размер полей минимальный. Каждое рецептивное поле состоит из двух зон с противоположной реакцией на возбуждающий стимул. Соотношение размеров этих зон, как следует из работы [5], приблизительно равно 1:3. Отклик зрительной системы человека складывается из реакций отдельных ганглиозных клеток, рецептивные поля которых пересекаются. Человек, таким образом, способен различать перепады яркости в изображении, проецируемом на сетчатку оптической системой глаза.
В ходе исследований было принято определение меры контраста, приведенное в работах [2, 6], существенным образом модифицированное с учетом представлений о механизмах восприятия изображения [5]. На основе разработанной модели проанализируем цифровое изображение в системе технического зрения с элементами искусственного интеллекта, так же как это происходит в зрительной системе человека.
Рассмотрим цифровое полутоновое изображение I размером P × Q пикселов. Опреде-
лим меру локального контраста для выбранного пиксела с координатами i, j как результат
двумерной свертки функции I с ядром H , представляющим собой квадратную матрицу размером Ns × Ns элементов, где Ns — нечетное число:

n=( Ns −1)/2 m=( Ns −1)/2

∑ ∑ Ii+n, j+mHn,m

∑Si, j = n=(1−Ns )/2 m=(1−Ns )/2 Ii+n, j+m

.

n,m∀ n2 +m2 ≤(Ns −1)/2

(2)

Знаменатель выражения (2) представляет собой суммарную яркость изображения в пре-
делах окрестности, ограниченной радиусом (Ns −1) / 2 .
Будем полагать, что ядро H описывается выражением

⎪⎧H + = 1,

Hn,m = ⎨⎪H − = −w,

⎪ ⎩⎪H

0

=

0,

n2 + m2 ≤ (Nc −1) / 2; (Nc −1) / 2 < n2 + m2 ≤ (Ns −1) / 2;
n2 + m2 > (Ns −1) / 2

(3)

и состоит из двух областей с ненулевыми значениями элементов, а именно — из центральной
области в виде круга, ограниченного радиусом (Nc −1) / 2 , с элементами H + и кольцевой об-
ласти, ограниченной радиусами (Nc −1) / 2 и (Ns −1) / 2 , с элементами H − . Величина w рассчитывается как отношение числа элементов, входящих в круговую область, к числу элементов, входящих в кольцевую область: w = NH + NH − . Этим обеспечивается равенство нулю суммы всех элементов ядра:

n=( Ns −1)/2 m=( Ns −1)/2
∑ ∑ Hn,m = 0 .
n=(1−Ns )/2 m=(1−Ns )/2

(4)

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 9

76 В. В. Беззубик, Н. Р. Белашенков
Требование, накладываемое условием (4), вполне объяснимо, если учитывать, что контраст области изображения с равномерной яркостью должен быть равен нулю.
Выбор ядра H в виде, описываемом формулой (3), таким образом, отвечает известным из литературы сведениям о структуре рецептивных полей сетчатки глаза человека.
Определим количественную меру контраста изображения как среднее значение локальных контрастов:

PQ

∑ ∑ Si, j

S

=

i=1

j=1
PQ

.

Результаты исследования и обсуждение. В качестве модельных изображений для анализа были выбраны периодические последовательности темных и светлых полос равной ширины с различными пространственными частотами и относительной яркостью. Были проанализированы два типа модельных изображений: с прямоугольным и синусоидальным профи-
лями яркости. Максимальная яркость „темных“ полос Id изменялась от 0 до 127, а „светлых“
Ib — от 255 до 128. Контраст полос модельных изображений во всех случаях определялся по формуле

C

=

Ib Ib

− Id + Id

,

а пространственная частота полос F равнялась обратной величине периода. Для каждого изображения пространственная частота полос F изменялась в диапазоне от
1 до 100 периодов/мм. Полагая, что размер a пиксела цифрового изображения примерно соответствует размеру фоторецептора сетчатки глаза человека (2,5 мкм), для указанных диапазонов изменения параметров можно осуществить корректное сопоставление результатов проведенного моделирования с результатами исследований контрастной чувствительности зрительной системы человека, полученными экспериментальными путем.
На рис. 1, а представлены фрагменты I — III модельного изображения с максимальным контрастом и различными пространственными частотами полос, где показаны области ядра
свертки с элементами H + и H − , ограниченные концентрическими окружностями, и графики
изменения меры контраста S j изображения в направлении, перпендикулярном расположе-

нию полос (сплошные линии), а также ее средние значения SI , SII и SIII (штриховые линии).
Результаты расчета меры контраста S в зависимости от изменения контраста C и пространственной частоты F модельного изображения с прямоугольным профилем яркости полос приведены на рис. 1, б. На графике показана также линия равных значений величины S по уровню 0,4 % относительно максимального значения. Если предположить, что зрительная система человека способна различать изменения контраста наблюдаемых изображений, соответствующие единице градации яркости 8-битового изображения, то указанная изолиния на графике — есть ФКЧ системы технического зрения.
Сравним полученный результат с экспериментальными данными, опубликованными в работе [7], которая, по-видимому, является наиболее полным и достоверным исследованием, посвященным изучению ФКЧ зрительной системы человека.
Результат сравнения представлен на рис. 2. При расчетах были использованы аналогичные описанным в работе [7] модельные изображения с прямоугольным (□) и синусоидальным (○) профилем яркости полос для различных пространственных частот. Анализ рисунка показывает,
что результаты расчета по предложенной модели с параметрами Nc = 15 и Ns = 45 (сплошная и

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 9

Определение функции контрастной чувствительности для систем технического зрения 77

штриховая линии) практически совпадают с экспериментальными данными. При наложении расчетных кривых, полученных описанным выше методом, на экспериментальные [7] учтено, что пространственная частота, выраженная в периодах на миллиметр, приблизительно в 3,5 раза больше, чем пространственная частота, выраженная в периодах на градус.

а) Sj

I

II Sj

III Sj

0

SIj 0

SII j0

SIIIj

б) S

0,004

С
С–1 1000

SII SI
Рис. 1

SIII

100

10

F

0,1 1

10 F, период/град

Рис. 2

Важно отметить, что разработанная модель не только с высокой степенью соответствия описывает характер ФКЧ зрительной системы человека, но и позволяет выявить различия в поведении ФКЧ для модельных изображений с разными профилями яркости полос в области низких пространственных частот. Как видно из рис. 2, на этих частотах ФКЧ системы технического зрения для изображений с синусоидальным профилем полос достигает выбранного
порога чувствительности, равного 0,4 %, при бóльших значениях контраста C , чем для изо-
бражений с прямоугольным профилем. Такая же закономерность отмечена и в работе [7] для зрительной системы человека.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 9

78 В. В. Беззубик, Н. Р. Белашенков Чтобы подчеркнуть принципиальное различие определений мер контраста S и K, в ка-
честве иллюстрации на рис. 3 приведены результаты расчета ФКЧ системы технического зрения, полученные на их основе: кривые 1 и 2 получены для S, 3 и 4 — для K; кривые 1 и 3 рассчитаны для модельных изображений с прямоугольным профилем яркости полос, а кривые 2 и 4 — для изображений с синусоидальным профилем.
С 0,001
4 3 0,01
0,1 1 2

1 10 100 F, период/мм

Рис. 3

Применим предложенный метод анализа для изучения ФКЧ системы технического зре-

ния. На рис. 4, а, б приведены результаты расчетов для модельных изображений с прямо-

угольным профилем яркости полос при изменении значений параметров Nc и Ns .

а) С

б) С

0,001

0,001

0,01 0,01

0,1 1 — Nc Ns = 15 45 ,

3 2 0,1 1 1 — Nc Ns = 15 45 ,

3 2 1

2 — Nc Ns = 11 33 ,

2 — Nc Ns = 19 45 ,

3 — Nc Ns = 7 21

3 — Nc Ns = 11 45

1

10 F, период/мм

1

10 F, период/мм

Рис. 4
Анализ рис. 4, а показывает, что уменьшение значений Ns при постоянном отношении

Nc Ns = 1 3 приводит к смещению максимума ФКЧ по оси F в высокочастотную область
спектра. Этот результат хорошо согласуется с результатами нейрофизиологических исследований зрительной системы человека, из которых следует, что размеры рецептивных полей в

центральной области сетчатки, отвечающей за наилучшую остроту зрения, минимальны [5].

Расчеты показывают также, что существует связь между пространственной частотой Fmax модельных изображений, соответствующей максимуму ФКЧ, и размером рецептивного поля:

Fmax



3 2Nsa

.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 9

Определение функции контрастной чувствительности для систем технического зрения 79
Изменения Nc при постоянном значении Ns (см. рис. 4, б) оказывают влияние на ФКЧ только в области высоких пространственных частот. Наблюдаемый немонотонный характер изменения ФКЧ в этой области можно объяснить возникновением резонансных эффектов, присущих дискретной пространственной структуре цифрового изображения. Кроме того, в высокочастотной области спектра ширина полос модельных изображений не может изменяться непрерывно.
Заключение. Результаты проведенных исследований позволяют сделать вывод о том, что описанная в статье модель определения ФКЧ системы технического зрения наилучшим образом соответствует экспериментальным данным, полученным в работах, посвященных исследованиям ФКЧ зрительной системы человека. Показано, что наибольшая контрастная чувствительность системы технического зрения достигается для периодических изображений в диапазоне пространственных частот от 10 до 12 периодов/мм (от 3 до 3,5 периодов/град) при выборе размера „рецептивного поля“ Ns , равного 45 пкс. Уменьшение размера „рецептивных полей“ приводит к увеличению „остроты зрения“ технической системы. Использование на практике предложенного алгоритма обработки цифровых изображений позволяет открыть новые возможности для создания роботизированных комплексов с реакцией „зрительного восприятия“, подобной человеческой.
Статья подготовлена по результатам работы, выполненной при финансовой поддержке Министерства образования и науки Российской Федерации, проект № 02.G25.31.0092.

СПИСОК ЛИТЕРАТУРЫ

1. Michelson A. Studies in Optics. Il., USA: Univ. of Chicago Press, 1927.

2. Gordon R., Rangayyan R. M. Feature enhancement of film mammograms using fixed and adaptive neighborhoods // Applied Optics. 1984. Vol. 23, N 4. P. 560—564.

3. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2005.

4. Eli Peli. Contrast in complex images // JOSA-A. 1990. Vol. 7, N 10. P. 2032—2040.

5. Хьюбел Д. Глаз, мозг, зрение. М.: Мир, 2003.

6. Beghdadi A., Negrate A. Contrast enhancement technique based on local detection of edges // Computer Vision, Graphics, and Image Processing. 1989. Vol. 46. P. 162—174.

7. Campbell F. W., Robson J. G. Application of Fourier analysis to the visibility of gratings // J. Physiology. 1968. Vol. 197. P. 551—566.

Виталий Вениаминович Беззубик Николай Романович Белашенков

Сведения об авторах — Санкт-Петербургский национальный исследовательский универси-
тет информационных технологий, механики и оптики, кафедра лазерной техники и биомедицинской оптики; ведущий инженер; E-mail: bezzubik@mail.ru — канд. физ.-мат. наук; Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, кафедра лазерной техники и биомедицинской оптики; E-mail: belashenkov@gmail.com

Рекомендована кафедрой лазерной техники и биомедицинской оптики

Поступила в редакцию 26.04.13 г.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2013. Т. 56, № 9