Например, Бобцов

Использование сегментации для автоматизация дешифрирования многоспектральных изображений

УДК 519.681
ИСПОЛЬЗОВАНИЕ СЕГМЕНТАЦИИ ДЛЯ АВТОМАТИЗАЦИИ ДЕШИФРИРОВАНИЯ МНОГОСПЕКТРАЛЬНЫХ ИЗОБРАЖЕНИЙ

© 2009 г. Р. М. Алеев*, доктор техн. наук; В. Б. Фофанов**, канд. техн. наук ** ПО “УОМЗ”, филиал “УОМЗ–Институт прикладной оптики”, г. Казань ** E-mail: optooil@tbit.ru; ** Казанский государственный университет, г. Казань ** E-mail: Viatcheslav.Fofanov@ksu.ru

Исследуются возможности сегментации зон интереса по многоспектральным изображениям применительно к двум математическим моделям сцены. Показано, что применение необоснованных предположений при построении модели может привести к получению ложных сведений о сцене. Приведены результаты компьютерных экспериментов по сегментации зон интереса с использованием трехспектральных изображений.

Ключевые слова: автоматизация дешифрирования, модели сцены, зоны интереса, многоспектральные изображения, сементация сцены.

Коды OCIS: 100.0100.

Поступила в редакцию 18.03.2009.

Введение
Обязательным этапом автоматизации дешифрирования является создание его математической модели. К сожалению, несмотря на несомненные успехи, достигнутые в распознавании печатных символов и идентификации людей по папиллярным узорам, достаточно общей теории дешифрирования изображений, необходимой для его автоматизации, пока построить не удалось. Настоящая работа касается частного, но распространенного случая, когда дешифрирование проводится с целью выявления (обнаружения) на сцене заданных объектов.
Понятно, что выявляемые объекты должны обладать характерными свойствами (признаками), позволяющими отличать их от других объектов сцены. Также очевидно, что эти признаки, хотя бы частично, должны присутствовать на изображениях. Однако измеряемые в процессе съемки энергетические яркости пикселов очень изменчивы. Они зависят от времени суток, сезона, метеопараметров и других трудно контролируемых условий съемки. Гораздо устойчивее ведут себя геометрические признаки (форма, площадь, габаритные размеры). Именно с этим свойством связано их широкое применение в дешифрировании изображений. К сожалению, геометрические признаки не регистрируются в

ходе съемки, а вычисляются по проекциям объектов на этапе дешифрирования. Поэтому построение проекций заданных объектов является обязательным этапом дешифрирования.
Важная особенность рассматриваемого подхода к выявлению на сцене заданных объектов заключается в том, что эту задачу предлагается заменить тремя более простыми задачами. Вначале изображения сцены используются для поиска на ней участков, содержащих заданный объект и его некоторое окружение. Такие участки названы зонами интереса. Затем проводится сегментация выявленных зон интереса, состоящих из пикселов объекта и его окружения (фона). Целесообразность введения понятия зоны интереса оправдывается двумя соображениями. Во-первых, сегментировать приходится только выявленные зоны интереса. Если частота обнаружения ложной зоны невелика, то их общая площадь оказывается во много раз меньше площади всей сцены. Во-вторых, естественно полагать, что качество сегментации зоны интереса, содержащей пикселы только двух видов, окажется значительно выше качества сегментации всей сцены. Координаты пикселов, образующих объект, называются далее его проекцией. На завершающем этапе проекции используются для вычисления геометрических признаков и принятия окончательного решения о наличии объекта в зоне интереса.

88 “Оптический журнал”, 76, 12, 2009

Очевидно, что состав признаков, которые можно вычислять по изображениям, определяется выбранной математической моделью сцены. Стремление к получению более полной информации о сцене может привести к использованию моделей, построенных на непроверенных предположениях. При решении прикладных задач такие предположения нередко приводят к неверным выводам. В настоящей работе приводятся результаты теоретических и экспериментальных исследований влияния на результат поиска заданных объектов разных моделей сцены. Из-за ограниченного объема статьи рассматривается только задача сегментации зон интереса. В качестве исходной информации о сцене используется набор пространственно совмещенных и одновременно сформированных изображений.
Модели сцены
Будем рассматривать сцену как совокупность неделимых элементов, называемых далее пикселами. Предположим вначале, что в каждом пикселе измеряется только один признак. В этом случае пиксел характеризуется целочисленными координатами z = (z1, z2), заданными на двумерной целочисленной решетке Z2 = = {z = (z1, z2):z1 ∈ Z, z2 ∈ Z)}, и скалярной случайной величиной ξz со значениями из конечного множества Y, состоящего из |Y| > 1 элементов. Предполагается, что Y = {0, 1, …, |Y| – 1} и что случайные величины определены на одном и том же вероятностном пространстве (Ω, Α, P). Очевидно, что в качестве Ω можно рассматривать счетное множество YZ2 всех отображений вида Z2 → Y, а в качестве σ-алгебры – Α – счетное семейство всех подмножеств множества YZ2. Семейство вида (ξz)z ∈ Z2 будет называться далее скалярной сценой. Пусть ω ∈ Ω, z ∈ Z2 и xz = ξz(ω). Отображение x:Z2 → Y, определяемое равенством x(z) = xz, z ∈ Z2 и обозначаемое x = (xz)z ∈ Z2, назовем скалярным изображением сцены.
При решении прикладных задач интерес представляют конечные подмножества пикселов, которые будут называться объектами. Формально каждый объект определяется подмножеством A точек из Z2, содержащим координаты его пикселов, и семейством ξA = (ξa)a ∈ A из |A| скалярных случайных величин. Далее A будет называться проекцией объекта. Если A и B – проекции разных объектов, то предполагается, что они не пересекаются. Изображением объекта ξA будет называться сужение xA = (xa)a ∈ A изображения x всей сцены на A.

Пусть YA = {xA = (xa)a ∈ A:xa ∈ Y, a ∈ A} – мно-

жество различных изображений объекта ξA,

тогда его свойства определяются распределением

внеарZо2язтандоаснтоейраPзYбиA е=н(иpеY,Aс(оxсAт)о)яxAщ∈YееA

на YA. Если из конечных

попарно непересекающихся подмножеств, на-

зываемых проекциями объектов сцены, и если

каждой проекции A поставлено в соответствие

распределение вероятностей PY A на YA, то существует [1] вероятностное пространство (Ω, A, P) и скалярная сцена (ξz )z∈Z2 на Z2 такая, что

P{ω ∈ Ω:ξA(ω) = xA} = pYA(xA)

для любой проекции A и для любого xA ∈ YA. Кроме того, если A и B – проекции разных эле-

ментов сцены, то для любых a ∈ A и b ∈ B случай-

ные величины ξa и ξb независимы. В общем случае число одновременно измеряе-

мых признаков ν ≥ 1. Поэтому в качестве пиксела

с координатами z ∈ Z2 естественно рассматривать

ν-мерную случайную величину ξz = (ξjz)1≤j≤ν, опре-

деленную на (Ω, Α, P) и принимающую значения в

Y = Yν, а семейство (ξz)z ∈ Z2 – называть векторной сценой. Пусть ω ∈ Ω, тогда xzj = ξzj (ω), z ∈ Z2, будет

называться j-м скалярным изображением пиксе-

ла ξz, нием

ваекxтjо=рн(xоzjй)zс∈цZ2ен–ыj,-м1

скалярным изображе≤ j ≤ ν. Изображением

векторной сцены (или векторным изображением) назовем семейство x = (xj )1≤j≤ν ее скалярных изображений. Если xz = (xzj )1≤j≤ν – векторное изображение пикселa, то изображение векторной сцены

принимает вид x = (xz)z ∈ Z2. Объектом с проекцией A в общем случае будет

совокупность векторных случайных величин ξA = (ξa)a ∈ A, а его изображением – совокупность векторов xA = (xa)a ∈ A. Очевидно, что изображения объекта образуют множество

Y A = {x A = (xa )a∈A : xa = (xaj )1≤j≤ν,a ∈ A}.

Распределением объекта ξA назовем распре-

деление

P
Y

A

=

(

всех векторных

pиYзAо(бxрAа)ж)xеAн∈иYйA ,

на множестве определяемое

YA ра-

венством Z2 задано

p
Y

A

(x

A

)

=

P{ω



Ω:

ξA(ω)

=

xA}.

Пусть

на

разбиение на проекции и пусть каждой

проекции A поставлено в соответствие распреде-

ление

вероятностей

P
Y

A

на

множестве

YA.

Тогда

существует вероятностное пространство (Ω, Α, P)

и векторная сцена (ξz)z ∈ Z2 такая, что

P{ω ∈ Ω:ξA(ω) = xA} = pYA(ξA)

для любой проекции A и любого x A ∈ Y A. Кроме того, если A и B – проекции разных элементов
сцены, то для любых a ∈ A и b ∈ B векторные случайные величины ξa и ξb независимы.

“Оптический журнал”, 76, 12, 2009

89

В ходе дешифрирования признаки объектов
вычисляются по изображениям сцены. Пусть d – евклидово расстояние на Z2, а B(z, r) = = {t ∈ Z2:d(z, t) ≤ r} – круг с центром z и радиу-
сом r. Довольно часто в качестве признака объ-
екта скалярной сцены используется среднее арифметическое значение x–z, определяемое равенством

∑x–z

=

|

1 B(z,r

)

|

t∈B(z,r

)

xt

.

В общем случае x–z не имеет полезной содержательной интерпретации. Однако в частном

случае, если объект ξA со средним значением mA является фрагментом изотропного случайного поля, для которого выполняются условия эргодической теоремы Слуцкого, то x–z является состоятельной оценкой неизвестного среднего
значения mA [2]. Пусть R – корреляционная функция изотропного случайного поля со сред-
ним значением mA. Хорошо известно [2], что для сходимости xz к mA по вероятности достаточно, чтобы R(t) → 0 при t → +∞. Это условие часто ис-

пользуется в приложениях.

В связи с изложенным будем называть далее

скалярную сцену локально изотропной, если

ее объекты являются фрагментами скалярных

изотропных случайных полей, позволяющих

оценивать по изображению объекта его среднее значение. Очевидно, что векторная сцена (ξz)z ∈ Z2 является набором из ν скалярных сцен (ξjz)z ∈ Z2, 1≤ j ≤ ν. Она будет называться локально изо-

тропной, если все эти скалярные сцены являются

локально изотропными. Из этого определения

следует, m A= (mAj

что Eξaj = mAj , a ∈ A и 1≤ j ≤ ν . Вектор )1≤j≤ν будет называться вектором сред-

них значений объекта ξA. Для соседних объектов ξA и ξB всегда предполагается, что d(m A,mB ) > 0.

Довольно часто, кроме среднего арифмети-

ческого значения, по изображениям вычисля-

ются и другие признаки. В этом случае, помимо

локальной изотропности к случайному полю,

необходимо предъявлять дополнительные тре-

бования. Если предположить, что образующие объект ξA случайные величины в совокупности независимы и имеют одно и то же распределение PA = ( pA (y))y∈Y, то изображение xA превращается в случайную выборку. В этом случае его можно

использовать для оценки неизвестных вероятностей pA (y), y ∈ Y, и числовых характеристик распределения PA , включая среднее значение mA. В противном случае, у относительной частоты появления значения y ∈ Y на изображении xA отсутствует содержательная интерпретация.

Далее сцены, состоящие из объектов, образо-
ванных в совокупности независимыми случай-
ными величинами с одним и тем же распреде-
лением, будут называться бернуллиевскими
скалярными сценами. В случае векторных сцен
предположение о независимости и равенстве
распределений относится к векторным случайным величинам ξa, a ∈ A , образующим объект ξA. Очевидно, что каждая бернуллиевская сцена является локально изотропной.
Визуальный анализ скалярных изображе-
ний, полученных в различных спектральных
зонах, свидетельствует о том, что средняя яр-
кость заданного объекта часто оказывается
выше или ниже средней яркости окружаю-
щего его фона хотя бы на одном из изображений.
Объекты с таким свойством иногда называют-
ся пятнами. Очевидно, что пятна составляют
довольно широкий класс объектов и поэтому
заслуживают определенного внимания. Далее
предполагается, что все заданные объекты яв-
ляются пятнами.
Исследование пятен начнем с их формального определения. Пусть Q(z, l) – квадрат на Z2 со стороной l и левым верхним пикселом z ∈ Z2, задаваемый равенством вида
Q(z, l) = {t = (t1,t2) ∈ Z2:zj ≤ tj ≤ zj + l, j =1, 2}.
Точки z и t из Z2 будут называться соседями, если евклидово расстояние между ними d(z,t) равно единице. Очевидно, что каждый пиксел имеет четырех соседей. Подмножество Fr(Q) точек из Q(z, l) назовем границей квадрата, если каждая точка z ∈ Fr(Q) имеет хотя бы одного соседа из Z2 Q. Очевидно, что |Fr(Q(z, l))|= 4l.
Рассмотрим частный случай, когда каждый пиксел z ∈ Z2 описывается скалярной случайной величиной ξz, а исходной информацией о сцене сПлуусжтьитAед–иснвсятзвненоенокеоинзеочбнроаежпеондименxож=е(сxтzв)zо∈Zи2з. Z2. Объект ξA будет называться светлым (соответственно темным) пятном с диаметром d( A), если, во-первых, существует квадрат Q на Z2 такой, что A ⊂ (Q Fr(Q)) ; во-вторых, Eξz = mQA, z ∈ Q A, и, в-третьих, mA > mQA (соответственно mA < mQ A ). Пикселы ξQ A = (ξz )z∈Q A будут называться окрестностью пятна (или фоном).
В общем случае, когда ν ≥1, первое условие остается без изменения, второе условие принимает вид Eξz = mQA, z ∈ QA, а третье – d(m A ,mQA ) > 0, означает, что хотя бы для одной скалярной сцены объект является пятном.
При работе с векторными случайными вели-
чинами используется введенное ранее понятие

90 “Оптический журнал”, 76, 12, 2009

случайного расстояния [3]. Приведем его опреде-
ление, которое понадобится далее. Расстояние d на Rν будет называться борелев-
ским, если борелевским является отображение d : Rν ×Rν . Из свойств борелевских функций
следует, что расстояние Евклида и многие другие
известные расстояния являются борелевскими. Пусть d – борелевское расстояние на Rν, а ξ = (ξj)1≤j≤ν и η = (ηj)1≤j≤ν – векторные случайные величины, определенные на некотором вероят-
ностном пространстве (Ω, Α, P). Известно, что отображение d(ξ, η) : Ω → R, определяемое равенством d(ξ, η)(ω) = d(ξ (ω), η (ω)), также будет слу-
чайной величиной на (Ω, Α, P). Из определения расстояния следует, что при каждом ω ∈ Ω будут
выполняться аксиомы расстояния. Это позволяет
назвать отображение d случайным расстоянием
на множестве ν -мерных случайных величин, а случайную величинуd(ξ, η) – случайным расстоянием между ξ и η.

Сегментация

Пусть A – связное подмножество на Z2 с диа-

метром d( A), которое является проекцией объ-

ескретданξиAх=з(нξаaч)aе∈нAивйеmктAо=рн(mойAj

сцены с вектором )1≤j≤ν . Для любого

l ≥ d(A) +2 существует квадрат Q на Z2 со сто-

роной l такой, что A ⊂ Q Fr(Q). Будем называть

семейство ξQ = (ξz)z ∈ Q зоной интереса для объекта ξA, если пересечение проекции Q с проекцией лю-

бого другого заданного объекта является пустым

множеством.

Очевидно, что каждый объект с признаком

пятна имеет зону интереса. Некоторые подходы

к формализации задачи поиска зон интереса для

пятен и результаты ее решения обсуждались ранее

[4]. Поэтому в настоящей работе речь пойдет только

о сегментации зон интереса на две части с именами

“объект” и “фон”. Вначале рассмотрим решение

этой задачи для локально изотропной векторной

сцены.

Пусть ξA = (ξa)a ∈ A – заданный объект с пло-

щадью |A|, ξQ = (ξz)z ∈ m A = (mAj )1≤j≤ν и mQ A

Q=–(mеQгj оAз)1о≤нj≤аν

интереса, – вектор

а ы

средних значений самого объекта и его фона. Из

определения зоны интереса следует, что для любых a ∈ A и z ∈ Q A имеет место неравенство

d(Eξa, mQA) = d(mA, mQA) > 0 = = d(Eξz, mQA).

(1)

Покажем, что его можно применить для сегментации зоны интереса. Пусть

∑xz

=

1 |B((z,r))|

t∈B(z,r

)

xt

,z



Q



Fr

(Q)

∑è

xFr

=

|

1 Fr (Q)

|

t∈Fr

(Q)

xt

– оценки неизвестного вектора Eξz и неизвестного вектора mQA соответственно, а d(xz ,xFr ) – расстояние между ними. Так как d непрерывно, то d(xz ,xFr ) сходится по вероятности к d(Eξz, mQA) при r → +∞ [5]. Если упорядочить d(xz ,xFr ), z ∈ Q Fr(Q) по возрастанию, то при достаточно

большом радиусе сглаживания r на |A| последних местах будут находиться расстояния d(xa ,xFr ), a ∈ A, соответствующие пикселaм объекта.

Отметим, что в изложенном методе квантилей

используются только средние арифметические

значения xz, которые являются оценками неизвестных Eξz. Поэтому метод применим для локально изотропных сцен.

Рассмотрим далее некоторые из возможных

решений задачи сегментации в рамках бернулли-

евской векторной сцены. Начнем со случая, когда ν =1. Если рассматривать яркость пикселa в ка-

честве признака, то сегментацию зоны интереса

можно рассматривать как задачу классификации

ее пикселов на два класса – с номером 1 (объект)

и номером 2 (фон). Известно, что для построения байесовского решающего правила h∗ : Y → {1, 2}

с минимальной вероятностью ошибки классификации e(h∗) требуется знать априорные вероятности P( A) , P(Q A) и распределения признаков PA = ( pA (y))y∈Y, PQ A = ( pQ A (y))y∈Y для каждого
класса. Оказывается, что необходимую информа-

цию можно получить из изображения бернуллиев-

ской сцены. Действительно, так как площадь про-

екции объекта известна, а размеры зоны интереса

выбираются на этапе дешифрирования, то естественно определить P( A) и P(Q A) равенствами

P(A) =

A Q

,

P(Q A) =

Q A Q

.

Пусть xQ – изображение зоны интереса, а nQ (y), nA (y) и nQA (y) – количество пикселов с яркостью y, y ∈ Y, зоны интереса, объекта и фона соответственно, которые наблюдаются на xQ, xA и xQA. Известно, что относительные частоты

pQ (y) =

nQ (y) |Q|

,

pA

(y)

=

nA (y) | A|

è

pQ

A

(y)

=

nQ A |A

(y) |

,(y



Y,)

являются состоятельными оценками неизвестных вероятностей, образующих распределения

“Оптический журнал”, 76, 12, 2009

91

,

PQ зоны интереса, PA объекта и PQA фона. Легко проверить, что они удовлетворяют уравнению

pQ (y) = P( A) pA (y) + {P(Q A) pQA (y), y ∈ Y (2)

с двумя неизвестными pA (y) и pQA (y). Пусть Fr(Q) – граница зоны интереса, xFr(Q) – ее изображение и nFr(Q) (y) – количество пикселов границы с яркостью y, y ∈ Y, на xFr(Q). Очевидно, что pFr(y) (y), определяемая равенством

pFr (Q)

(y)

=

nFr(Q) (y) Fr (Q)

,

y



Y,

так же, как и pQA (y), является оценкой для неизвестной pQA (y). Из сходимости по вероятности оценок pQ A (y) и pFr(Q) (y) к неизвестной вероятности pQA (y) следует, что pQA (y) ≈ pFr(Q) (y) при большом объеме | Fr(Q) | выборки. После замены в уравнении (2) неизвестной оценки pQ A (y) оценкой pFr(Q) (y) оно превращается в уравнение с одним неизвестным pA (y). Его решение завершает нахождение приближенных
значений для вероятностей, образующих распределения объекта PA и фона PQA, необходимые для классификации пикселов зоны интереса.
При этом решающее правило h и вероятность ошибки e(h) классификации принимают вид

h−1({1}) = {y ∈ Y : P( A) pA (y) ≥ P(QA) pQ A (y)},

h−1({2}) = Y h−1({1}),

e(h) =1− P( A)×

∑ ∑× pA (y) − P(QA) pQA (y).

y∈h−1 ({1})

y∈h−1 ({2})

Очевидно, что e(h) с увеличением длины границы стремится к вероятности ошибки e(h∗) байе-

совского (оптимального) решающего правила.

В изложенном методе сегментации по изо-

бражению xFr(Q) границы зоны интереса вычислялись |Y| оценок неизвестных вероятностей, образующих распределение PQ A = ( pQ A (y))y∈Y. При отсутствии выборки соответствующего объ-

ема, что является обычным делом в прикладных

задачах, метод не применим. Однако для бернул-

лиевских сцен можно воспользоваться централь-

ной предельной теоремой. Действительно, пусть сξрAед=н(иξмa )aз∈нAач–езнаидеамннmыAйиодбиъсепкетрссинеейиσзв2Aе,сBт(нzы,rм) и– круг, принадлежащий A, и xz – среднее арифметическое значение, вычисленное по кругу.

При достаточно большом радиусе r распреде-

ление случайной величины нормальным с параметрами

x(mz Aм,оσж2Aн/о| (Bсч(zи,тrа)т|)ь,

независимо от распределения xz. Это позволяет

вместо неизвестных распределений объекта PA

и фона PQA воспользоваться нормальными распн(xреQиедзAев,леsесQ2нтниAыя/мх| Bип(с0а,рпrаа)мр| )аемстореототрвваеxмтQистA(вxеиAн,нssQ2о2A./AВ| Bфк(ао0чн,еrас)ти|)всиепользуются их оценки xFr и sF2r , вычисленные по изображению границы:

∑xFr

=

|

1 Fr (Q)

|

z∈Fr (Q)

xz ,

∑sF2r

=

|

1 Fr (Q)

|

z∈Fr

(Q)

(xz



xFr

)2.

Неизвестные параметры объекта xA и s2A определяются из уравнений

xQ = P( A)xA + P(Q A)xQ A

(3)

и

sQ2 + xQ2 = P( A)(s2A + x2A ) + P(QA)(sQ2 A + xQ2 A ) (4)

после замены в них неизвестных xQ A и sQ2 A приближенными значениями, вычисленными
по границе зоны интереса. Напомним, что в качестве признака пиксела z ∈ Q Fr(Q) требуется рассматривать не его изображение xz, а оценку xz неизвестного среднего значения Eξz.
Обобщение байесовских методов на случай нескольких изображений (ν >1) очевидно. Так как количество оцениваемых вероятностей экспо-
ненциально зависит от ν, то их непосредственная
оценка в прикладных задачах представляется
весьма проблематичной. При использовании
многомерного варианта центральной предель-
ной теоремы по выборке достаточно оценить ν координат вектора средних значений и ν(ν −1) ковариаций.

Компьютерные эксперименты
Для иллюстрации изложенных методов сегментации зон интереса проведены компьютерные эксперименты. В них используются фрагменты трех пространственно совмещенных изображений реальной сцены, полученные с летательного аппарата в спектральных зонах 0,7–1,1, 3,0–5,0 и 8,0–12,0 мкм. Каждый пиксел имеет форму квадрата со стороной 0,3 м. На каждом фрагменте программным способом построены изображения восьми воображаемых объектов, отсутствующих на реальной сцене. Предполагается, что воображаемые объекты имеют прямоугольную форму, случайные координаты и ориентацию, а их размеры совпадают с размерами реальных объектов. Яркости пикселов каждого воображаемого объекта являются независимыми в совокупности случайными величинами с нормальным законом распределения. Его парамет-

92 “Оптический журнал”, 76, 12, 2009

Свойства сцены (отношение сигнал/шум)

Номер изображения

1

2

1

2,79

1,60

2

3,29

5,79

3

7,13

6,66

3 4,68 0,42 0,58

Номера объектов

4 2,34 1,23 1,72

5 2,0 1,70 2,34

6 5,51 1,00 1,41

7 3,40 0,22 1,87

8 2,60 0,77 2,20

рами служат оценки среднего значения и диспер-

сии реальных объектов. Для первого фрагмента

m(σ1A2A

= )2

46 и (σ1A )2 = 104, для

т=р2ет1ь4е,гдолmя 3Aвт=ор2о3г0оиm(2Aσ3A=)22=2207и.

Свойства сцены в окрестности каждого объекта

описываются отношением сигнал/шум k

k

=

|

mA



mQ A

| .

σA + σQ A

Его значения для каждого изображения приведены в таблице. В качестве примера на рис. 1 приведен фрагмент первого (лучшего, с точки зрения отношения сигнал/шум) изображения сцены с минимальным значением k = 1,60.
Каждое изображение сцены использовалось вначале для поиска зон интереса, а затем – для их сегментации. Результаты сегментации зон интереса методом квантилей с применением только первого изображения представлены на рис. 2, а с применением всех трех изображений – на рис. 3. Сравнение полученных результатов позволяет отметить два важных обстоятельства. Во-первых, построить зону интереса для второго объекта с использованием только первого изображения не удалось. Во-вторых, координаты зон интереса, выявленных с использованием только первого и с использованием всех трех изображений, оказались разными.

Если сцена описывается бернуллиевским случайным полем, то изображение каждого объекта является случайной выборкой и может использоваться для оценки вероятностей и числовых параметров случайных яркостей. На рис. 4 представлены результаты байесовской классификации пикселов зон интереса с оценкой неизвестных вероятностей, образующих
Рис. 2. Результаты сегментации по первому изображению.

Рис. 1. Первое изображение сцены. “Оптический журнал”, 76, 12, 2009

Рис. 3. Результаты сегментации по трем изображениям.
93

ограничениям. Действительно, при сегментации в этих зонах оценки для x–A оказались слишком большими (больше чем | Y | −1 = 255), а оценки для дисперсии s2A – даже отрицательными. Причина появления таких значений заключается в том, что изображения зон интереса рассматриваемой сцены не являются случайными выборками, т. е. исходные предположения о свойствах сцены оказались ложными.

Рис. 4. Байесовская классификация. Общий случай.

Заключение
В работе рассматриваются методы сегментации зон интереса для двух моделей реальной сцены. Для локально изотропных сцен с корреляционной функцией, стремящейся к нулю, единственным признаком объекта, вычисляемым по изображению, является оценка его среднего значения. Для бернуллиевских сцен по изображению возможно (по крайней мере теоретически) восстановление распределения вероятностей объекта. Это позволяет построить для сегментации зоны интереса асимптотически оптимальное решающее правило.
Тем не менее результаты компьютерных экспериментов по сегментации зон интереса рассмотренной в настоящей работе сцены показывают, что применение байесовских (оптимальных) методов может дать ложные результаты. Подобная ситуация возникает в тех случаях, когда используемые при построении математической модели предположения для реальной сцены не выполняются.

Рис. 5. Байесовская классификация. Оценка параметров.
распределения яркостей объекта и фона (общий случай).
На рис. 5 представлены результаты байесовской классификации в случае, когда в качестве признака пиксела z ∈ Q Fr(Q) использовалось среднее арифметическое значение xz, получаемое осреднением по кругу. В соответствии с центральной предельной теоремой распределение такой суммы стремится к нормальному при увеличении радиуса. Черные квадраты на изображении означают, что в соответствующих зонах интереса оценки для неизвестных параметров xA и s2A, полученные в результате решения уравнений (3) и (4), не удовлетворяют очевидным

ЛИТЕРАТУРА
1. Фофанов В.Б. О теоретико-вероятностной формализации задачи дешифрирования аэрокосмических изображений // Автометрия. 2003. № 6. С. 107–118.
2. Яглом А.М. Корреляционная теория стационарных случайных функций. Л.: Гидрометеоиздат, 1981. 280 с.
3. Фофанов В.Б. Случайное расстояние и его применения в дешифрировании изображений // Материалы IХ Междунар. конф. “Интеллектуальные системы и компьютерные науки”. М.: изд-во ММФ МГУ, 2006. Т. 2. Ч. 2. С. 286–288.
4. Фофанов В.Б., Демченко А.В., Кулеев Р.Ф. Дешифрирование многозональных изображений: методы и результаты // Оптический журнал. 2007. Т. 74. № 3. С. 55–59.
5. Тутубалин В.Н. Теория вероятностей. Краткий курс и научно-методические замечания. М.: изд-во МГУ, 1973. 232 с.

94 “Оптический журнал”, 76, 12, 2009