ОБУЧАЕМАЯ ПРОГРАММА РАСПОЗНАВАНИЯ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ

ИКОНИКА – НАУКА ОБ ИЗОБРАЖЕНИИ

УДК 004.932.2
ОБУЧАЕМАЯ ПРОГРАММА РАСПОЗНАВАНИЯ ДАННЫХ ДИСТАНЦИОННОГО ЗОНДИРОВАНИЯ
© 2010 г. Ф. Р. Гальяно Сизаско Институт информатики и автоматизации РАН, Санкт-Петербург E-mail: galiano@oogis.ru

В статье рассматривается применение инвариантного представления изображения для создания системы композиции алгоритмов сегментации. Представление называется инвариантным, так как не зависит от преобразований шкалы яркости изображения, сохраняющих количество и порядок бинов гистограммы. Рассматривается работа системы в режиме классификации и кластеризации. В первом случае эксперт инкрементно обучает систему, уточняя состав обучающей выборки на основе формируемой системой обратной связи. В процессе обучения система автоматически исключает из исходного набора алгоритмов сегментации подмножество алгоритмов, которые не могут быть использованы для выделения пикселов обучающей выборки. Описывается структура программной реализации. Приводится пример обработки данных дистанционного зондирования.

Ключевые слова: данные дистанционного зондирования, сегментация, инвариантное представление изображения.

Коды OCIS: 100.2000, 100.2960

Поступила в редакцию 16.02.2010

Введение
На сегодняшний день для изучения состояния земной поверхности и в картографии интенсивно используются данные дистанционного зондирования Земли. Задачи, решаемые с их помощью, включают в себя поиск объектов заданного типа на определенном участке поверхности Земли. При этом изменчивость и разнородность характеристик искомых объектов приводит к необходимости создания узкоспециализированных систем. В рамках классического подхода [1–2] создание таких систем требует значительных усилий высококвалифицированных специалистов, знания которых о предметной области должны быть формализованы в виде алгоритмов сегментации растровых изображений и описания сегментированных растров, а также классификации элементов пространства признаков. Выбор между несколькими разработанными алгоритмами обычно осуществляется экспертом. Значительную трудность в процессе создания подсистемы алгоритмов сегментации представляет минимизация влияния искажений данных на результат распознавания.

В настоящей статье рассматривается способ формирования системы алгоритмов распознавания растровых изображений посредством композиции некоторых базовых алгоритмов сегментации в структурном подходе [3]. Для генерации исходного набора алгоритмов распознавания изображений разработан язык композиции алгоритмов сегментации, применяемый в системе [4], которая обеспечивает выбор алгоритмов сегментации без использования эталонов.
Способ формирования системы алгоритмов распознавания
Способ основан на замещении исходного растрового изображения совокупностью сегментированных изображений, называемых признаковыми представлениями. Признаковые представления получаются путем сегментации исходного растра заданным набором алгоритмов сегментации.
В простейшем случае рассматривается распознавание объектов единственного класса. В процессе обучения системы эксперт указывает на растре координаты пикселов, принадлежа-

42 “Оптический журнал”, 77, 8, 2010

щих объектам искомого класса. Далее выполняется преобразование каждого признакового представления растра в частную карту объектов, которая вычисляется пороговым преобразованием признакового представления. Для ее вычисления выполняется масштабирование признаковых представлений при последовательно уменьшающемся яркостном разрешении [4]. Частная карта объектов позволяет упорядочить пикселы изображения на основе их яркости и считается построенной, как только все пикселы обучающей выборки приобретают одинаковые значения яркости. По частным картам объектов строится интегральная карта объектов, которая служит представлением результата упорядочивания пикселов изображения с учетом яркости соответствующих пикселов на всех частных картах признаков и описывается ниже. Пороговое преобразование интегральной карты позволяет выделять на исходном изображении пикселы определенной яркости, соответствующие искомому объекту с некоторой степенью достоверности. Пикселы обучающей выборки на интегральной карте имеют яркость, равную нулю. В результате обучения системы каждому признаковому представлению соответствует разрешение по яркости.
Система обучается инкрементно [5], т. е. обучающая выборка вводится поэлементно. Результат распознавания по первой точке может использоваться для коррекции процесса обучения: в случае соответствия списка алгоритмов сегментации анализируемому изображению и обучающей выборке каждая следующая ее точка должна приводить к минимальному изменению интегральной карты объектов. Это достигается, если на каждой итерации следующая точка обучающей выборки принадлежит подмножеству пикселов, яркость которых на интегральной карте близка к нулевой, но не равна ей. Иначе говоря, на каждой итерации ввода точек обучающей выборки необходимо следующую точку выбирать из тех, вероятность принадлежности которых к классу искомых максимальна, но не равна единице. Таким образом, оценка экспертом полутонового представления объектов позволяет обеспечить обратную связь в процессе обучения. При формализации правил, по которым производится выбор следующей точки обучающей выборки, ее объем уменьшается до одного элемента. При этом все остальные точки выбираются системой автоматически, на основе анализа интегральной карты объектов.

Вычисление интегральной карты объектов происходит по следующему алгоритму:
– рассчитываются частные карты объектов при заданном разрешении по яркости,
– пикселам, яркости которых принадлежат поддиапазону, задаваемому обучающей выборкой, присваивается яркость ноль, а всем остальным пикселам – яркость 1,
– проводится суммирование полученных изображений.
Результат представляет собой интегральную карту объектов, нормированную на [0; 1], инверсия которой может трактоваться как оценка вероятностей того, что указанный пиксел принадлежит классу искомых объектов. Действительно:
♦ Если пиксел классифицирован как пиксел объекта на всех частных картах объектов, то его яркость на интегральной карте равна 0. При этом пикселы обучающей выборки имеют вероятность принадлежности к классу, равную 1.
♦ Если пиксел классифицирован не как пиксел объекта на всех частных картах объектов, то его яркость на интегральной карте равна количеству таких частных карт.
Следует отметить, что интегральная карта объектов не зависит от порядка учета точек обучающей выборки.
Если среди яркостей пикселов обучающей выборки на данном признаковом представлении встречаются все яркости из допустимого диапазона (задаваемого экспертом), то интегральная карта объектов при исключении соответствующего признака не меняется. Следовательно, соответствующий такому признаковому представлению алгоритм сегментации не может быть использован для выделения пикселов обучающей выборки и автоматически исключается из набора. Кроме того, если у нескольких признаков по результатам обучения совпадают карты объектов, то все такие признаки, кроме одного, могут рассматриваться как кандидаты на исключение из списка. Окончательное решение о необходимости исключения в этом случае принимается экспертом, так как условие совпадения карт объектов может не выполняться при анализе изображений, отличных от использованного для обучения.
В режиме классификации обученная система применяет к изображению использованный при обучении набор алгоритмов сегментации. Далее полученные признаковые представления приводятся к установленным разрешениям по яркости, затем выполняется суммирование по-

“Оптический журнал”, 77, 8, 2010

43

лученных изображений. Более подробно работа программы в режиме классификации описана в работе [4].
Инвариантное представление изображения
Изменение разрешения по яркости может проводиться путем расчета инвариантного представления изображения. Инвариантное представление изображения при максимальном разрешении по яркости получается путем арифметического преобразования шкалы яркости изображения [6–7].
Представление считается инвариантным, поскольку не зависит от преобразований шкалы яркости изображения, сохраняющих количество и порядок бинов (ненулевых элементов) гистограммы, в частности, от увеличения яркости каждого элемента растра на одинаковое для всех пикселов целое число. Кроме того, оно незначительно зависит от некоторых других преобразований, например, изменения яркости одного пиксела изображения. Важно, что инвариантное представление любого изображения идемпотентно.
Построение инвариантного представления выполняется итеративно. Исходным представлением выступает изображение из нулевых пикселов. Производится последовательное увеличение числа различных яркостей на приближении растра до тех пор, пока оно не совпадет с числом различных яркостей приближаемого растра. Промежуточные результаты называются инвариантными представлениями при определенном разрешении по яркости. Отметим, что операция уменьшения разрешения по яркости для заданного инвариантного представления не требует привлечения исходного изображения.
Язык описания признаковых представлений
Так как входными и выходными данными алгоритмов сегментации, используемых для работы системы, являются изображения, то они (алгоритмы) могут быть объединены в последовательности. Описание таких последовательностей проводится средствами языка описания признаков (Properties Description Language, PDL). С точки зрения описания выделены 2 группы алгоритмов сегментации: базисные и композиционные [3]. В процессе построения признаковых представлений осуществляется преобразование

изображения по заданной формуле PDL, описывающей процесс объединения базисных алгоритмов в композиционные. Отметим, что с точки зрения процесса отбора признаков базисные и композиционные признаковые представления равноправны. Пример программы, выполняющей расчет признакового представления – порогового преобразования от изображения со значениями порогов, равными половине и удвоенной средней яркости растра:
$UpperValue: = AverageBright(%I0)*2,
$LowerValue: = $UpperValue/4,
%TresholdedImage: = TresholdByBright_$Lower Value_$UpperValue(%I0).
Здесь %I0 и %TresholdedImage – имена переменных типа “изображение”, хранящих исходное изображение и результат преобразования соответственно, AverageBright() – функция, возвращающая среднюю яркость изображения–аргумента, $UpperValue и $LowerValue – переменные типа “вещественное число”, “:=” – оператор присваивания, а TresholdByBright_$Lower Value_$UpperValue() – функция, возвращающая результат порогового преобразования изображения–аргумента со значениями порогов, равными _$LowerValue и $UpperValue.
Предлагаемый метод, в том числе транслятор PDL, реализован на языке программирования Java. Структура разработанной системы приведена на рис. 1.

Данные дистанционного зондирования

Формулы PDL

Транслятор PDL
Признаковые представления

Эксперт

Точки обучающей выборки

Отбор признаковых представлений

Интегральная карта объектов

Композиция частных карт
объектов

Частные карты
объектов

Рис. 1. Работа системы в режиме классификации.

44 “Оптический журнал”, 77, 8, 2010

Оценка полноты признаковой системы

Количество признаковых представлений

Количество уникальных комбинаций яркостей
на признаковых представлениях

Округленное отношение количества уникальных комбинаций яркостей на признаковых представлениях
к количеству пикселов (степень полноты признаковой системы), %

12 2 20 3 1930 13 64582

0 0,03 2,94 98,5443115

Разбиение изображения на минимальные сегменты
Разработанная система позволяет выделить на признаковом представлении изображения определенный диапазон яркостей, а назначением признаков является отображение любых значимых характеристик искомых объектов, в том числе геометрических – в яркость. Все пикселы, которым соответствует одинаковая комбинация яркостей на всех признаковых представлениях, воспринимаются системой как целое и не могут быть разделены при любом наборе обучающих данных. Непосредственная визуализация указанных комбинаций, при которой каждой из них присваивается уникальная яркость пиксела, позволяет оценить качество набора признаков по отношению к заданному изображению и требованиям, специфичным для предметной области. Как и следовало ожидать, с ростом количества признаков возможности системы увеличиваются. Примеры приведены в таблице. Полученные результаты показывают, что использованная система признаков близка к так называемой полной системе признаков, т. е. такой, которая позволяет выделить 100% пикселов на исходном изображении. Следует учитывать, что ни в одном из использованных признаков не учитываются абсолютные координаты сегмента или его элементов.
Режим кластеризации
Интегральная карта объектов может быть использована для оптимизации процесса выбора очередного элемента обучающей выборки, однако для ее расчета обучающая выборка должна быть не пуста. Расчет частных карт объектов при работе системы в режиме кластеризации (при отсутствии обучающей выборки) невозможен, и отбор алгоритмов сегментации в режиме

кластеризации не производится. В отсутствие обучающей выборки частные карты объектов могут быть замещены на представления метрики яркостей, задаваемой инвариантным представлением изображения.
Метрическое представление отражает количество итераций по снижению разрешения, необходимое для слияния групп пикселов определенной яркости на инвариантном представлении и для всех пикселов яркости b вычисляется следующим образом:
♦ Производится итеративное снижение разрешения по яркости инвариантного представления. На определенных итерациях происходит слияние бина (ненулевого элемента гистограммы изображения) с его ближайшими соседями слева и справа, т. е. пикселы, ранее составлявшие все три бина, приобретают одинаковое значение яркости. Для бинов с экстремальной яркостью на изображении (минимальной и максимальной) существует и учитывается только 1 сосед.
♦ Всем пикселам яркости b исходного изображения присваивается яркость, равная сумме номеров итераций, при которых происходят оба слияния.
Вычисление метрики на изображении состоит из вычисления ее для всех бинов гистограммы. Получаемое изображение может быть использовано экспертом для оценки соответствия системы признаковых представлений и требований к качеству, предъявляемых предметной областью. Пороговое преобразование полученного изображения позволяет выделять группы пикселов, степень близости между которыми не превышает заданной. Результат вычисления предложенной метрики яркостей инвариантен к любому из преобразований, к которому инвариантно инвариантное представление. Следует отметить, что из равенства яркостей пикселов на полученном изображении не следует, что

“Оптический журнал”, 77, 8, 2010

45

они будут отнесены к одному сегменту при расчете разбиения изображения на минимальные сегменты.
(а)

Пример сегментации данных дистанционного зондирования
Анализируемое панхроматическое изображение, полученное с сайта http://terraserver-usa. com, представлено на рис. 2а. Результаты работы системы в режиме кластеризации и инверсии интегральной карты объектов приведены на рис. 2б, в.

(б)
(в)
Рис. 2. Исходные данные (а) и нормированные на [0; 255] результаты работы системы в режиме кластеризации (б) и классификации (в).

Заключение
Разработанная система позволяет выполнять сегментацию изображения и автоматизировать отбор алгоритмов сегментации. Как показало тестирование на более чем 300 признаковых представлениях, увеличение их количества не приводит к ухудшению результатов сегментации. Структура системы гарантирует сходимость процесса обучения, при этом нет необходимости в описании объекта по прототипу. Использование инвариантного представления изображения позволяет, в некоторой степени, компенсировать изменчивость исходных данных. Дальнейшее развитие системы требует создания алгоритмов сегментации, позволяющих обеспечить инвариантность не только к линейным и простейшим нелинейным преобразованиям гистограммы, но также и к другим искажениям изображения.
ЛИТЕРАТУРА
1. Гонсалес Р., Вудс Р. Цифровая обработка изображений. М.: Техносфера, 2006. 1072 с.
2. Chi-hau Chen. Image processing for remote sensing. Boca Raton.: CRC Press, 2008. 380 р.
3. Журавлев Ю.И. Об алгебраических методах в задачах распознавания и классификации // Распознавание, классификация, прогноз. В. 1. М.: Наука, 1988. С. 9–16.
4. Харинов М.В., Гальяно Ф.Р. Распознавание изображений посредством представления в различном числе градаций // Сб. докл. 14-й Всерос. конф. “Математические методы распознавания образов”. Владимирская обл., г. Суздаль. М., 2009. С. 465–468.
5. Потапов А.С. Распознавание образов и машинное восприятие: Общий подход на основе принципа минимальной длины описания. СПб.: Политехника, 2007. 548 с.
6. Харинов М.В. Запоминание и адаптивная обработка информации цифровых изображений. СПб.: изд-во СПбГУ, 2006. 138 с.
7. Харинов М.В. Адаптивное встраивание водяных знаков по нескольким каналам // Патент России № 2329522. 2008.

46 “Оптический журнал”, 77, 8, 2010