Например, Бобцов

ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ ПЛОСКИХ ОБЪЕКТОВ В СИСТЕМАХ ТЕХНИЧЕСКОГО ЗРЕНИЯ

Предварительная обработка изображений плоских объектов в СТЗ

19

УДК 004.932.2:681.327

C. C. САДЫКОВ, С. В. САВИЧЕВА
ПРЕДВАРИТЕЛЬНАЯ ОБРАБОТКА ИЗОБРАЖЕНИЙ ПЛОСКИХ ОБЪЕКТОВ В СИСТЕМАХ ТЕХНИЧЕСКОГО ЗРЕНИЯ

Предложена и реализована методика предварительной обработки изображений реальных плоских объектов, использование которой позволяет осуществлять идентификацию промышленных деталей в реальном масштабе времени.

Ключевые слова: предварительная обработка, плоский объект, сглаживание шума, выделение контура, длина объекта, маркировка, бинаризация, поворот объекта.

На современном этапе развития компьютерных технологий все более широкое распро-

странение получают системы технического зрения (СТЗ). Их основное назначение — помочь

человеку в областях деятельности, связанных со сбором и анализом зрительной информации,

или даже заменить его. Уровень использования СТЗ в прикладных областях является одним

из наиболее ярких и наглядных показателей развития высоких технологий в самых различ-

ных сферах человеческой деятельности. Традиционно развитие СТЗ ориентировано на про-

мышленное производство, связанное с робототехникой [1].

На изображениях практически каждого реального объекта присутствуют шумовые со-

ставляющие. Они могут возникать из-за несовершенства видеодатчиков, наличия пыли или

грязи на обрабатываемой поверхности, износа источников освещения и пр. Все эти помехи

затрудняют распознавание объектов с помощью СТЗ, и если их не сократить (в идеале — уда-

лить), помехи могут привести к значительным ошибкам.

Снизить уровень ошибок при распознавании позволяет использование быстрых алго-

ритмов предварительной обработки изображений плоских объектов сразу после их получения

с видеодатчика. Рассмотрим этапы предлагаемой методики предварительной обработки изо-

бражений плоских объектов.

Этап 1. Снижение уровня шума на изображениях объектов до требуемого. К настоя-

щему времени разработано много методов и алгоритмов сглаживания шума. Среди них мож-

но выделить методы адаптивного сглаживания [2, 3], анизотропной диффузии [4, 5] и ме-

дианной фильтрации [2—7]. Последний обладает высоким быстродействием и позволяет сни-

зить уровень помех на изображениях, при его работе не происходит усреднения по яркости,

контуры объектов на изображении не размываются.

Обозначим последовательность обрабатываемых точек в виде одномерного массива

Y={y1, y2, …, yn}. Обычно используется квадратная апертура размером (2k + 1) × (2k + 1) ,

k=1,2,…, и в каждой точке растра (i, j) яркость пересчитывается по следующему правилу:

апертура помещается в левый верхний угол так, чтобы ее центр совпал с точкой (i, j). Яркости (2k+1)2 элементов изображения, попавших в окно, нумеруются по возрастанию: b1≤b2≤…≤bi. При этом медианой набора b1—bi является его средний элемент.
Описанную процедуру можно представить следующим образом:

x* = med( y1, y2 , ..., yn ) .

(1)

Этап 2. Бинаризация изображений. Бинаризация является одним из основных методов

обработки изображений в робототехнике, позволяющих выделять объекты в поле зрения

СТЗ. Наиболее известны следующие алгоритмы бинаризации:

— адаптивная бинаризация [2, 3];

— метод Отсу [9];

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 2

20 C. C. Садыков, С. В. Савичева

— методы кластеризации (к-средних, ЕМ-алгоритм) [10, 11];

— обработка с постоянным порогом [2, 3].

Исследования показали, что лучшие результаты как по скорости, так и по качеству

уменьшения шума дает метод Отсу. Данный алгоритм состоит из двух основных шагов.

Шаг 1. Автоматическое определение порога бинаризации по нормированной гистограмме яр-

костей изображения по формуле:

pi = ni / N ,

(2)

где N — общее число пикселов на изображении; ni — число пикселов с уровнем яркости i. Шаг 2. Процедура простого порогового разбиения изображения.

Диапазон яркостей делится на два класса с помощью порогового значения уровня ярко-

сти t (целое значение от нуля до L). При этом каждому классу соответствуют:

t
∑ω0(t)= pi , i=1

(3)

ω1(t)=1–ω0(t),

t
∑µ0(t)= ipi ω0 (t) , i=1
L
∑µ1(t)= ipi ω1(t) , i =t +1
где ω0(i) и ω1(i) — относительная частота двух классов 0 и 1, разделенных порогом i; µ0(0) и µ1(0) — средний уровень для каждого из двух классов 0 и 1 изображения, разделенных порогом i.
Этап 3. Маркировка. Наиболее известны алгоритмы маркировки связных областей путем последовательного сканирования и рекурсивной маркировки [6, 12—15].
Сравнение показало, что лучшим по быстродействию является алгоритм последовательного сканирования. Он заключается в следующем:
— изображение последовательно сканируется слева-направо и сверху-вниз;
— для каждой точки изображения анализируется ее окрестность 3×3 (рис. 1); — проверяются условия:

x(i −1, j + 1) ∧ x(i, j + 1) ∧ x(i + 1, j + 1) ∧ x(i −1, j) = 0,⎫

x(i, j) = N, если x(i, j) = 1,

⎪ ⎪

x(i + 1, j) = N , если x(i, j) ∧ x(i + 1, j) = 1,



x(i −1, j −1) = N, если x(i, j) ∧ x(i −1, j −1) = 1,

⎬ ⎪

x(i, j + 1) = N , если x(i, j) ∧ x(i, j + 1) = 1,



x(i + 1, j −1) = N , если x(i, j) ∧ x(i + 1, j −1) = 1,

⎪ ⎭

где N — номер связной компоненты (объекта).

(4)

х(i–1, j+1) х(i–1, j)
х(i–1, j–1)

х(i, j+1) х(i, j) х(i, j–1)

х(i+1, j+1) х(i+1, j)
х(i+1, j–1)

Рис. 1
В результате работы описанного алгоритма получаем изображение, в котором каждому объекту присвоен отдельный номер.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 2

Предварительная обработка изображений плоских объектов в СТЗ

21

Этап 4. Деление нецелых объектов, т.е. не полностью вошедших в кадр поля зрения. К настоящему моменту разработаны рекурсивный алгоритм удаления объектов, расположенных по краю поля зрения, и алгоритм удаления объектов по площади [6, 13]. Проведенные исследования показали, что наиболее быстродействующим является первый алгоритм. Этап 5. Выделение контура. Существует множество алгоритмов выделения контуров бинарных изображений: алгоритм жука [15, 16], алгоритм направленного перебора [5, 16], сканирующий алгоритм [16], рекурсивный метод [4, 16], метод связности [17]. Исследования показали, что наиболее быстродействующим является алгоритм направленного перебора. Контурное изображение формируется следующим образом: для каждой
точки изображения анализируется ее окрестность 3×3 (рис. 1). Точка х(i, j) считается контурной, если выполняются следующие условия:

x(i, j) = 1 и x(i + 1, j) ∧ x(i, j + 1) = 0,⎫

x(i, j + 1) = 1и x(i, j) = 0,

⎪ ⎬

x(i + 1, j) = 1 и x(i, j) = 0.

⎭⎪

(5)

В результате получаем одноточечный безразрывный контур, состоящий из четырех

связных точек.

Этап 6. Вычисление центра тяжести объекта, заданного координатами (xц, yц), определяемыми как среднее значение координат (x, y), принадлежащих объекту, в соответствии с

уравнениями:

∑ ∑xц

=

1 m

m
xi ,
i=1



=

1 m

m i=1

yi

,

(6)

где xi, yi — текущие координаты точек контура по оси X и Y соответственно; m — число точек контура объекта.
Этап 7. Определение длины объектов. Существует несколько алгоритмов вычисления длины объекта: путем определения длины максимальной хорды; путем вычисления максимального расстояния между двумя параллельными касательными и путем построения выпуклой оболочки объекта и определения максимальной стороны [3, 13, 14, 18]. Наиболее быстродействующим является первый алгоритм, он состоит в следующем. Для каждой точки контура вычисляется расстояние между ней и соседними точками по формулам:

ai = ρi [C(xi , yi ), D(x j , y j )] , ai = (x j − xi )2 + ( y j − yi )2 .

(7)

Длина объекта есть максимальное значение:

A = miax{ai },

(8)

где i=1, 2, …, n — число точек контура.

Этап 8. Поворот объектов. Среди алгоритмов поворота можно выделить основанный

на расчете тангенса угла наклона линии длины объекта к оси Х [19]. Однако наиболее быст-

рым является алгоритм, в котором для поворота объекта на угол α координаты каждой точки

объекта пересчитываются в соответствии с формулами:

xн = (x − xц ) cos α − ( у − yц ) sin α + xц ; yн = ( y − yц ) cos α − (x − xц )sin α + yц ,

(9)

где хн, yн — новые координаты точки, х, y — исходные координаты точки.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 2

22 C. C. Садыков, С. В. Савичева Предложенная методика, включающая рассмотренные алгоритмы, исследовалась на 100
изображениях реальных плоских объектов. Некоторые объекты и результаты их предварительной обработки приведены на рис. 2.
Исходное изображение
Снижение шума
Бинаризация
Маркировка и удаление нецелых объектов
Выделение контуров, определение центра тяжести, поиск длины
Поворот объектов
Рис. 2
Предложенная методика исследована на изображениях реальных плоских объектов и ее достоинством является простота реализации, быстродействие, которое дает возможность
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 2

Предварительная обработка изображений плоских объектов в СТЗ

23

идентифицировать объекты в СТЗ, работающих в режиме реального времени. Общее время работы рассмотренных алгоритмов при 5—6 объектах на изображении составляет 120 мс.

СПИСОК ЛИТЕРАТУРЫ

1. Шапиро Л., Стокман Дж. Компьютерное зрение М.: БИНОМ. Лаборатория знаний, 2006. 752 с.

2. Писаревский А. Н. и др. Системы технического зрения (принципиальные основы, аппаратное и математическое обеспечение). Л.: Машиностроение, 1988. 424 с.

3. Мошкин В. И., Петров А. А., Титов В. С., Якушенков Ю. Г. Техническое зрение роботов. М.: Машиностроение, 1990. 272 с.

4. Анисимов Б. В., Курганов В. Д., Злобин В. К. Распознавание и цифровая обработка изображений: Учеб. пособие. М.: Высш. школа, 1983. 295 с.

5. Фурман Я. А. Цифровые методы обработки и распознавания бинарных иображений. Красноярск: Изд-во Красноярского ун-та, 1992. 248 с.

6. Фисенко В. Т., Фисенко Т. Ю. Компьютерные обработки и распознавание изображений: Учеб. пособие. СПб: СПбГУ ИТМО, 2008. 192 с.

7. Сойфер В. А.. Методы компьютерной обработки изображений. М.: Физматлит, 2003. 784 с.

8. Прэтт У. Цифровая обработка изображений. М.: Мир, 1982. Кн. 2. 480 с.

9. Otsu N. A threshold selection method from gray-level histograms // IEEE Trans. Syst., Man. and Cybern. 1979. Vol. SMC-9. P. 62—66.

10. Shi J. and Malik J. Normalized Cuts and Image Segmentation // Proc. IEEE Conf. Computer Vision and Pattern Recognotion, 1997. P. 731—737.

11. Kanungo T., Mount D. M., Netanyahu N., Piatko C., Silverman R. and Wu A Y. An efficient k-means clustering: Analysis and implementation // Proc. IEEE Conf. Computer Vision and Pattern Recognotion, 2002. P. 881—892.

12. Хорн Б. К. П. Зрение роботов. М.: Мир, 1989. 487 с.

13. Генкин В. Л., Ерош И. Л., Москалев Э. С. Системы распознавания автоматизированных производств. Л.: Машиностроение, 1988. 246 с.

14. Садыков С. С., Стулов Н. Н. Методы и алгоритмы выделения признаков объектов в системах технического зрения. М.: Горячая линия—Телеком, 2005. 204 с.

15. Дуда Р., Харт П. Распознавание образов и анализ сцен. М.: Мир, 1976. 507 с.

16. Абламейко С. В., Лагуновский Д. М. Обработка изображений: технология, методы, применение: Учеб. пособие. М.: Амалфей, 2000. 304 с.

17. Кормановский С. И., Скорюкова Я. Г., Мельник О. П. Структурно-связностная модель изображения: выделение контура и формирование признаков // Информационные технологии и компьютерная техника. 2010. № 1.

18. Путятин Е. П., Аверин C. B. Обработка изображений в робототехнике. М.: Машиностроение, 1990. 320 с.

19. Погорелов А. В. Дифференциальная геометрия. М.: Наука, 1974. 176 с.

Сведения об авторах

Султан Сидыкович Садыков

— д-р техн. наук, профессор; Муромский институт Владимирского го-

сударственного университета им. А. Г. и Н. Г. Столетовых, кафедра

информационных систем; E-mail: sadykovss@yandex.ru

Светлана Владимировна Савичева — аспирантка; Муромский институт Владимирского государственного

университета им. А. Г. и Н. Г. Столетовых, кафедра информацион-

ных систем; E-mail: savicheva-svetlana2010@yandex.ru

Рекомендована Юго-Западным государственным университетом

Поступила в редакцию 24.10.11 г.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2012. Т. 55, № 2