Например, Бобцов

АНАЛИЗ ОСОБЕННОСТЕЙ ИЕРАРХИЧЕСКОГО ПРЕДСТАВЛЕНИЯ ИЗОБРАЖЕНИЙ В СОВРЕМЕННЫХ СИСТЕМАХ КОМПЬЮТЕРНОГО ЗРЕНИЯ

В.Н. Васильев, И.П. Гуров, А.С. Потапов
3. Scharstein D., Szeliski R. A taxonomy and evaluation of dense two-frame stereo correspondence algorithms // Int. Journal of Computer Vision. – 2002. – V. 47. – P. 7–42.
4. Chan M., Chen C.Y., Barton G., Delmas P., Gimelfarb G., Leclercq P., Fisher T.A. Strategy for 3D Face Analysis and Synthesis // Image and Vision Computing New Zealand Conference. – 2003. – P. 384–389.
5. Hirschmuller H. Accurate and Efficient Stereo Processing by Semi-Global Matching and Mutual Information // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2008. – V. 30. – № 2. – P. 328–341
.
Пономарев Святослав Владимирович – Россия, Санкт-Петербург, Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, студент, инженер, sv.v.ponomarev@gmail.com

УДК 004.932.2
АНАЛИЗ ОСОБЕННОСТЕЙ ИЕРАРХИЧЕСКОГО ПРЕДСТАВЛЕНИЯ ИЗОБРАЖЕНИЙ В СОВРЕМЕННЫХ СИСТЕМАХ КОМПЬЮТЕРНОГО ЗРЕНИЯ
В.Н. Васильев, И.П. Гуров, А.С. Потапов
Рассмотрены широко применяющиеся в прикладных задачах методы компьютерного зрения. Установлено, что эти методы осуществляют анализ изображений преимущественно на одном уровне – пиксельном, контурном, структурном и т.д. Определены недостатки одноуровневых представлений изображений, ограничивающие инвариантные свойства использующих эти представления методов, что, в частности, выражается при решении задачи распознавания в снижении возможности по различению объектов разных классов. Обоснована возможность преодоления этих ограничений с помощью иерархических представлений. Предложены пути развития теории синтеза оптимальных иерархических систем анализа изображений, в которых снижение вероятности выбора наилучшей гипотезы верхнего уровня из-за принятия гипотез промежуточных уровней минимально. Минимизацию ошибки аппроксимации распределения апостериорных вероятностей гипотез верхних уровней путем учета их зависимости только от лучших гипотез нижних уровней предложено осуществлять с помощью введения обратных связей между уровнями и адаптивного выбора гипотез всех уровней с максимизацией их совместной вероятности. Ключевые слова: иерархические представления, компьютерное зрение, анализ изображений.
Введение
Область компьютерного зрения приобретает все большее прикладное значение. При этом некоторые методы оказываются успешными при решении широкого круга задач, благодаря чему приобретают популярность и начинают использоваться многими разработчиками при создании прикладных систем компьютерного зрения, особенно после реализации этих методов в таких широко используемых при прототипировании программных библиотеках, как OpenCV. В качестве примера можно привести методы выделения ключевых точек на изображениях с последующим построением локальных инвариантных дескрипторов (наиболее известными являются SIFT [1] и SURF [2]), каскады Хаара, а также нейросетевые методы [3], используемые при выделении объектов с устойчивой формой, например, лиц людей, гистограммы ориентированных градиентов [4] (используемые, например, при детектировании пешеходов на изображениях), мешки визуальных слов [5] (популярные в задачах извлечения изображений из баз) и т.д.
Существуют также методы для решения таких задач, как построение плотных карт стереодиспаратности (например, методом отсечения графов или полуглобальным методом стереозрения [6]), и распространены готовые технические решения, наподобие устройства Kinect, весьма популярного у разработчиков систем компьютерного зрения при восстановлении трехмерной формы и распознавании поз и жестов людей.
Известны общепринятые методы обработки, например, метод Кенни для детектирования контуров или преобразование Хафа для построения геометрических элементов (тоже, кстати, реализованные в OpenCV и применяемые до сих пор [7]), но такие методы не давали законченного решения конкретных задач и не имели стандартной реализации. Сейчас для решения многих частных прикладных задач целесообразно воспользоваться имеющимся инструментарием. У специалистов, использующих компьютерное зрение при решении практических задач, вполне может сложиться впечатление, что знания имеющегося инструментария и умения его применять вполне достаточно для работы в этой области.
С учетом того, что появление упомянутых эффективных на практике методов вряд ли можно считать результатом какого-то научного прорыва, возникает естественный вопрос о теоретическом прогрессе в данной области, его направленности и востребованности. Здесь необходимо отметить, что существует множество очень сложных задач, которые не могут быть решены с помощью имеющихся технологий. Хотя такие технические достижения, как беспилотный автомобиль, управляемый, в том числе с использованием методов компьютерного зрения, оказываются возможными, проблема семантической пропасти

Научно-технический вестник информационных технологий, механики и оптики, 2013, № 6 (88)

45

АНАЛИЗ ОСОБЕННОСТЕЙ ИЕРАРХИЧЕСКОГО ПРЕДСТАВЛЕНИЯ …
[8], заключающаяся в трудности перехода от пиксельного представления изображений к их словесному описанию, остается далекой от разрешения. Как результат, многие задачи, связанные с пониманием изображений, остаются без решения, что свидетельствует о том, что для расширения сферы применения систем компьютерного зрения необходимо решение теоретических проблем.
Одной из основных характеристик методов компьютерного зрения является используемое в них представление (т.е. формальный способ описания) изображений. В настоящей работе проводится анализ типов представлений изображений, используемых в методах компьютерного зрения. Целью работы является установление основных ограничений используемых представлений и возможностей преодоления этих ограничений.
Анализ представлений изображений в прикладных системах компьютерного зрения
Существующие практические методы [9] используют представления разных уровней – пиксельного, контурного, структурного (рисунок). Однако, проанализировав эти методы, можно убедиться, что даже наиболее высокоуровневые описания изображений в значительной части получаются путем применения одного оператора с последующим пороговым ограничением или поиском локальных максимумов, т.е. эти описания строятся не в качестве верхнего уровня иерархических представлений. Подобный подход приводит к простоте реализации и вычислительной эффективности указанных методов. Однако можно предположить, что эта же особенность используемых представлений является причиной их низкой выразительной силы (или потери значимой информации при описании изображений в рамках этих представлений), что приводит к ограниченности соответствующих методов, к примеру, в части их неспособности различать объекты разных классов.
а
б Рисунок. Представление изображения на уровне пикселей, контуров, структурных элементов (а), а также
групп структурных элементов (б)
Указанную ограниченность можно проиллюстрировать на примере задач извлечения изображений из баз данных, где разные методы предназначены для применения к изображениям разных типов. Традиционно недостатки отдельных методов компенсируются их совместным использованием. К примеру, в конкурсе Large Scale Visual Recognition Challenge [10] по распознаванию объектов различных классов на произвольных изображениях предложенные решения редко опираются на какой-то один метод, а вместо этого используют комбинации различных методов выделения ключевых точек и признаков и композиции классификаторов, что может быть видно по описанию методов-победителей, приведенных на сайте конкурса. Такой подход позволяет в какой-то мере увеличить количество распознаваемых классов, но оно по-прежнему остается несопоставимым с возможностями человека.
Зоны зрительной коры человека также анализируют разные аспекты изображений – текстуру, цвет, структуру и т.д., что, на первый взгляд, может служить обоснованием «модульного» подхода к построению систем компьютерного зрения. Однако в дополнение к разделению на подобные каналы (которое в человеческой зрительной системе не столь однозначно) не вызывает сомнения и иерархичность организации зрительной системы с обильными обратными связями между уровнями.
Методы распознавания или извлечения изображений из баз строят отдельные описания для каждого типа информации, скажем, цветовые гистограммы, ключевые точки с текстурными дескрипторами, признаки формы (например, в виде гистограммы внутренних расстояний) и т.д. В лучшем случае детекторы и дескрипторы ключевых точек обобщаются для использования цветных изображений. Однако в остальном описания составляются как простые объединения признаков разных типов и не формируют целостной модели изображения, т.е. такой модели, по которой можно было бы реконструировать исходное изображение. В то же время, очевидно, человек не видит изображение как совокупность разрозненных признаков.
При этом составные (гибридные) представления не вполне компенсируют недостатки одноуровневых представлений. К примеру, стандартные дескрипторы ключевых точек не инварианты к нелинейным яркостным преобразованиям. К таким преобразованиям инвариантны, например, гистограммы внутренних расстояний, но в них полностью теряется информация о распределении яркостей пикселей в изобра-
46 Научно-технический вестник информационных технологий, механики и оптики,
2013, № 6 (88)

В.Н. Васильев, И.П. Гуров, А.С. Потапов

жении объекта, из-за чего метод обладает слабыми дискриминантными свойствами. Прямое объединение двух типов описаний, как правило, позволяет распознавать изображения с выраженными текстурными свойствами в отсутствие нелинейных яркостных изменений, а также изображения объектов с хорошо различимой формой при возможном присутствии нелинейных яркостных изменений, но не какие-либо смешанные случаи. Сходная ситуация наблюдается и при объединении текстурных и цветовых дескрипторов ключевых точек [11].
Объединение двух типов признаков, естественно, повышает размерность пространства признаков и делает некоторые классы образов, не разделимые ни в одном исходном пространстве, разделимыми в объединенном пространстве. Иными словами, повышение дискриминантной силы гибридных методов выходит за рамки простого объединения распознаваемых классов, но несущественно, поскольку распознавание объектов новых классов нередко требует учета новых закономерностей. При этом новые закономерности должны выражаться в форме алгоритмов, которые не сводятся к алгоритмам, строящим элементы описаний в объединяемых методах. Аппроксимация же одного типа регулярностей другим типом регулярностей может требовать экспоненциально большого числа элементов описаний (простейшим примером неограниченного возрастания числа необходимых элементов описания при увеличении требуемой точности может служить аппроксимация экспоненты полиномиальным рядом).
Естественно, не все (хотя и значительное большинство) методы в области компьютерного зрения базируются на одноуровневых представлениях изображений. Методы интерпретации изображений [12] добавляют, по крайней мере, один уровень представления – семантический. Но именно здесь становится наиболее видна проблема семантической пропасти: описания промежуточного уровня (между пиксельным и семантическим) оказываются недостаточно выразительными, чтобы на семантическом уровне с высокой вероятностью назначать метки объектам даже с учетом знания общих правил организации наблюдаемых сцен.
Идея использования иерархических представлений изображений известна давно. Однако достижение их эффективного использования на практике оказывается затруднительно. Сходной была ситуация и в многослойных искусственных нейронных сетях. Долгое время использовались сети с малым числом скрытых слоев (по сути, соответствующих представлениям разных уровней, хотя и однотипных), поскольку связи с дополнительными слоями не удавалось эффективно настраивать в процессе обучения, хотя время обучения и работы увеличивалось. Однако разработка теории сетей глубокого обучения позволила существенно расширить возможности по распознаванию у нейронных сетей именно благодаря использованию многослойной архитектуры [13].

Анализ эффективности иерархических представлений

Для эффективного использования иерархических представлений необходимо четко определить их

преимущество перед одноуровневыми представлениями, которое не столь очевидно, поскольку разделе-

ние на уровни является отчасти условным. Если не вводить никаких ограничений на возможные классы

описаний на одном уровне, то любое иерархическое представление можно трактовать и как одноуровне-

вое. Более того, как давно было замечено [14], если под разделением на уровни подразумевать построе-

ние промежуточных описаний, таких, что описание i-го уровня строится на основе описания (i–1)-го

уровня, то любому такому иерархическому представлению можно поставить в соответствие представле-

ние без явного разделения на уровни, в котором выходное описание, строящееся на основе входных дан-

ных, обладает более высоким качеством (например, большей инвариантностью или помехоустойчиво-

стью).

Этот факт следует из байесовского рассмотрения процесса порождения гипотез. Рассмотрим два

уровня гипотез. Без принятия промежуточных решений апостериорная вероятность гипотез второго

уровня при данных D будет выражаться в форме

P(H2 | D)  P(H2 | H1)P(H1 | D) ,

(*)

H1

где P(H1 | D)  P(D | H1)P(H1) и P(H2 | H1)  P(H1 | H2 )P(H2 ) .

При принятии промежуточных решений суммирование в формуле (*) проводится не по всем воз-

можным гипотезам первого уровня H1, а только по их некоторому подмножеству, в предельном случае состоящему из одной наиболее вероятной гипотезы:

P(H2 | D)  P(H2 | H1)P(H1 | D)  P(H2 | H1* )P(H1* | D) , H1
где H1*  arg max P(H1 | D) , что позволяет выбирать гипотезу второго уровня по критерию P(H2 | H1* ) . H1
Этот критерий, очевидно, лишь аппроксимирует критерий (*) и может привести к выбору менее вероят-

ной гипотезы второго уровня. В теоретико-информационных терминах снижение эффективности можно

выразить через потерю информации при принятии промежуточных решений. В этой связи возникает во-

прос: в чем преимущества иерархических представлений?

Научно-технический вестник информационных технологий, механики и оптики, 2013, № 6 (88)

47

АНАЛИЗ ОСОБЕННОСТЕЙ ИЕРАРХИЧЕСКОГО ПРЕДСТАВЛЕНИЯ …
Можно заметить, что, во-первых, класс одноуровневых представлений совпадает с классом иерархических представлений, только если на представления не накладываются какие-либо существенные ограничения. К примеру, если представления задаются в форме произвольных алгоритмов, то добавление иерархичности не увеличит мощности представлений. Если представления задаются в форме искусственных нейронных сетей произвольной архитектуры, то многослойные сети, составленные из таких сетей, также не будет обладать большей мощностью. Однако если рассматривать ограниченные представления (которые обычно и используются на практике), то введение иерархичности увеличивает их выразительную силу. Например, число нейронов промежуточного слоя в однослойных сетях прямого распространения может расти экспоненциально быстро по сравнению с многослойными сетями при увеличении требуемой точности аппроксимации некоторых закономерностей (а это будет вести к переобучению), что и послужило одной из причин интереса к сетям глубокого обучения [12].
Во-вторых, если задача построения описания в рамках выбранного класса представления является NP-полной, то поиск гипотезы с максимальной апостериорной вероятностью P(H | D) будет неосуществим из-за ограничений вычислительных ресурсов. Поиск решения в рамках n-уровневого иерархического представления будет требовать порядка |{H1}|+…+|{Hn}| операций, тогда как без принятия промежуточных решений (т.е. при использовании эквивалентного одноуровневого представления) потребуется порядка |{H1}|…|{Hn}| операций. При равных вычислительных затратах на поиск моделей данных мощность используемого множества моделей в случае иерархических представлений будет экспоненциально (по числу уровней) больше, чем в случае одноуровневых представлений (однако при этом не будут гарантированно находиться наиболее вероятные модели). Таким образом, введение иерархической структуры позволяет существенно сокращать вычислительные затраты или увеличить пространство поиска. Например, для перцептронов или сетей глубокого обучения можно было бы использовать алгоритмы обучения, не принимающие в расчет их многоуровневой структуры, а оптимизирующие все связи одновременно. Такая оптимизация могла бы давать наилучший возможный результат обучения сетей с любой архитектурой, если бы она не требовала решения NP-полной задачи большой размерности. При ограниченных вычислительных ресурсах общими алгоритмами оптимальное решение может быть найдено только с очень низкой вероятностью.
Если рассматривать процесс анализа изображений не как процесс поиска моделей источника информации, а как процесс преобразования данных, то ограничения неиерархических представлений можно описать в иных терминах, а, именно, в терминах информационного расстояния между входным изображением и результатом его обработки. Введем это понятие в рамках алгоритмической теории информации, где алгоритмическая сложность строки данных определяется как длина кратчайшего алгоритма, воспроизводящего эти данные: K (D)  arg min l() , где l(μ) – длина программы μ для универсальной
U ()D
машины U, воспроизводящей данные D. Информационная дистанция перехода от данных D к гипотезе H может быть введена как условная
алгоритмическая сложность K (H | D)  arg min l() ,
U (D) H
где программе μ на вход подаются данные D. Затруднительно дать конкретную количественную оценку требуемого информационного расстоя-
ния для задач обработки изображений или компьютерного зрения (например, информационного расстояния от стереопары до карты дальностей), но очевидно, что каждая задача характеризуется некоторым ненулевым минимальным расстоянием, отделяющим входные изображения от результатов их анализа. Если сложность алгоритмов анализа изображений на каждом уровне представления для некоторой задачи ограничена, то в случае одноуровневых представлений эта задача может оказаться не решаемой.
Введение иерархических представлений при решении NP-полных задач является эвристикой, заключающейся в независимом поиске частей общего решения, что эквивалентно аппроксимации критерия качества решения. Точность этой аппроксимации можно варьировать путем варьирования числа гипотез каждого уровня, передаваемых на следующий уровень. Даже если система компьютерного зрения использует иерархические представления, зачастую число передаваемых гипотез мало или просто равно единице.
Точность аппроксимации может быть увеличена с помощью введения обратных связей от верхних уровней к нижним. Суть этих связей заключается в следующем. Нас интересует наиболее точная аппроксимация суммы (*) наименьшим числом слагаемых для выбора лучшей гипотезы верхнего уровня. В отсутствие априорных ограничений на гипотезы второго уровня H2 число слагаемых в (*) можно уменьшить за счет выбора слагаемых с наибольшим весом P(H1 | D). Однако после выбора некоторого количества наилучших гипотез второго уровня можно провести повторный отбор гипотез первого уровня уже с учетом весов P(H2 | H1). Этот итеративный процесс может продолжаться далее. На каждой итерации может отбираться фиксированное число пар гипотез (H1, H2) с наибольшими произведениями P(H2 | H1)P(H1 | D), что даст гарантию сходимости процесса.
48 Научно-технический вестник информационных технологий, механики и оптики,
2013, № 6 (88)

В.Н. Васильев, И.П. Гуров, А.С. Потапов
Рассмотренные принципы построения иерархических описаний с использованием обратных связей в теории могут позволить достичь компромисса между вычислительной эффективностью и качеством решения. В настоящее время, однако, методы, реализующие данные принципы, плохо развиты в силу своей технической сложности, несмотря на свою потенциальную востребованность. В качестве примера можно привести проблему обнаружения протяженных низкоконтрастных контуров, требующую для своего решения построения не только контурного, но и структурного описания изображений, причем с введением обратных связей между уровнями, как раз и позволяющих выделять контуры с низким значением P(H1 | D), но высоким значением P(H2 | H1).
Заключение
Рассмотрение прикладных методов, широко используемых в компьютерном зрении, показало, что для них характерно выполнение анализа изображений на одном уровне абстракции. Анализ неиерархических представлений изображений позволяет выявить их недостатки, которые можно выразить в различных терминах – ограниченной выразительной силе, вычислительной неэффективности или ограниченном информационном расстоянии между результатом обработки и исходным изображением.
Указанные недостатки могут быть устранены с помощью использования иерархических представлений. Хотя иерархические представления дают лишь приближенное решение задачи интерпретации изображений, с введением обратных связей между уровнями построения описаний изображений они позволяют достичь компромисса между вычислительной сложностью и качеством решения. В настоящее время успешными оказались иерархические системы лишь на основе простых однородных представлений информации, характерных для искусственных нейронных сетей. Иерархические системы компьютерного зрения, включающие контурные и промежуточные символьные представления, обладающие большой выразительной силой, разрабатывались давно, но до настоящего времени успешных решений, переносимых на различные задачи, не получено. Создание таких систем является перспективным направлением развития компьютерного зрения.
Работа выполнена при финансовой поддержке Министерства образования и науки Российской Федерации. Исследования одного из авторов (А.С. Потапова) поддержаны грантом МД-1072.2013.9.
Литература
1. Lowe D.G. Distinctive Image Features from Scale-Invariant Keypoints // Int. J. of Computer Vision. – 2004. – V. 60. – № 2. – P. 91–110.
2. Bay H., Tuytelaars T., Van Gool L. SURF: Speeded Up Robust Features // Proc. 9th European Conf. on Computer Vision. Graz, Austria. – 2006. – V. 3951. – P. 404–417.
3. Тропченко А.А., Тропченко А.Ю. Нейросетевые методы идентификации человека по изображению лица // Изв. вузов. Приборостроение. – 2012. – Т. 55. – № 10. – С. 31–36.
4. Dalal N., Triggs B. Histograms of oriented gradients for human detection // IEEE Computer Society Conference on Computer Vision and Pattern Recognition. – 2005. – V. 1. – P. 886–893.
5. Csurka G., Dance C., Fan L.X., Willamowski J., Bray C. Visual categorization with bags of keypoints // Proc. of ECCV International Workshop on Statistical Learning in Computer Vision. – 2004. – P. 1–22.
6. Hirschmuller H. Accurate and Efficient Stereo Processing by Semi-Global Matching and Mutual Information // IEEE Transactions on Pattern Analysis and Machine Intelligence. – 2008. – V. 30. – № 2. – P. 328–341.
7. Дырнаев А.В., Потапов А.С. Комбинированный метод подсчета эритроцитов на изображениях мазков крови // Научно-технический вестник информационных технологий, механики и оптики. – 2012. – № 1 (77). – С. 19–23.
8. Martens G., Lambert P., Van de Walle R. Bridging the semantic gap using human vision system inspired features // Self-Organizing Maps. – 2010. – P. 261–276.
9. Васильев В.Н., Гуров И.П., Потапов А.С. Современная видеоинформатика: проблемы и перспективы // Оптический журнал. – 2012. – Т. 79. – № 11. – С. 5–15.
10. Large Scale Visual Recognition Challenge – [Электронный ресурс]. – Режим доступа: http://www.imagenet.org/challenges/LSVRC/2012/, свободный. Яз. англ. (дата обращения 26.08.2013).
11. Иванов П.И., Маничев А.Э., Потапов А.С. Методы выделения контуров и описания ключевых точек при сопоставлении цветных изображений // Оптический журнал. – 2010. – Т. 77. – № 11. – С. 43–50.
12. Rares A., Reinders M.J.T., Hendriks E.A. Image Interpretation Systems // Technical Report (MCCWS 2.1.1.3.C), MCCWS project, Information and Communication Theory Group. TU Delft. – 1999. – 32 p.
13. Bengio Y. Learning Deep Architectures for AI // Foundations and Trends in Machine Learning. – 2009. – V. 2. – № 1. – P. 1–127.
14. Павлидис Т. Иерархические методы в структурном распознавании образов // ТИИЭР. – 1979. – Т. 67. – № 5. – С. 39–49.

Научно-технический вестник информационных технологий, механики и оптики, 2013, № 6 (88)

49

МЕТОД ДИНАМИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ …

Васильев Владимир Николаевич – Россия, Санкт-Петербург, Санкт-Петербургский национальный исследова-

тельский университет информационных технологий, механики и оптики,

доктор технических наук, профессор, ректор, vasilev@mail.ifmo.ru

Гуров Игорь Петрович

– Россия, Санкт-Петербург, Санкт-Петербургский национальный исследова-

тельский университет информационных технологий, механики и оптики,

доктор технических наук, профессор, зав. кафедрой, gurov@mail.ifmo.ru

Потапов Алексей Сергеевич

– Россия, Санкт-Петербург, Санкт-Петербургский национальный исследова-

тельский университет информационных технологий, механики и оптики,

профессор, доктор технических наук, pas.aicv@gmail.com

УДК 581.787:[519.6+517.443]
МЕТОД ДИНАМИЧЕСКОЙ ОБРАБОТКИ ДАННЫХ В СПЕКТРАЛЬНОЙ ОПТИЧЕСКОЙ КОГЕРЕНТНОЙ ТОМОГРАФИИ
С КОМПЕНСАЦИЕЙ ВЛИЯНИЯ ДИСПЕРСИИ
М.А. Волынский, И.П. Гуров
При формировании сигналов в спектральной оптической когерентной томографии при наличии дисперсии в среде спектральные интерференционные полосы испытывают частотную модуляцию из-за зависимости частоты полос от длины волны, что приводит к уширению спектра регистрируемого сигнала и ухудшению разрешающей способности спектрального интерферометра. В работе предложен метод динамической обработки данных спектральной интерференции на основе алгоритма дискретной линейной фильтрации Калмана с компенсацией влияния дисперсии в среде на разрешающую способность при исследовании оптически неоднородных частично прозрачных объектов. Алгоритм состоит в идентификации параметров (амплитуды и начальной фазы) гармонических составляющих интерференционного сигнала с фиксированным набором частот с помощью дискретного линейного фильтра Калмана. Использование информации о начальной фазе позволяет скомпенсировать влияние дисперсии и устранить нежелательные артефакты, что дает возможность повысить разрешающую способность спектральной оптической когерентной томографии. Представлены результаты обработки одномерных и двумерных сигналов в спектральной оптической когерентной томографии на примере исследования случайно-неоднородных рассеивающих сред в биомедицине. Ключевые слова: спектральная интерферометрия, оптическая когерентная томография, компенсация дисперсии в среде, преобразование Фурье, фильтр Калмана.
Введение
Методы бесконтактного контроля внутренней микроструктуры объектов необходимы для многих областей науки и техники. Одним из таких методов является оптическая когерентная томография (ОКТ), получившая распространение в целях неинвазивной диагностики объектов в биомедицине [1, 2]. Как известно, принцип ОКТ может быть реализован при использовании корреляционного или спектрального интерферометра [1–4]. В корреляционном интерферометре осуществляют перемещение оптической системы относительно исследуемого объекта. При этом интерференционные полосы малой когерентности формируются в пределах длины когерентности излучения при интерференции части измерительной волны, отраженной от поверхности непрозрачного объекта или от слоя частично прозрачного неоднородного объекта, находящихся от светоделителя на расстоянии, равном оптической длине пути опорной волны. В спектральном интерферометре оптическая длина пути опорной волны не равна оптической длине пути измерительной волны для всего диапазона высот рельефа непрозрачного объекта или глубины частично прозрачного объекта. На выходе интерферометра размещен спектральный прибор, позволяющий определить составляющую отраженной измерительной волны для различных длин волн. При этом, используя преобразование Фурье-спектра, зарегистрированного фотодетектором, можно определить расстояние и степень отражения от каждого слоя [4].
При наличии дисперсии в среде спектральные интерференционные полосы испытывают частотную модуляцию из-за зависимости частоты полос от длины волны, что приводит к уширению спектра регистрируемого сигнала и ухудшению разрешающей способности спектрального интерферометра.
Традиционный метод обработки данных в спектральной ОКТ основан на преобразовании Фурье (см., например, [4]). При этом для компенсации влияния дисперсии требуется точное определение амплитуд, частот и фаз информативных составляющих спектра сигнала, которое оказывается возможным только при регистрации полной реализации сигнала во всем диапазоне длин волн перед обработкой данных [5, 6], что снижает быстродействие системы. Повышение быстродействия возможно при получении динамических оценок параметров сигнала при рекуррентной обработке данных в системах спектральной ОКТ с перестраиваемой длиной волны источника излучения на основе фильтрации Калмана [7]. Алгоритм рекуррентной обработки данных в системах спектральной ОКТ предложен в [8, 9]. В настоящей работе рассматривается модифицированный метод динамической обработки сигналов спектральной интерференции на основе фильтра Калмана с возможностью повышения разрешающей способности за счет компенсации влияния дисперсии в среде.

50 Научно-технический вестник информационных технологий, механики и оптики,
2013, № 6 (88)