For example,Бобцов

SYNTHESIS OF SYSTEM FOR THREE-DIMENSIONAL IMAGE TRANSFER AND VISUALIZATION ON THE BASE OF ACOUSTO-OPTICAL DEFLECTOR

ЭЛЕКТРОННЫЕ И ЭЛЕКТРОМАГНИТНЫЕ УСТРОЙСТВА
УДК 681.77
М. М. КОЛЬЦОВ, С. В. КУЗНЕЦОВ
СИНТЕЗ СИСТЕМЫ ПЕРЕДАЧИ И ВИЗУАЛИЗАЦИИ ОБЪЕМНЫХ ИЗОБРАЖЕНИЙ
НА ОСНОВЕ АКУСТООПТИЧЕСКОГО ДЕФЛЕКТОРА
Рассматривается технология формирования и визуализации трехмерной сцены, восстановленной из двух или более ее проекций. Технология визуализация основана на компьютерном синтезировании одномерной голограммы светящейся линии пикселов с разной глубиной их положения.
Ключевые слова: система формирования объемного видеоизображения, акустооптический дефлектор, дифракционная линза, трехмерный лазерный дисплей, голографическая система объемного видения, синтез голограммы.
В настоящее время создание систем формирования объемных видеоизображений все еще находится в стадии разработки. Хорошо известные стереоскопические системы и системы виртуальной реальности, основанные на бинокулярном зрении человека, имеют ряд очевидных недостатков, таких как: малые углы обзора, кулисность изображения, малая глубина зоны стереоскопического видения, отсутствие вертикального параллакса. Перечисленные недостатки стереоскопических систем могут привести к дискомфорту наблюдателя, повысить его утомляемость и в итоге разрушить ощущение стереоэффекта. Стереосистемы невозможно использовать и для решения задач, в которых необходимо обеспечить объемное видение в относительно большой зоне пространства при перемещении наблюдателя. Эти и другие причины привели к необходимости разработок систем объемного видения, основанных на воспроизведении 3D изображения в реальном или иллюзорном объеме пространства.
На кафедре радиоэлектронных средств Санкт-Петербургского государственного электротехнического университета „ЛЭТИ“ (СПбГЭТУ „ЛЭТИ“) работы в области синтеза систем передачи и визуализации объемных изображений ведутся с 1992 г. В 2006 г. начались работы над лазерной проекционной голографической системой объемного видения без электромеханических частей. За это время разработан алгоритм восстановления трехмерных изображений по двум или более плоским угловым ракурсам. В обычном изображении трехмерного пространства информация о расстоянии до различных элементов сцены проявляется только в виде косвенных признаков: через относительные размеры объектов, затенение одних объектов другими, различную освещенность и т.д. Один из способов получения информации о глубине изображения состоит в регистрации нескольких изображений сцены при различных ракурсах. В этом случае относительное положение точек сцены зависит от расстояния до точки их наблюдения. Сопоставляя изображения сцен, в ряде случаев можно реконструировать трехмерную структуру сцены. Интерес к методам восстановления
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 7

62 М. М. Кольцов, С. В. Кузнецов трехмерной структуры сцен по их плоским изображениям, возникший еще в середине XX века, связан с исследованиями в области искусственного интеллекта, а практическая потребность в робототехнических устройствах, способных ориентироваться в трехмерном пространстве, постоянно поддерживает этот интерес в последние десятилетия [1].
Назначение разработанного алгоритма — определение диспарантности для пары стереоизображений, представленных двумя плоскими ракурсами объекта или группы объектов. Третья координата (глубина) может быть найдена, при известной диспарантности, путем элементарных преобразований и исходя из параметров стереоскопической системы.
Для реализации алгоритма, прежде всего, необходимо построить математическую модель, на которую будет опираться рассматриваемый метод. Модель включает три логических блока, каждый из которых рассмотрим в отдельности:
— медианная фильтрация изображения, производимая с целью повышения помехоустойчивости алгоритма;
— разбиение каждого изображения стереопары на области, условно принадлежащие одному объекту, т.е. выделение объектов или их частей из общего ландшафта изображения;
— обнаружение соответствующих друг другу областей на левом и правом изображениях стереопары, в том числе, определение диспарантности.
Программная реализация алгоритма и обработка изображений реальных стереоснимков была проведена не в реальном времени. Результирующий снимок с добавлением каждому пикселу координаты глубины выводился в виде аксонометрии 3D сцены с помощью технологии вывода Open GL.
Две аксонометрии одной сцены с восстановленной координатой глубины при различных угловых ракурсах представлены на рис. 1, демонстрирующем вполне приемлемое качество изображения: четко просматривается рельефность снимков, т.е. наличие формы по глубине.
Рис. 1
Таким образом, предлагаемый алгоритм содержит целочисленные операции и может быть реализован аппаратно в виде цифровой БИС, что позволит обрабатывать в реальном времени два потока видеоизображений от двух видеокамер, снимающих два угловых ракурса 3D сцены, с добавлением 1 байта глубины для каждого пиксела 3D сцены.
Структурная схема системы формирования объемного видеоизображения показана на рис. 2. Кадры, формируемые двумя цифровыми видеокамерами, синхронизируются блоком синхронизации, так что одновременно образуются левый и правый плоские ракурсы кадров. Эти два потока кадров поступают в блок восстановления глубины, состоящий из цифровой
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 7

Синтез системы передачи и визуализации объемных изображений

63

БИС и четырех банков видеопамяти. В два банка памяти записываются новые левый и правый кадры, в это время другие два банка предоставляют информацию для обработки в цифровую БИС; затем банки памяти переключаются. На выходе блока восстановления глубины формируется уже один цифровой видеопоток, но с добавлением потока байтов глубины для каждого пиксела. Так, для обычного DVD-разрешения и 24 бит цветности к 1,2 Мбайт для одного кадра добавится 400 Кбайт информации о глубине пикселов.

Видеокамера 1

Видеокамера 2

Блок синхронизации

Блок восстановления глубины
Сменные блоки
Компьютер
Программное обеспечение
Рис. 2
В системе в зависимости от ее применения предусмотрены следующие сменные блоки. — Блок компрессии: создание видеопотока в стандарте MPEG и передача его через Интернет (подразумевается компьютер с соответствующим программным обеспечением передачи через Интернет). Учитывая то, что целые группы пикселов имеют одну и ту же глубину в силу свойств алгоритма, поток байтов глубины может быть компрессирован так же, как и видеопоток кадров, при этом информацию о глубине пиксела можно записать вместо дополнительного байта цветности и использовать для компрессии в обычном формате MPEG4, либо можно отправлять информацию о глубине отдельным компрессированным потоком в формате MPEG4. Соответственно в этом случае на компьютере пользователя для принятия и воспроизведения видеопотока информации о 3D сцене должно быть установлено специальное программное обеспечение. Если к компьютеру также подключен реальный объемный дисплей (например, разработки кафедры радиоэлектронных средств СПбГЭТУ „ЛЭТИ“), то вывод информации осуществляется через соответствующий кодер и программу-проигрыватель. — Блок перекодировки: модуляция и передача видеопотока по шине USB (либо другой проводной шине или кабелю военного применения) без потери его качества в компьютер. Этот блок может быть предназначен для систем технического зрения или военных систем. В этом случае аксонометрия сцены выводится на плоский дисплей, а 3D изображение — на объемный дисплей. При этом в дополнительном окне плоского дисплея указывается дальность до точек, отмеченных на экране компьютера. Для специализированных систем технического зрения может быть разработано специальное программное обеспечение для распознавания объектов, их взаимного расположения или контроля по каким-либо параметрам. В этом случае можно использовать более высокое разрешение при меньшей частоте кадров, например 1500×2000 или выше с частотой кадров 7 Гц. Применение видеокамеры с повышенной чувствительностью в ИК-диапазоне позволяет воспроизводить 3D тепловое изображение для систем ночного видения. Для всех вышеперечисленных систем целесообразно использовать три видеокамеры, расположенные в вершинах равностороннего треугольника, что позволит существенно повысить точность оценки глубины пикселов.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 7

64 М. М. Кольцов, С. В. Кузнецов
— Блок компрессии: создание видеопотока в стандарте MPEG, кодировка звука и запись потока на внешний носитель.
— Блок преобразования видеопотока в цифровой или аналоговый TV-сигнал с передачей его через эфир и приемом специальным телевизором. (Такой блок — более отдаленная перспектива при успешной продаже вышеописанных систем.) Функционирование телевизора осуществляется на основе разрабатываемого объемного дисплея, или это может быть обычный плоский телевизор, но с дополнительным графическим процессором и выводом 3D аксонометрии через 3D графический акселератор. При этом управлять сменой углового ракурса можно будет через дистанционный пульт. Такой телевизор может принимать и выводить и обычные плоские TV-изображения различных стандартных форматов.
Технология визуализации полученных объемных изображений опирается на применение растров микролинз и голограмм. На рис. 3 представлен визуализатор на основе двух голограмм. Для такого визуализатора 500—1000 гармоник радиосигнала возбуждения акустооптического дефлектора (АОД) формируют 500—1000 точек в параллельной строке, а девиация частот от центральных обеспечит получение информации о глубине положения этих точек на голограмме. Такая частотная девиация вызывает изменение радиуса светового луча при прохождении через дифракционную линзу.

Иллюзорные видимые пикселы для различных
углов отклонения
референсного пучка

Голограмма одной светящейся линии

Один радиосигнал по координате Y

Голограмма 500×500 микролинз
Сигнал по координате Х — голограмма 500 точек различной яркости и глубины
Лазерный пучок Рис. 3
Для формирования каждой точки 1/500—1/1000 лазерного луча попадает на массив микролинз первой голограммы в определенной угловой позиции по вертикальной координате. Лазерный луч является линией из 500—1000 точек по горизонтальной координате; он дифрагирует дополнительно на микролинзах первой голограммы и формирует 500—1000 новых источников референсного света по горизонтальной координате. Каждый из источников референсного света попадает на свою собственную линзу. Все 500—1000 новых источников света освещают часть второй голограммы светящейся линии как референсные лучи. Они формируют иллюзорные образы 500—1000 частей линии с определенной горизонтальной координатой, своей для
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 7

Синтез системы передачи и визуализации объемных изображений

65

каждого референсного луча, и определенной глубиной. Диаграмма луча по вертикальной координате — узкая с плоским волновым фронтом, таким образом, все точки имеют одну вертикальную координату, а каждая точка линии имеет свою яркость. Второй канал АОД используется для смещения строки по вертикальной координате. При изменении частоты по этому каналу формируются новые 500—1000 точек со своими горизонтальными координатами из первого канала АОД, создаются следующие 1/500—1/1000 частей светящейся линии на голограмме, и т.д.
Радиосигнал вызывает движущуюся акустическую волну в АОД, поэтому для обеспечения режима стоячей волны в системе используется импульсный лазер с длительностью импульсов 1—2 мкс и частотой 25—50 кГц. При этом необходима система синхронизации с частотой лазерных импульсов, аналогичная системе синхронизации с частотой тела вращения электромеханического визуализатора. Применительно к синтезу радиосигнала для АОД, реализация этого метода основана на использовании аппаратуры, аналогичной разработанной для дисплея с электромеханическим визуализатором, но, помимо расчета частот синусоидальных гармоник для каждой точки, осуществляется расчет девиаций частоты этих гармоник по линзовому закону. Для оценки работоспособности метода и требований к голограммам разработан моделирующий пакет программ и проведено компьютерное моделирование.
Требования к количеству дискретов выборки радиосигнала, образующегося из суммы синусоидальных гармоник, были оценены в процессе моделирования оптического поля на выходе дефлектора в различных зонах дифракции. В процессе моделирования оценен также вид голограммы светящейся точки.

Лазер

Луч
Радиоэлектронный блок

Система линз

Цифровой блок

Блок синхронизации

Голограмма микролинз

Голограмма
светящейся линии

Компьютер
Рис. 4
На рис. 4 приведена структурная схема трехмерного лазерного дисплея, который реализует „рельефный“ принцип формирования изображения только по периметрам подсвеченных точек. Эта система включает следующие основные устройства:
— визуализатор, состоящий из двух голограмм; — синхронизирующее устройство с частотой лазерных импульсов; — импульсный лазер с коллимирующими и фокусирующими оптическими элементами; — двухкоординатный АОД, управляющий сканированием лазерного луча, его фокусом и модулирующий его яркость;

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 7

66 М. М. Кольцов, С. В. Кузнецов
— двухканальный радиоэлектронный возбудитель АОД, контролирующий амплитуду и частоту радиосигнала посредством цифровых кодов;
— цифровой блок, включающий буферную видеопамять, хранящую выборки радиосигнала (голограмму) для всех строк по координате Х, и такой же цифровой блок, управляющий лучом по координате Y, с голограммой, сформированной по линзовому закону для всех точек на одной несущей частоте;
— компьютерный интерфейс (PCI шина). Результаты поиска публикаций по системе формирования объемных изображений, аналогичной предлагаемой, показали отсутствие полного аналога разработанного объемного дисплея [2—10]. Сравнение рассмотренной голографической системы объемного видения с наиболее близкой к ней голографической системой на микрозеркальном модуляторе с LCD многослойным транспарантом [2] показало, что в предлагаемой авторами настоящей статьи технологии на основе акустооптического дефлектора расчет голограммы существенно проще, так как она одномерная для одной строки пикселов кадра, а не двумерная. Кроме того, подсвечиваются только точки периметров объектов сцены, а не весь растр объемного изображения; существенно сокращается время расчета объемного кадра для динамического изображения. В настоящее время синтез голограммы осуществляется авторами, как и зарубежными конкурирующими разработчиками, программно на персональном компьютере, но время расчета одного кадра не превышает 5—10 с в зависимости от сложности изображения (тогда как у конкурентов — до 7 мин). Сформированные ролики из кадров выводятся в реальном времени с частотой смены кадров 25—50 Гц. В дальнейшем предполагается перевести процедуру расчета в цифровую БИС, при этом синтез одномерной голограммы будет совмещен с воспроизведением кадров в реальном времени. В настоящее время разработан макетный образец проекционного голографического дисплея.
Исследования выполнены при поддержке Фонда содействия развитию малого бизнеса в научно-технической сфере, гос. контракты № 4462р/6849, 5568р/6849.

СПИСОК ЛИТЕРАТУРЫ

1. Golovkov A., Kuznetsov S., Voronov A. Image formation in the three-dimensional laser display // Pattern Recognition and Image Analysis. 1996. Vol. 6, N 4. P. 823—826.

2. Huebschman M., Munjuluri B., Garner H. Digital micromirrors enable holographic video display // Laser Focus World. 2004. May. P. 111—116.

3. Chinnock C. Volumetric imaging provides a walk-around view // Laser Focus World. 1994. Vol. 29, N 9. P. 20—22.

4. Bains S. Radial scanning produces 3-D image on flat screen // Laser Focus World. 1993. Vol. 29, N 1. P. 41—42.

5. Pat. 4871231 USA. Three Dimensional Color Display and System / F. Garcia. 1989.

6. Pat. 5148310 USA. Rotating Flat Screen Fully Addressable Volume Display System / R. G. Batehko. 1992.

7. Pat. 4881068 USA. Three Dimensionаl Display Apparatus / E. J. Korevaar, B. Spivey. 1988.

8. Pat. 4870485 USA. Three Dimensional Generating Apparatus Having a Phosphor / E. A. Downing, B. Torres. 1989.

9. Pat. 4833528 USA. Color Video Projection Apparatus Using Acousto-Optical Deflector / K. Kobavashi, C. Kowa. 1989.

10. Stereoscopic display exploits the brain. Three dimensional imaging // Laser Focus World. 2000. Sept.

Михаил Михайлович Кольцов

Сведения об авторах — Санкт-Петербургский государственный электротехнический универ-
ситет „ЛЭТИ“, кафедра радиоэлектронных средств; ассистент; E-mail: mihail_koltsov@mail.ru

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 7

Моделирование процессов распространения излучения в светодиодах

67

Сергей Викторович Кузнецов

— канд. техн. наук, доцент; Санкт-Петербургский государственный электротехнический университет „ЛЭТИ“, кафедра радиоэлектронных средств; E-mail: kuz2006ru@yandex.ru

Рекомендована кафедрой радиоэлектронных средств

Поступила в редакцию 05.06.09 г.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2010. Т. 53, № 7