Например, Бобцов

ИССЛЕДОВАНИЕ МЕТОДА СЖАТИЯ ИЗОБРАЖЕНИЙ С ПОТЕРЯМИ НА ОСНОВЕ АДАПТИВНОГО КВАНТОВАНИЯ

ИССЛЕДОВАНИЕ МЕТОДА СЖАТИЯ ИЗОБРАЖЕНИЙ С ПОТЕРЯМИ …
УДК 004.627
ИССЛЕДОВАНИЕ МЕТОДА СЖАТИЯ ИЗОБРАЖЕНИЙ С ПОТЕРЯМИ НА ОСНОВЕ АДАПТИВНОГО КВАНТОВАНИЯ
Ю.В. Лужков, А.Ю. Тропченко
Предложен метод вычисления значений коэффициентов вектора квантования для схем сжатия изображений с потерями, основанный на использовании весового критерия. Проведено сравнение базовой схемы JPEG и ее модификации на основе разработанного метода. Данная модификация превосходит схему JPEG на 10–25 %. Произведено обобщение метода для схем сжатия на основе адаптивной сегментации. Ключевые слова: сжатие изображений, адаптивное квантование, весовой критерий, JPEG.
Введение На сегодняшний день широко распространены схемы сжатия на основе спектральных преобразований сигнала. Среди таких преобразований – дискретное косинусное преобразование (ДКП), дискретное вейвлет-преобразование (ДВП) и некоторые другие. Вследствие широкой распространенности таких схем сжатия актуальным становится следующий вопрос: возможно ли модифицировать существующую схему компрессии таким образом, чтобы повысить степень сжатия, не меняя при этом алгоритм декомпрессии? Решение этой задачи позволит вносить изменения в существующие программы-компрессоры, не заботясь о наличии у пользователей специального (модифицированного) программного обеспечения для декомпрессии изображений. В описываемых алгоритмах сжатия используются некоторые параметры по умолчанию. Например, в формате JPEG (Joint Photographic Experts Group) [1] к таким параметрам относятся матрицы квантования и таблицы Хаффмана: они сохраняются в заголовке сжатого файла, и формат допускает самостоятельное определение пользователем их значений, что является одним из путей повышения степени компрессии.
96 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2009, № 4(62)

Ю.В. Лужков, А.Ю. Тропченко

На сегодняшний день известно несколько методов определения векторов кванто-
вания коэффициентов спектра. С. Ву и А. Гершо в работе [2] предлагают метод на основе пошагового изменения его значений. Изначально все коэффициенты инициализи-
руются максимальными значениями. На каждом шаге производится уменьшение одного из коэффициентов на некоторую величину. Поскольку оптимизация вектора прово-
дится только в направлении уменьшения коэффициентов, ее можно назвать однонаправленной.
Х. Фунг и К. Паркер в работе [3] предлагают двунаправленный метод оптимизации: на очередном шаге алгоритма коррекция коэффициента может производиться как
в сторону уменьшения его значения, так и в сторону увеличения. В работе [4] предлагается метод вычисления вектора квантования, основанный на
RD-оптимизации. Схема имеет принципиальное отличие от пошаговых однонаправленных и двунаправленных схем: вычисления значений вектора квантования проводятся
сразу для многих значений битрейта R или значений искажения D, а выбор нужного набора коэффициентов осуществляется в самом конце из множества вариантов.
Все описанные схемы используют в качестве оценки битрейта энтропийную функцию, аппроксимирующую результат сжатия. Поскольку битрейт в значительной
степени зависит от применяемых методов вторичного сжатия (например, статистического кодирования или кодирования длин серий), энтропийная функция не является
универсальной и должна определяться для конкретной схемы сжатия. В данной работе предлагается метод вычисления вектора квантования, не исполь-
зующий энтропийные оценки. Он основан на сборе статистической информации о сигнале, которая оценивается с помощью специального критерия. Коэффициенты вектора
квантования вычисляются в соответствии со значениями данного критерия. Благодаря этому алгоритм вычисления вектора является универсальным и может быть использо-
ван во многих схемах компрессии без существенных изменений.

Вычисление вектора квантования на основе весового критерия

Известно, что энергия сигнала распределяется между спектральными коэффициентами неравномерно. Более того, существует выраженная зависимость распределения
энергии от номера спектральной позиции в окне сканирования. Идея предлагаемого ме-

тода заключается в том, чтобы квантовать коэффициенты на данной спектральной по-

зиции n с шагом квантования Δ, значение которого зависит от степени значимости этой

спектральной позиции с необходимо определить

фтоунчккицизюрешниаягаркавспанртеодвеалнениияя∆э(нzrе,рnг)и, игдсепеzrкт–рав.екТтаокримспоебкртразаолмь-,

ных коэффициентов. Чтобы оценить значимость каждой спектральной позиции n для всех M одинако-

вых по размеру блоков с номерами m = 0, 1, K, M −1, вводится специальный весовой

критерий T. В работе [5] рассмотрено несколько способов его задания и отмечено, что в ряде случаев выгоден способ вычисления критерия на основе максимальных значений

амплитуд спектральных коэффициентов zn,m :

Tn = max zn,m .

(1)

Пример зависимости величины критерия T (его целочисленные значения упорядо-

чены по убыванию) от номера позиции n спектрального коэффициента приведен на

рис. 1. Сплошная линия соответствует составляющей яркости Y, пунктир – хроматиче-

ским составляющим Cb и Cr.

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2009, № 4(62)

97

ИССЛЕДОВАНИЕ МЕТОДА СЖАТИЯ ИЗОБРАЖЕНИЙ С ПОТЕРЯМИ …

Рассмотрим вопрос определения функции шага квантования ∆(zr, n) . Пусть ее

значения должны быть ограничены диапазоном [a1, a2 ], 0 ≤ a1 < a2 . Введем функцию

овФгдстаееTкхт:f)иэEлч(–ееTмс)кк)еои=нртэaрот1ево+ктиеиf)ссf)р(хт(TуьоTmюдmaфнxaщxу)о)ан−г−яокf)цфf)си(п(уTяTнеmnкiкшn)тц)ари(гаaяал2.ьк−Пнвоaоа1гнс)окт,ооввлеаькнктуиоярлаюсибzrгон,йафлTуанn к∆цв(иzrо,ябnщ)E.етВмавксежлдеуечмзааеовбизосазивнитасчо(и2еттн) иоzrет.

f

(zr,

) n) = f (Tn ∆(zr, n) =

) . Тогда формула (2) окончательно принимает

∆(T ) = a1 +

f

(fzr(,znr,mnamxa)x−)

− f

f (zr, n) (zr,n min

)

(a2

− a1).

следующий

вид:

(3)

ТT 1000
800
600

Y Cr,Cb

400 200

0 1 11 21 31 41 51 61
Рис. 1. График зависимости T (n)

n n

Результаты сжатия тестовых изображений «Lena» и «Oldman» представлены на рис. 2 как зависимость величины среднеквадратической ошибки (RMSE) значения пик-
села от среднего числа бит на пиксель в сжатом изображении. Сплошные линии соответствуют базовой схеме JPEG, пунктир – модифицированной схеме, шаг квантования
в которой вычисляется по формуле (3) с использованием критерия максимальных амплитуд (1).

RMSE RMSE

Изображ ение "Lena"
10
8
6

Изображ ение "Oldman"
12 9

46

2 b
0 (бит/пикс.) 0 3 6 9 12

3 0b
0 2 4 6 8(бит/пикс.)

98 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2009, № 4(62)

Ю.В. Лужков, А.Ю. Тропченко
Рис. 2. Результаты компрессии тестовых изображений
Для визуальной оценки качества сжатия рассмотрим разностные изображения. На рис. 3 и 4 приведены разностные изображения для двух цветовых плоскостей. Изображения слева соответствуют стандартной схеме JPEG, справа – модифицированной схеме на основе весового критерия.
Разностные изображения получены вычитанием восстановленного рисунка Q из исходного изображения P для каждого i-го пикселя: Di = 255 − a Pi − Qi , где a – коэффициент масштаба, при этом чем темнее пиксель разностного изображения, тем больше ошибка. Как видно, высокочастотные области изображений, сжатых по модифицированной схеме, искажены незначительно, что обусловлено адаптивным выбором шага квантования для разных частот.
В таблице приведены численные результаты сжатия для четырех тестовых изображений. Как видно из представленных данных, при использовании модифицированной схемы величина среднеквадратической ошибки (RMSE) сокращается до 30 %.

Базовая схема

Модифицированная схема

Рис. 3. Разностные изображения для цветовой плоскости Y

Базовая схема

Модифицированная схема

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2009, № 4(62)

99

ИССЛЕДОВАНИЕ МЕТОДА СЖАТИЯ ИЗОБРАЖЕНИЙ С ПОТЕРЯМИ …

Рис. 4. Разностные изображения для цветовой плоскости Cb

Изображение
«Lena» «Baboon» «Peppers» «Oldman»

Базовая схема JPEG

Средн. число бит на пикс.
5,979 11,606
7,402 4,104

RMSE
2,813 2,95 3,07 2,222

Модифицированная схема

Средн. число RMSE бит на пикс.

6,034

2,531

11,7 2,134

7,357

2,555

4,105

1,696

Сокращение RMSE, %
10 27 17 24

Таблица. Результаты экспериментов

Выигрыш в сжатии особенно значителен для изображений, на которых присутствуют разные, не всегда однородные участки, соответствующие различным частотным
составляющим.

Применение адаптивного квантования совместно с адаптивной сегментацией

Широко распространенными являются схемы сжатия, использующие адаптивную сегментацию на основе разбиения и слияния областей [6]. Обобщим предложенный метод адаптивного квантования для таких схем сжатия.
Пусть дано изображение H с линейными размерами H x × H y , разбитое на M пря-

моугольных непересекающихся областей H m , m = 0, M −1, причем размерность m-ой

области



H

m x

×

H

m y

.

Требуется

найти

матрицу квантования



размерности

∆x

×∆y.

Аналогично ранее описанному подходу, каждому элементу матрицы квантования

поставим в соответствие весовой критерий T.

Поскольку области имеют разный размер, можно использовать масштабирование

прямоугольной матрицы сегмента в матрицу квантования, причем конкретный спек-

тральный коэффициент входит в формулу вычисления критерия T с некоторым коэф-

фициентом, в общем случае зависящим от размеров изображения и данной локальной

области:

( )αm



H

x

,

H

y

,

H

m x

,

H

m y

.

Простейший вариант вычисления αm основан на соотношении площадей сегмента и рисунка:

αm

=

H

m x

H

m y

HxHy

.

Поскольку размерность матрицы квантования в общем случае не равна размерно-

сти данного сегмента, каждый спектральный коэффициент линейно масштабируется на

соответствующую позицию матрицы:

zx, y ~ ∆i, j ,

i

=

  

x∆ x Hx

 , 

j

=

  

y∆ y Hy

  

.

При этом вместо спектрального значения zx, y в выражения для вычисления T

подставляется α m z x, y . Таким образом, каждый сегмент вносит свой вклад в вычисле-

100

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2009, № 4(62)

Ю.В. Лужков, А.Ю. Тропченко
ние значений критерия пропорционально своему весу (в простейшем случае вес – это площадь).
Подход не исключает реализацию масштабирования коэффициентов матрицы квантования для различных сегментов с целью улучшения визуального восприятия изображения.
Основные результаты и выводы
Предложен метод вычисления векторов квантования на основе весового критерия. Представлены экспериментальные данные для ряда тестовых изображений, также приведены разностные изображения для визуальной оценки ошибки компрессии, проведен анализ полученных результатов. Разработанный метод позволяет сократить размер сжатого файла в среднем на 10–25% по сравнению с неадаптивными схемами. При использовании разработанного метода в схеме JPEG необходимо внести изменения только в программу сжатия. Для декомпрессии изображений достаточно использовать стандартный JPEG-декомпрессор.
Произведено обобщение разработанного метода для схем сжатия на основе адаптивной сегментации.
Литература
1. Wallace G.K. The JPEG still picture compression standard // IEEE Trans. Consumer Electronics. – 1992. – Vol. 38. – № 1. – P. 18–34.
2. Wu S.W., Gersho A. Rate-constrained picture-adaptive quantization for JPEG baseline coders // IEEE International Conference on Acoustics, Speech, and Signal Processing. – 1993. – Vol. 5. – P. 389–392.
3. Fung H.T., Parker K.J. Design of image-adaptive quantization tables for JPEG // J. of Electronic Imaging. – 1996. – Vol. 4. – № 2. – P. 144–150.
4. Ratnakar V., Livny M. RD-OPT: an efficient algorithm for optimizing DCT quantization tables // Proceedings of the Conference on Data Compression. – 1995. – P. 332–341.
5. Лужков Ю.В. Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений // Известия вузов. Приборостроение. – 2009. – Т. 52. – Вып. 3. – С. 12–16.
6. Shukla R., Dragotti P.L., Do M., Vetterli M. Improved quadtree algorithm based on joint coding for piecewise smooth image compression // IEEE International Conference on Multimedia and Expo. – 2002. – Vol. 1. – P. 637–640.

Лужков Юрий Валерьевич Тропченко Александр Ювенальевич

– Санкт-Петербургский государственный университет информационных технологий, механики и оптики, аспирант,
luzhkov@inbox.ru – Санкт-Петербургский государственный университет ин-
формационных технологий, механики и оптики, доктор технических наук, профессор, tau@d1.ifmo.ru

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2009, № 4(62)

101