Например, Бобцов

МЕТОД АДАПТИВНОГО СКАЛЯРНОГО КВАНТОВАНИЯ В СХЕМАХ НЕОБРАТИМОГО СЖАТИЯ ИЗОБРАЖЕНИЙ

12 Ю. В. Лужков
УДК 004.627
Ю. В. ЛУЖКОВ
МЕТОД АДАПТИВНОГО СКАЛЯРНОГО КВАНТОВАНИЯ В СХЕМАХ НЕОБРАТИМОГО СЖАТИЯ ИЗОБРАЖЕНИЙ
Рассматривается проблема адаптивной генерации матриц квантования. Для схем сжатия изображений с потерей качества, использующих спектральные преобразования, предложен способ адаптивного скалярного квантования спектральных коэффициентов на основе весового критерия и рассмотрены способы определения этого критерия. Ключевые слова: сжатие изображений, адаптивное квантование, весовой критерий, JPEG.
Введение. В настоящее время одним из распространенных форматов сжатия изображений с потерей качества является JPEG (Joint Photographic Experts Group) [1]. Разработаны и другие схемы сжатия (см., например, работы [2, 3]), эффективность которых существенно превосходит алгоритмы на основе дискретных спектральных преобразований. Однако вследствие широкой распространенности последних перед исследователями встает следующий вопрос: возможно ли модифицировать существующую схему компрессии таким образом, чтобы повысить степень сжатия, не меняя при этом алгоритм декомпрессии? Решение этой задачи позволит вносить изменения в существующие программы-компрессоры, не заботясь о наличии у пользователей специального (модифицированного) программного обеспечения для декомпрессии изображений.
В применяемых алгоритмах сжатия используются некоторые параметры по умолчанию. Например, в формате JPEG к таким параметрам относятся матрицы квантования и таблицы Хаффмана: они сохраняются в заголовке сжатого файла, и формат допускает самостоятельное определение пользователем их значений, что является одним из путей повышения степени компрессии. Так, известны несколько подходов к составлению матриц квантования в формате JPEG (например, [4, 5]), которые, однако, не являются универсальными и требуют сравнительно большого объема вычислений.
В настоящей статье рассматривается обобщенный подход к адаптивному скалярному квантованию коэффициентов спектра, предлагаемый способ прост в реализации и может быть применен, в частности, для формата JPEG.
ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 3

Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений 13

Адаптивное квантование сигнала. Квантование — способ обработки сигнала, сопряженный с внесением в него искажения. Суть квантования сводится к разбиению диапазона значений сигнала z на конечное число интервалов с последующим выбором одного значения для представления любой величины из данного интервала. При векторном квантовании — это разбиение пространства возможных значений векторной величины на конечное число областей. Наиболее полный аналитический обзор вопросов квантования приведен в работе [6].

Так, пусть заданы множество интервалов S = {Si ; i ∈ ]} и множество точек

C = {yi ; i ∈ ]} , тогда функция квантования сигнала z определяется как q(z) = yi для z ∈ Si .
При равномерном скалярном квантовании множество интервалов можно представить в виде

Si = [d + ∆i, d + ∆(i + 1)) , i ∈ ] ,

где ∆ — параметр, или шаг, квантования; величина d задает смещение интервалов Si относи-

тельно нуля, d ∈[−∆ / 2, ∆ / 2) ; i — номер интервала, который и является кодируемым объектом.

Тогда операция квантования может быть сведена к простому делению с округлением:

q(x) = i = [(z − d )/ ∆],

(1)

где [⋅] — операция округления до ближайшего целого. При восстановлении сигнала z привносится ошибка e : z = q(z) − e .

Методы адаптивного квантования могут быть разделены на две группы: адаптивное скалярное квантование; векторное и кодовое квантование.
Адаптивность в скалярном квантовании достигается путем индивидуального выбора параметра квантования ∆ для каждого квантуемого значения.
Адаптивное скалярное квантование на основе весового критерия. Предлагаемый в настоящей статье подход основан на статистическом анализе коэффициентов спектра. Этот подход может быть использован в схемах сжатия (например, JPEG) при условии, что окно сканирования сигнала имеет постоянный размер.
Так, пусть дана последовательность коэффициентов спектра, разбитая на M одинаковых

блоков по N значений в каждом, при этом n = 0, N −1 — номер (позиция) коэффициента в

данном блоке, т.е. каждый коэффициент имеет аналог в любом другом блоке. Суть предлагаемого подхода заключается в следующем: для каждого n-го номера вычисляется значение специального весового критерия, и значение параметра квантования данного коэффициента спектра тем больше, чем меньше соответствующее ему значение весового критерия.
Таким образом, идея метода основана на том, что процедура квантования выполняется с учетом некоторой статистической информации о сигнале, заданном как

{ }z = z0,0 , …, zN −1,M −1 , полученной от M блоков для каждого порядкового номера n. Функция

квантования (1) в этом случае будет обозначаться как q(z, n) , а функция параметра кванто-

вания — как ∆(z, n) .

Введем критерий T , назвав его весом спектрального коэффициента. Величина T от-

ражает степень значимости спектральных коэффициентов zn,m , имеющих одинаковый по-

рядковый номер n, для всех M блоков, m = 0, M −1. Рассмотрим некоторые способы опреде-

ления критерия T . Первый из возможных способов основан на статистике максимальных значений:

∑M −1
Tn = cn ,
m=0

cn

=

⎪⎧1, ⎪⎨⎩0,

zn,m = zm,max ; zn,m ≠ zm,max ,

где zm,max — максимальный по модулю спектральный коэффициент в данном блоке.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 3

14 Ю. В. Лужков

Такой способ вычисления критерия пригоден в том случае, если нет выраженной концентрации энергии сигнала на определенных спектральных позициях. Однако, как показали, например, эксперименты с дискретным косинусным преобразованием (ДКП), в 99 % случаев коэффициент с номером 0 определяется как максимальный, причем для более чем 90 % номеров n значение критерия T равно 0, что препятствует практическому использованию данного критерия в схемах сжатия на основе ДКП.
Другой способ вычисления T является развитием предыдущего и основан на пороговом ограничении спектральных коэффициентов:

∑M −1
Tn = cn ,
m=0

cn

=

⎪⎧1, ⎪⎩⎨0,

zn,m ≥ P; zn,m < P,

0 < P ≤ zm,max ,

где P — порог ограничения.

Использование порогового ограничения позволяет решить проблему непропорциональ-

ного распределения энергии сигнала, присущую первому способу. Однако основной недоста-

ток порогового вычисления T — необходимость определения значения P.

Следующий алгоритм вычисления T оперирует средними амплитудами спектра, не ис-

пользуя при этом порог P:

∑Tn

=

1 M

M −1
zn,m
m=0

.

(2)

Достоинством данного способа является отсутствие обязательной дополнительной обработки сигнала (для определения порога P). К недостаткам можно отнести операции с числами с плавающей запятой (при использовании предыдущих способов выполняется просто увеличение счетчиков на единицу).
На рис. 1, а, б представлена зависимость T (n) , вычисленная по формуле (2) для коэф-
фициентов ДКП при M = 8 × 8 = 64 : а — результаты вычислений для матрицы яркости Y изображений ”Lena” и ”Oldman”, б — для хроматических матриц изображения ”Oldman”. На графиках значения T упорядочены так, чтобы значения критерия не возрастали. Как видно, динамика изменения величины T достаточно резкая, что в некоторых случаях может привести к чрезмерному квантованию малозначимых спектральных коэффициентов.

а) Т 100
10

— изображение ”Lena”
— изображение ”Oldman”

б) Т 10 1 1 11

21 31 41

— Cb — Cr
51 61 п

1 1 11

21 31 41

51 61 п

0,1

0,1 0,01

0,01 0,001

Рис. 1

Скорректировать ситуацию можно, выбирая в качестве значения критерия максимальные амплитуды коэффициентов:

Tn = max zn,m .

(3)

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 3

Метод адаптивного скалярного квантования в схемах необратимого сжатия изображений 15
Обратимся далее к определению функции ∆(z, n) . Пусть ее значения ограничены диапа-
зоном [a1, a2 ], 0 ≤ a1 < a2 . Введем линейную функцию от T :

E(T

)

=

a1

+

Tmax − Tn Tmax − Tmin

(a2



a1)

.

Также может использоваться нелинейная функция от T , что достигается введением корректирующей функции f :

E(T ) = a1 +

f

f (Tmax (Tmax )

)−
−f

f (Tn ) (Tmin

)

(a2

− a1).

(4)

Поскольку любое значение критерия Tn в общем случае зависит от всех коэффициентов исходного спектрального вектора z , то функция E также зависит от z . Фактически это есть
функция параметра квантования сигнала ∆(z, n) . Введем обозначение f (z, n) = f (Tn ) . Тогда формула (4) окончательно принимает следующий вид:

∆(z, n) = ∆(T ) = a1 +

f

f (z, n max ) − (z, n max ) − f

f (z, (z, n

n)
min

)

(

a2

− a1 ) .

(5)

Таким образом, функция параметра квантования локализована в диапазоне от a1 до a2. Варьируя ее форму, можно осуществлять квантование коэффициентов спектра с данным порядковым номером с большим или меньшим шагом: см. рис. 2, а (значения T упорядочены по возрастанию). На рисунке кривая 1 соответствует линейному преобразованию, кривая 2 —
преобразованию с использованием функции f . Так, пусть известно, что высокочастотным
коэффициентам спектра соответствуют малые значения T . Тогда для подавления высоких
частот достаточно задать функцию f с таким расчетом, чтобы ее энергия на начальном уча-
стке была большой.
Примеры корректирующих функций f приведены на рис. 2, б.

а) ∆(T)
a2

1

б) y 0,8 0,6

— 1–sin(πx/2)
— 1–x — 1–sin3(πx/2)

2 a1

0,4 0,2

Тmin

Тmax Т(z) 0

0,2 0,4 0,6 0,8 x

Рис. 2

Квантование с различным шагом реализовано, например, в формате JPEG. Однако значения параметра ∆ не вычисляются адаптивно, а представлены значениями по умолчанию. Рассмотрим возможность применения предложенного подхода для адаптивной генерации матриц квантования в схеме JPEG. В формуле (5) будем использовать линейную корректирующую функцию и критерий максимальных амплитуд (3).

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 3

16 Ю. В. Лужков

На рис. 3, а приведены графики стандартных функций параметра квантования в форма-

те JPEG, а на рис. 3, б — графики значений ∆, сгенерированных адаптивным способом для

изображения ”Oldman”. В обоих случаях значения упорядочены в соответствии с „зигзаг“-

сканированием. Как видно, отличие сгенерированных значений от стандартных достаточно

велико.

а) ∆ 120

б) ∆ 120

80 80

40

—Y — Cb, Cr

40

—Y — Cb, Cr

0

20

40

60 n

0

20 40

60 n

Рис. 3
График зависимости T (n) для изображения ”Oldman” представлен на рис. 4, а. На

рис. 4, б показаны результаты сжатия этого изображения с применением функций квантова-

ния, данных по умолчанию (кривая 1), и функций, сгенерированных в рамках эксперимента

(кривая 2). По оси абсцисс — среднее число бит на пиксел ( b ), по оси ординат — пиковое

отношение сигнала к шуму (PSNR). Анализ результатов показывает, что разница в степени

сжатия составляет до 20 % в пользу адаптивного подхода при одинаковых значениях PSNR.

а) Т

б) PSNR, дБ

1000 800

—Y — Cb, Cr

100

2

600 90 1

400 80
200

0 70

1 11 21 31 41 51 61 n

024

6 b, бит/пиксел

Рис. 4

Заключение. Предложенный способ адаптивного скалярного квантования коэффициен-

тов спектра основан на вычислении критерия значимости коэффициентов спектра. Как пока-

зали эксперименты, применение рассмотренного подхода в схеме JPEG позволяет получить

выигрыш по степени сжатия до 20 % по сравнению с использованием стандартных матриц

квантования.

При практическом использовании рассмотренного метода квантования необходима мо-

дернизация только компрессора, а для просмотра изображений достаточно применения стан-

дартного JPEG-декомпрессора, что является важным достоинством предложенного решения.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 3

Система автоматического распознавания речевых команд

17

СПИСОК ЛИТЕРАТУРЫ

1. Wallace G. K. The JPEG still picture compression standard // IEEE Trans. Consumer Electronics. 1992. Vol. 38,
N 1. P. 18—34.

2. Shukla R. Rate-distortion optimized tree-structured compression algorithms for piecewise polynomial images // IEEE
Transact. on Image Processing. 2005. Vol. 14, N 3. P. 343—359.

3. Dalai M., Leonardi R. L-inf norm based second generation image coding // Proc. of Intern. Conf. on Image
Processing. 2004. P. 3193—3196.

4. Ratnakar V., Livny M. Extending RD-OPT with global thresholding for JPEG optimization // Proc. of the Conf. on
Data Compression. 1996. P. 379—386.

5. Fung H. T., Parker K. J. Design of image-adaptive quantization tables for JPEG // J. of Electronic Imaging. 1996.
Vol. 4, N 2. P. 144—150.

6. Gray R. M., Neuhoff D. L. Quantization // IEEE Transact. on Information Theory. 1998. Vol. 44, N 6. P. 2325—2383.

Юрий Валерьевич Лужков

Сведения об авторе — аспирант, Санкт-Петербургский государственный университет ин-
формационных технологий, механики и оптики, кафедра вычислительной техники; E-mail: luzhkov@inbox.ru

Рекомендована кафедрой вычислительной техники

Поступила в редакцию 24.11.08 г.

ИЗВ. ВУЗОВ. ПРИБОРОСТРОЕНИЕ. 2009. Т. 52, № 3