Например, Бобцов

АНАЛИЗ ГОТОВНОСТИ МНОГОУРОВНЕВОЙ КОММУНИКАЦИОННОЙ ПОДСИСТЕМЫ КОМПЬЮТЕРНЫХ СИСТЕМ КЛАСТЕРНОЙ АРХИТЕКТУРЫ

4 КОМПЬЮТЕРНЫЕ СИСТЕМЫ И ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ
УДК 681.3
АНАЛИЗ ГОТОВНОСТИ МНОГОУРОВНЕВОЙ КОММУНИКАЦИОННОЙ ПОДСИСТЕМЫ КОМПЬЮТЕРНЫХ
СИСТЕМ КЛАСТЕРНОЙ АРХИТЕКТУРЫ
В.А. Богатырев, С.В. Богатырев
Оценена надежность типовых подсистем трехуровневой резервированной коммуникационной подсистемы. Каждый коммутационный узел представляется содержащим базовое оборудование, отказ которого приводит к полному отказу узла, и оборудование, отказ которого влечет неработоспособность соответствующего порта. Ключевые слова: надежность, готовность, отказоустойчивость, коммуникационная подсистема.
Введение
Структурная организация коммуникационной подсистемы во многом определяет производительность, надежность и отказоустойчивость компьютерной системы, причем даже в большей степени, чем параметры используемых компьютеров. Высокая надежность компьютерных систем требует резервирования средств обработки, хранения и передачи информации, в том числе коммуникационных узлов и их связей [1]. Для современных корпоративных сетей характерна многоуровневая организация коммуникационной подсистемы с выделением уровней доступа, распределения и ядра [1]. Оценка надежности двухуровневой коммуникационной системы подключения к корпоративной информационной системе серверов, каждый из которых требует подключения к двум коммутационным узлам, рассматривалась в [2].
В статье решаются задачи точной оценки надежности трехуровневой коммуникационной системы с дублированием коммуникационных узлов (коммутаторов, маршрутизаторов и др.) среднего уровня при подключении клиентских компьютерных узлов, а также оценки надежности одно- и двухуровневых коммуникационных систем подключения серверных узлов, требующих дублирования коммуникационных средств нижнего уровня. Подключение клиентских компьютеров осуществляется к коммутационным узлам нижнего уровня без дублирования связей.
Подсистема подключения клиентских компьютеров
Типовая трехуровневая дублированная коммуникационная подсистема подключения клиентских компьютеров представлена на рис. 1. Коммутаторы нижнего уровня (КНУ) выполняют функции уровня доступа, коммутационные узлы среднего уровня (КСУ) – уровня распределения, а коммутаторы верхнего уровня (КВУ) – уровня ядра сети. Подключение клиентских компьютеров к КНУ не требует резервирования.
Число портов каждого коммутатора нижнего уровня (используемых для подсоединения компьютеров) будем считать достаточным для подключения к нему n компьютерных узлов (общее число компьютеров больше n). Число портов каждого КСУ равно m. Число портов каждого КВУ достаточно для подсоединения к нему M дублированных КCУ. Общее число компьютеров в системе M mn , число КНУ – M m , число КСУ с учетом их дублирования – 2M, число КВУ – 2. Узлы, включающие каждую пару КСУ и подключенные к ним КНУ и КУ, будем рассматривать как дублированную группу КСУ. В конфигурации выделяется М групп дублированных КСУ.
88 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2009, № 1(59)

Проведем оценку надежности трехуровневой коммуникационной системы с дублированием коммуникационных узлов среднего уровня, но без резервирования КВУ. Компьютерные узлы считаются равноправными с одинаковыми параметрами надежности. Отказы всех компонент коммуникационной подсистемы примем независимыми. Взаимосвязь между любой парой компьютерных узлов предположим равновероятной.

Рис.1. Типовая структура трехуровневой коммуникационной подсистемы подключения клиентских компьютерных узлов
Условия работоспособности коммуникационной подсистемы могут включать требования связанности: − между любой парой компьютерных узлов; − всех дублированных групп КСУ через КВУ при допустимости связи с КСУ части
КНУ внутри каждой дублированной группы; − всех дублированных групп КСУ через КВУ при связи с КСУ всех КНУ внутри каж-
дой дублированной группы, но допустимости потери связанности с КНУ части подключенных к нему компьютерных узлов.
При построении модели надежности в каждом коммутационном узле выделяется некоторое общее (базовое) оборудование, отказ которого приводит к полному отказу узла, и оборудование, отказы которого приводит к потере работоспособности отдельных портов. Таким образом, возможны работоспособные состояния коммуникационной системы, при которых каждый отдельный коммутатор не поддерживает требуемой связанности, а она обеспечивается совокупностью частично работоспособных коммутаторов.
Связанность коммутатора с компьютерным узлом нарушается при отказе любого элемента цепи «сетевой адаптер–линия связи–порт коммутатора» (СА–Л–ПК). Связанность между коммутационными узлами нарушается при отказе любого элемента цепи «порт коммутатора–линия связи–порт коммутатора» (ПК–Л–ПК). При оценке надежности в каждой из M дублированных групп КСУ воспользуемся методом разложения относительно особых элементов, в качестве которых выберем пару коммутаторов среднего уровня. С учетом функциональности конфигурации при связанности КВУ с требуемым числом компьютеров в каждой из M групп (пар КСУ и подключенных к ним КНУ) вероятность работоспособности конфигурации (коэффициент готовности) равна
[ ]P1 = pB r1c P1c + r20c P20c + r21c P21c M ,
где для каждой из M групп КСУ–КНУ r1c = 2 pc (1− pc ) – вероятность исправности одно-
го (любого) из двух КСУ, а r20c = pc2 (1− pk ) и r21c = pc2 pk – вероятности исправности

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2009, № 1(59)

89

обоих КСУ соответственно при отказавшей и исправной горизонтальной связи между

ними, при этом pc и pB – надежности базового оборудования КСУ и КВУ, pk – надеж-

ность связи ПК–Л–ПК.

При исправности одного (любого) из двух КСУ группы в ней обеспечивается свя-

занность, если требуемое число коммутаторов нижнего уровня подключено к исправ-

ному КСУ группы, а он имеет соединение с функционирующим КВУ. Вероятность это-

го события P1c = pk R1 , где R1 – вероятность подключения не менее требуемого числа

КНУ к исправному КСУ. Если работоспособность системы обеспечивается при связан-

ности с КСУ не менее чем m1 из m КНУ, то
m
∑R1 = Cmi pai (1− pa )m−i , i = m1

(1)

где pa – надежность КНУ с учетом исправности его базового оборудования и требуе-

мого числа подключенных к нему компьютеров по связи СА–Л–ПК. Если для каждого

КНУ требуется связанность не менее чем с n0 из n подсоединенных к нему компьютеров, то

n
∑pa = pH Cni p0i (1− p0 )n−i , i = n1

(2)

где pH – надежность базового оборудования КНУ, p0 = pca pl ppk pcomp – надежность це-

пи «компьютер ( pcomp )–сетевой адаптер ( pca )–линия связи ( pl )–порт КНУ ( ppk )». Без

учета компьютеров p0

=

pca pl ppk . Надежность связи ПК–Л–ПК

pk

=

pl

p

2 pk

.

При исправности обоих КСУ группы и отказе горизонтальной связи между ними

необходимая связанность в группе обеспечивается, если при подключении к исправно-

му КВУ одного из КСУ группы с ним связано как минимум требуемое число КНУ. Не-

обходимая связанность в группе обеспечивается также, если при подключении к един-

ственному исправному КВУ обоих КСУ группы число подключенных хотя бы к одно-

му из них КНУ не меньше требуемого:

( )P20c = 2 pk 1− pk R1 + pk 2R2 ,

где R1 определяется по (1), R2 – вероятность подключения каждого из не менее m1 КНУ

группы хотя бы к одному из двух исправных КСУ,

∑ { } { }R2 =

m
Cmi ⎣⎡ 1− (1− pk )2

pa ⎤⎦i ⎣⎡(1− 1− (1− pk )2

pa ⎦⎤(m−i) ,

i = m1

(3)

а pa определяется по (2). При требовании подключения всех m КНУ

{ } { }R2 = ⎣⎡ 1− (1− pk )2 pa ⎤⎦m и R1= pk pa m . При исправности обоих КСУ группы и горизон-

тальной связи между ними связанность в группе обеспечивается, если к исправному

КВУ подключен хотя бы один КСУ, а число КНУ, подключенных хотя бы к одному

КСУ, не меньше m1, таким образом,

( )P21c = ⎢⎣⎡1− 1− pk

2

⎤ ⎦⎥

R2

,

где R2 определяется по (3).

Подсистема подключения серверов

Двухуровневая коммуникационная подсистема подключения серверов к корпоративной сети с дублированием коммуникационных средств представлена на рис 2, а, а

90 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2009, № 1(59)

одноуровневая – на рис. 2, б. Двухуровневая коммуникационная подсистема без резервирования КВУ приведена на рис 2, г.

а бв

г

Рис. 2. Типовые двухуровневые и одноуровневые резервированные

структуры подключения серверов

Одноуровневая конфигурация подключения серверов

Рассматриваемые варианты одноуровневой структуры резервированной комму-

никационной подсистемы представлены на рис. 2, б. Структура без горизонтальной свя-

зи обеспечивает связанность между любой парой из не менее требуемого числа компь-

ютерных узлов, если хотя бы один из дублированных коммутаторов поддерживает

связь не менее чем с требуемым числом (m либо m1) компьютеров. Вероятность работоспособности анализируемой структуры равна

P1 = 1− (1− pH R0 )2 = r1R0 + r2R1 ,

(4)

где pH – вероятность исправности базового оборудования КНУ, r1 – вероятность ис-

правности одного из двух коммутаторов, r1 = 2 pH (1− pH ) ; r2 – вероятность исправно-

сти обоих коммутаторов, r2 = pH 2 ; R0 – вероятность подключения не менее требуемого

числа компьютерных узлов к исправному коммутатору, R1 – вероятность подключения

хотя бы к одному из двух коммутаторов не менее требуемого числа компьютерных уз-

лов, R1 = 1− (1− R0 )2 .

Если систем должна обеспечивать связанность между всеми m компьютерами,

то R0 = pam , где pa = pca pl ppk – надежность цепи СА–Л–ПК. Если работоспособность

системы обеспечивается при связанности не менее чем m1 из m компьютеров, то

m
∑R0 = Cmi pai (1− pa )m−i . i = m1 Надежность одноуровневой коммуникационной системы с дублированием ком-

мутаторов с горизонтальной связью между портами двух коммутаторов вычисляется

как

P2 = r1R0 + r20R1 + r21R2 ,

(5)

где r20 и r21 – вероятность исправности обоих коммутаторов соответственно при отка-

завшей и исправной связи между ними, r20 = pH 2 (1− pk ) , r21 = pH 2 pk , при этом pk –

надежность цепи ПК–Л–ПК; pk = pl ppk2 , R2 – вероятность подключения не менее m1

компьютерных узлов хотя бы к одному из двух исправных коммутаторов, связанных

∑между собой, R2 = m Cmi ⎡⎣1− (1− pa )2 ⎤⎦i (1− pa )2(m−i) . При требовании связанности всех i = m1

компьютерных узлов (m1=m) R2 = ⎡⎣1− (1− pa )2 ⎤⎦m . В случае дублирования горизонталь-

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2009, № 1(59)

91

ной связи между коммутаторами надежность коммуникационной подсистемы P22 определяется по формуле (5), при r20 = pH 2 (1− pk )2 , r21(t) = pH (t)2 ⎡⎣1− (1− pk (t))2 ⎦⎤ .

Двухуровневые коммуникационные подсистемы подключения серверов

Варианты двухуровневой структура коммуникационной подсистемы без резерви-

рования коммутатора верхнего уровня (КВУ) и дублировании коммутаторов нижнего

уровня (КНУ) представлены на рис. 2, в, г. Структура по рис. 2, в, при отказе коммутатора верхнего уровня или хотя бы од-

ной его связи с коммутаторами нижнего уровня вырождается в структуру по рис. 2, а,

без горизонтальной связи, надежность которой определяется по формуле (4). При ис-

правности КВУ, двух КНУ и связей между ними структура по рис. 2, в, работоспособ-

на, если требуемое число компьютерных узлов подключено хотя бы к одному КНУ.

При исправности только одного КНУ функционирование структуры сохраняется, если

минимально необходимое число компьютеров подключено к функционирующему

КНУ. Таким образом, вероятность работоспособности конфигурации по рис. 2, в, вы-

числяем как

P3 = ⎡⎣(1− pB ) + pB (1− pk2 )⎦⎤ P1 + pB ( pk2[r1R0 + pH 2R2 ] ,

(6)

где pB – надежность базового оборудования КВУ. Структура по рис. 2, г, при отказе КВУ или хотя бы одной его связи с КНУ вы-

рождается в структуру по рис. 2, б, без горизонтальной связи, надежность которой оп-

ределяется по формуле (5), таким образом, вероятность работоспособности конфигура-

ции по рис. 2, г, определяется как P31 = ⎣⎡(1− pB ) + pB (1− pk2 )⎦⎤ P2 + pB pk2[r1R0 + pH 2R2 ] .

Результаты расчета надежности

Расчет проведем в предположении экспоненциального закона вероятности безотказной работы. В этом случае вероятности работоспособности компонент системы за
время t определяются как pH = exp(−λ0t) , pB = exp(−λ0t) , pca = exp(−λcat) ,
pl = exp(−λlt) , ppk = exp(−λpkt) , pa (t) = exp(−λat) = exp(−(λca + λpk + λl )t) , где λ0 , λca , λ pk , λl
– интенсивности отказов базового оборудования коммутатора, СА, оборудования порта коммутатора и линии связи соответственно.
Зависимость надежности (вероятности работоспособности) коммутационной подсистемы от времени работы t (ч.) для рассмотренных вариантов ее построения представлена на рис. 3. Расчеты проведены при требовании связанности всех m компьютер-
ных узлов, при m=16, λ0 = 10−4 1/ ч, λk = λa = 10−3 1/ч. На рис. 3 кривые 1–3 представля-
ют зависимость надежности P(t) для конфигураций соответственно по рис. 2, б, с и без горизонтальной связи и с ее дублированием. Кривые 4–5 соответствуют структуре по рис. 3, в, г. Кривая 6 отражает повышение надежности структуры D(t)=P2(t) – P1(t), достигаемое в результате введения связи между КНУ на рис. 2, б. Кривая 7 показывает рост надежности D(t)= P3(t) – P1(t) в результате введения КВУ без резервирования (разница в надежности конфигураций по рис. 2, б, в). Кривая 8 показывает разницу надежности системы в результате введения дублированной горизонтальной связи между КНУ. Кривая 9 показывает увеличение надежности D(t), достигаемое при введении КВУ без резервирования и горизонтальной связи между КНУ. Кривая 10 отражает разницу надежности конфигураций по рис. 2, б, с горизонтальной связью и рис. 2, г. Кривая 11 представляет разницу надежности конфигураций по рис. 2, б, и по рис. 2, г, при дублировании горизонтальной связи между КНУ.

92 Научно-технический вестник Санкт-Петербургского государственного университета
информационных технологий, механики и оптики, 2009, № 1(59)

Из представленных графиков видна зависимость роста надежности конфигураций от увеличения их связанности. Таким образом, показана эффективность введения горизонтальной связи между КНУ, так как это позволяет существенно увеличить надежность при минимальных дополнительных затратах. Если в результате введения горизонтальной связи между КНУ не удается достичь требуемого уровня надежности, то эту связь следует резервировать.

Рис. 3. Результаты оценки надежности

Заключение

Предложена оценка надежности типовых подсистем трехуровневой резервированной коммуникационной подсистемы, на основе которой проанализированы различные варианты введения избыточности в многоуровневых коммуникационных подсистемах подключения клиентских и серверных узлов. Результаты исследований могут использоваться при обосновании выбора конфигурации коммуникационной подсистемы требуемой надежности для отказоустойчивых компьютерных систем.

Литература

1. Ретана А. Принципы проектирования корпоративных IP-сетей. – М.: Вильямс, 2002. – 367 с.
2. Богатырев В.А. Надежность многоуровневой дублированной отказоустойчивой коммуникационной подсистемы // Вестник компьютерных и информационных технологий. – 2008. – № 4. – С. 24–32.

Богатырев Владимир Анатольевич Богатырев Станислав Владимирович

– Санкт-Петербургский государственный университет информационных технологий, механики и оптики, доктор технических наук, bva@tinuviel.ru
– Санкт-Петербургский государственный университет информационных технологий, механики и оптики, аспирант, realloc@gmail.com

Научно-технический вестник Санкт-Петербургского государственного университета информационных технологий, механики и оптики, 2009, № 1(59)

93