ЛЕКЦИЯ 4. Расчет показателей надежности ВС для стационарного режима
Пазников Алексей Александрович
к.т.н., ст. преп. Кафедры вычислительных системСибирский государственный университеттелекоммуникаций и информатики
1. Лекция 4. Расчет показателей надежности ВС
для стационарного режима
http://cpct.sibsutis.ru/~apaznikov/teaching/index.php?n=Site.DCSFT-spring2014
Пазников Алексей Александрович
к.т.н., ст. преп. Кафедры вычислительных систем
Сибирский государственный университет
телекоммуникаций и информатики
2. Функции оперативной надёжности и восстановимости
2
Рассматривается ВС при длительной эксплуатации: 𝑡 → ∞
Выведем формулы для 𝑅∗
(𝑡) и 𝑈∗
(𝑡), характеризующих работу
ВС в стационарном режиме. Пусть
𝑄𝑖 𝑡 = 𝑃 ∀𝜏 ∈ 0, 𝑡 → 𝜉 𝜏 ≥ 𝑛 𝑖 ∈ 𝐸0
𝑁
}
является условной вероятностью события 𝜉(𝜏) ≥ 𝑛 в
предположении, что в системе в момент времени 𝑡 = 0
имеется 𝑖 ∈ 𝐸 𝑛
𝑁 исправных ЭМ; 𝜏 – любой момент времени,
принадлежащий [0, 𝑡). Тогда, учитывая 𝑅∗ 𝑡 = 𝑃{∀𝜏 ∈ 0, 𝑡 →
𝜉(𝜏) ≥ 𝑛|𝑃𝑖, 𝑖 ∈ 𝐸 𝑛
𝑁} , по формуле полных вероятностей имеем
𝑅∗ 𝑡 =
𝑖=𝑛
𝑁
𝑃𝑖 𝑄𝑖(𝑡)
где 𝑃𝑖 определяется формулой 𝑃𝑖 = lim
𝑡→∞
𝑃𝑖(𝑗, 𝑡)
(1)
3. Функции оперативной надёжности и восстановимости
3
Рассчитаем функцию 𝑄𝑖 𝑡 . Для этого обозначим
𝜋 𝑟 𝑡 , 𝑢𝑙 𝑡 – вероятность того, что произойдёт
соответственно 𝑟 отказов и 𝑙 восстановлений за
время 𝑡, если в системе имеется 𝑖 ∈ 𝐸 𝑛
𝑁 исправных
машин. Тогда
𝑄𝑖 𝑡 =
𝑙=0
∞
𝑢𝑙(𝑡)
𝑟=0
𝑖−𝑛+𝑙
𝜋 𝑟(𝑡) (2)
4. Функции оперативной надёжности и восстановимости
4
Если учесть, что число отказов ЭМ за время 𝑡 подчиняется
пуассоновскому закону (см. надёжность ЭВМ), то можно
показать, что
𝜋 𝑟 𝑡 =
(𝑖𝜆𝑡) 𝑟
𝑟!
𝑒−𝑖𝜆𝑡
𝑢𝑙 𝑡 =
(𝜇𝑡)𝑙
𝑙!
[Δ 𝑁 − 𝑖 − 𝑚 𝑚𝑙 𝑒−𝑖𝜇𝑡 +
+Δ 𝑚 − 𝑁 + 𝑖 𝑁 − 𝑖 𝑙 𝑒− 𝑁−𝑖 𝜇𝑡]
где 𝑟, 𝑙 ∈ 𝐸0
∞
,
∆ 𝑥 =
1, если 𝑥 ≥ 0
0, если 𝑥 < 0
и считается, что 00 = 1.
(3)
(4)
5. Функции оперативной надёжности и восстановимости
5
Таким образом, формулы (2)-(4) позволяют рассчитать
условную вероятность 𝑄𝑖 𝑡 , 𝑖 ∈ 𝐸 𝑛
𝑁, с заданной точностью.
В некоторых случаях достаточно найти оценку 𝑅∗(𝑡) снизу
для функции 𝑅∗(𝑡) (𝑙 = 0)
𝑅∗ 𝑡 =
𝑖=𝑛
𝑁
𝑃𝑖
𝑟=0
𝑖−𝑛
𝜋 𝑟(𝑡)
Начальное значение функции 𝑅∗(𝑡), как это следует из
lim
𝑡→∞
𝑆 𝑡 = 𝑗=𝑛
𝑁
𝑃𝑗 = 𝑆 и формул (1)-(4), равно
коэффициенту готовности ВС, т.е.
𝑅∗ 0 = 𝑆
6. Функции оперативной надёжности и восстановимости
6
Можно показать, что
𝑅∗ +∞ = lim
𝑡→∞
𝑅∗(𝑡) ≈
𝑖=𝑛
𝑁−1
𝑃𝑖 при 𝑛 < 𝑁
0 при 𝑛 = 𝑁
В самом деле,
lim
𝑡→∞
𝑄 𝑁(𝑡) = lim
𝑡→∞
𝑟=0
𝑁−1
𝜋 𝑟(𝑡) = 1 − lim
𝑡→∞
𝑟=𝑁−𝑛+1
∞
𝜋 𝑟 𝑡 = 0
(Так как при 𝑖 = 𝑁 из (4) следует, что 𝑢𝑙 𝑡 = 0, 𝑙 > 0,
𝑢0 𝑡 = 1. Поскольку 𝑁 − 𝑛 = const, то при 𝑡 → ∞ в системе
наиболее вероятными становятся количества отказов
𝑟 ∈ 𝑁 − 𝑛 + 1, 𝑁 − 𝑛 + 2, … . Поэтому при 𝑡 → ∞ с
достаточной для практики точностью можно считать, что
𝑟=𝑁−𝑛+1
∞
𝜋 𝑟(𝑡) → 1, и, следовательно, 𝑄 𝑁(𝑡) → 0.)
7. Функции оперативной надёжности и восстановимости
7
Далее из (4) видно, что при 𝑖 ∈ {𝑛, 𝑛 + 1, … , 𝑁 − 1} и
при большом 𝑡 вероятности 𝑢𝑙 𝑡 будут больше
отличаться от 0, чем больше будет 𝑙. Иначе говоря,
если 𝑖 ∈ {𝑛, 𝑛 + 1, … , 𝑁 − 1}, то при большом 𝑡 число
восстановлений 𝑙 в системе будет таким же большим,
т.е. если 𝑡 → ∞, то и 𝑙 → ∞.
Если это так, то при 𝑡 → ∞ имеет место 𝑟=0
𝑖−𝑛+1
𝜋 𝑟(𝑡) →
1 и, следовательно, 𝑄𝑖 𝑡 = 𝑙=0
∞
𝑢𝑙(𝑡) 𝑟=0
𝑖−𝑛+𝑙
𝜋 𝑟(𝑡) ,
𝑄𝑖 𝑡 → 1, 𝑖 ∈ 𝐸 𝑛
𝑁−1
.
Переходя к пределу при 𝑡 → ∞ в 𝑅∗ 𝑡 = 𝑖=𝑛
𝑁
𝑃𝑖 𝑄𝑖(𝑡) и
учитывая поведение 𝑄𝑖 𝑡 при 𝑡 → ∞, получаем (5).
8. Функции оперативной надёжности и восстановимости
8
Действуя аналогично, находим, что функция
𝑈∗
𝑡 = 1 −
𝑖=0
𝑛−1
𝑃𝑖
𝑟=0
∞
𝜋 𝑟(𝑡)
𝑙=0
𝑛−𝑖−1+𝑟
𝑢𝑙(𝑡)
Очевидно, что 𝑈∗ 𝑡 = 𝑆, 𝑈∗ +∞ = lim
𝑡→∞
𝑈∗ 𝑡 = 1.
Оценкой сверху для 𝑈∗ 𝑡 будет функция
𝑈∗
𝑡 = 1 −
𝑖=0
𝑛−1
𝑃𝑖
𝑙=0
𝑛−𝑖−1
𝑢𝑙(𝑡)
10. Распределение вероятностей состояний системы
10
Правые части всех уравнений (5) при 𝑡 → ∞ имеют
пределы ⇒ Каждая из производных 𝑃𝑗
′
𝑡 также имеет
предел, и такой предел может быть только 0.
Доказательство. Если бы какая-нибудь производная
𝑃𝑗
′
𝑡 стремилась к числу, отличному от 0, то
соответствующее |𝑃𝑗 𝑡 | при 𝑡 → ∞ неограниченно бы
возрастало. Последнее противоречило бы
физическому смыслу величин 𝑃𝑗 𝑡 и формуле (5).
Таким образом, при 𝑡 → ∞ имеет место 𝑃𝑗
′
𝑡 → 0.
16. Готовность масштабируемых вычислительных систем
16
Изучим влияние 𝑁 при его неограниченном увеличении на
потенциальную готовность ВС.
Известно, что коэффициент готовности ЭВМ рассчитывается
по формуле
𝑠 = lim
𝑡→∞
𝑠 𝑖, 𝑡 = 𝜇/(𝜆 + 𝜇)
Опираясь на эту формулу, можно показать, что коэффициент
готовности ВС
𝑆 > 1 − 𝑒−𝑁𝜅, 𝑆 = 1 − 𝑒−𝑁𝜅+𝜊(ln 𝑁)
где 𝜅 = 𝑣 ln(𝑣𝑠−1) + (1 − 𝑣) ln[(1 − 𝑣)(1 − 𝑠)−1] . Из (15)
следует, что ВС имеет высокую готовность при выполнении
условия 𝑣 < 𝑠.
(15)
17. Готовность масштабируемых вычислительных систем
17
• Наряду с монопрограммным режимом (на ВС решается 1
задача), широко используются и мультипрограммные
режимы.
• При организации мультипрограммной работы ВС
разбивается на подсистемы.
• Количество подсистем = количество одновременно
решаемых задач.
• Количество ЭМ в подсистеме = количество ветвей в
параллельной программе.
Каким образом параметры подсистем влияют на
надёжность (коэффициент готовности) ВС в целом?
18. Готовность в мультизадачном режиме
18
• Пусть ВС состоит из ℎ подсистем, причём
• 𝑁𝑗 – число ЭМ в подсистеме 𝑗 ∈ 𝐸1
ℎ
,
• 𝑛𝑗 – минимально допустимое число исправных ЭМ в
подсистеме 𝑗 ∈ 𝐸1
ℎ
.
𝑗=1
ℎ
𝑁𝑗 = 𝑁; 𝑣𝑗 = 𝑛𝑗 − 1 𝑁𝑗
−1
; 𝜅𝑗 = 𝑣𝑗 ln
𝑣𝑗
𝑠
+ (1 − 𝑣𝑗) ln
1 − 𝑣𝑗
1 − 𝑠
Рассмотрим случай, когда все подсистемы важны для
существования ВС. Тогда на основе (15)
𝑆 =
𝑗=1
ℎ
𝑆𝑗 ≥
𝑗=1
ℎ
(1 − 𝑒−𝑁 𝑗 𝜅 𝑗)
где 𝑆𝑗 – коэффициент готовности подсистемы 𝑗 ∈ 𝐸1
ℎ
(16)
19. Готовность в мультизадачном режиме
19
Требуется найти такое распределение 𝑁𝑗
∗
, 𝑗 ∈ 𝐸1
ℎ
чисел в
подсистемах, при котором нижняя оценка (16) достигает
максимума.
Точное решение задачи методом множителей Лагранжа при
больших значениях 𝑁𝑗, 𝑗 ∈ 𝐸1
ℎ
, асимптотически совпадает с
решением, получающимся при значениях 𝑁𝑗, обеспечивающих
постоянство сомножителей в оценке (16). Следовательно,
𝑁𝑗
∗
= 𝑁 𝜅𝑗
𝑙=1
ℎ
𝜅𝑙
−1
−1
при этом
𝑆 ≥ [1 − 𝑒−
𝑁 𝜅
ℎ ] ℎ; 𝜅 =
1
ℎ
𝑙=1
ℎ
𝜅𝑙
−1
−1
𝜅 – средний гармонический коэффициент 𝜅𝑗
(17)
(18)
20. Готовность в мультизадачном режиме
20
Рассмотрим более общую ситуацию, когда оснащение
ЭМ различно. Тогда 𝑙 -я ЭМ будет иметь свой
коэффициент готовности 𝑠𝑙, 𝑙 ∈ 𝐸1
𝑁
.
Можно показать, что в общем случае сохраняются все
соотношения, если вместо 𝑠 рассматривать величину
𝑠 = 𝑁−1
𝑙=1
𝑁
𝑠𝑙 (19)
21. Готовность в мультизадачном режиме
21
Исследуем поведение ВС в зависимости от степени разбиения
на подсистемы. Пусть число 𝑁 ЭМ растет вместе с количеством
ℎ её подсистем так, что
𝑁 =
1 + 𝜀
𝜅
ℎ ln ℎ −
1
𝜅
ℎ ln 𝑑 ,
где 𝑑, 𝜀 – произвольные действительные числа 𝑑 > 0
Тогда из (18) следует, что
𝑆 ≈ 𝑒−𝑑ℎ−𝜀 = 𝑒−𝑑ℎ|𝜀|
при 𝜀 < 0;
> 1 − 𝑑ℎ−𝜀 при 𝜀 > 0;
Следовательно, ВС имеет высокую готовность, если с
увеличением ℎ порядок роста 𝑁 больше величины ℎ ln ℎ / 𝜅. Из
(17)-(21) видно, что для достижения высокой готовности ВС
необходимо выполнение условия 𝑁𝑗 > 𝜅𝑗
−1
ln ℎ , 𝑗 ∈ 𝐸1
ℎ
.
(20)
(21)
23. Коэффициент готовности большемасштабных вычислительных систем
23
Из формул (22), (23) при 𝑙 ≥ 1 следует, что lim
𝑡→∞
𝑏𝑙(𝑡) = 0.
Учитывая полученные ранее формулы 𝑃𝑗, последнюю формулу,
получаем, что стационарными вероятностями ВС будут
𝑃𝑗 =
𝑚𝜇
𝜆
1
𝑗!
𝑒−𝑚𝜇/𝜆, 𝑗 ∈ 𝐸0
∞
Предельный переход в 𝑆 𝑡 = 𝑗=𝑛
∞
𝑃𝑗(𝑡) = 1 − 𝑗=0
𝑛−1
𝑃𝑗(𝑡) при
𝑡 → ∞ и результат (24) приводят к расчётной формуле:
𝑆 = 1 −
𝑗=0
𝑛−1
𝑚𝜇
𝜆
𝑗 1
𝑗!
𝑒−𝑚𝜇/𝜆
(24)
(25)
24. Коэффициент готовности большемасштабных вычислительных систем
24
При анализе большемасштабных ВС можно использовать
статистику не от потоке отказов в одной ЭМ, а об отказах ВС в
целом. Тогда модель можно изменить след. образом.
Пусть задана не интенсивность 𝜆 отказов одной ЭМ системы, а
интенсивность Λ потока отказавших ЭМ ВС – среднее количество
отказавших ЭМ, поступающих на 𝑚 ВУ в единицу времени.
Далее пусть 𝑃𝑗 - вероятность того, что в стационарном режиме в
ВС имеется 𝑗 отказавших машин. Действуя традиционно,
получаем:
−Λ 𝑃0 + 𝜇 𝑃1 = 0
Λ 𝑃𝑗−1 − Λ + 𝑗𝜇 𝑃𝑗 + 𝑗 + 1 𝜇𝑃𝑗+1 = 0, 1 ≤ 𝑗 < 𝑚
Λ 𝑃𝑗−1 − Λ + 𝑚𝜇 𝑃𝑗 + 𝑚𝜇 𝑃𝑗+1 = 0, 𝑚 ≤ 𝑗
(26)
25. Коэффициент готовности большемасштабных вычислительных систем
25
Как было показано (для ЭВМ), 𝜇 – среднее число
восстановлений ЭМ, которое может произвести 1 ВУ в ед.
времени.
Тогда производительность восстанавливающей системы будет
характеризоваться величиной 𝑚𝜇.
Очередь на восстановление ЭМ не будет расти безгранично и
ресурсы будут эксплуатироваться с потенциально возможной
эффективностью при условии Λ ≤ 𝑚𝜇.
Легко показать, что решениями (26) в этом случае будут:
𝑃0 =
𝑙=0
𝑚−1
1
𝑙!
Λ
𝜇
𝑙
+
𝜇
𝑚 − 1 ! (𝑚𝜇 − Λ)
Λ
𝜇
𝑚
−1
𝑃𝑗 =
Λ
𝜇
𝑗
Δ 𝑚 − 𝑗
1
𝑗!
+ Δ(𝑗 − 𝑚)
1
𝑚! 𝑚 𝑗−𝑚
𝑃0, 𝑗 ∈ 𝐸0
∞
(27)
(28)
26. Коэффициент готовности большемасштабных вычислительных систем
26
По определению 𝑛 – количество ЭМ основной подсистемы со
структурной избыточностью.
Целесообразно ввести 𝑛 – максимальное количество
отказавших ЭМ, при котором производительность ВС не ниже
предельно допустимой.
Следовательно, если ВС находится в состоянии 𝑗 ∈ 𝐸0
𝑛
, где
𝐸0
𝑛
= 0, 1,2, … , 𝑛 , 𝐸0
𝑛
⊂ 𝐸0
∞
, то будем считать, что она в
состоянии готовности.
Тогда коэффициент готовности ВС рассчитывают по формуле:
𝑆 =
𝑗=0
𝑛
𝑃𝑗 ,
где величины 𝑃𝑗 определяются из (27) и (28).
27. Коэффициент готовности большемасштабных вычислительных систем
27
Зная 𝑃𝑗 можно также вычислить среднее количество
отказавших машин ВС, ожидающих начала восстановления:
𝑀1 =
Λ
𝑚𝜇(1 − Λ/𝑚𝜇)2
𝑃𝑚
при условии Λ ≤ 𝑚𝜇.
Математическое ожидание количества отказавших машин
𝑀2 = 𝑀1 + 𝑃0
𝑗=1
𝑚−1
1
𝑗 − 1 !
Λ
𝜇
𝑗
+
𝑚 𝑃𝑚
1 − Λ/𝑚𝜇
Среднее число свободных восстанавливающих устройств
𝑀3 = 𝑃0
𝑗=0
𝑚−1
𝑚 − 𝑗
𝑗!
Λ
𝜇
𝑗
28. Коэффициент готовности большемасштабных вычислительных систем
28
Вероятность того, что все ВУ заняты ремонтом отказавших ЭМ
Π = 𝑃𝑚(1 − Λ/𝑚𝜇)−1
Закон распределения времени 𝜂 ожидания начала
восстановления отказавшей ЭМ или вероятность того, что
время пребывания ЭМ в очереди на ремонт больше 𝑡
𝑃 𝜂 > 𝑡 = Π𝑒−(𝑚𝜇−Λ)𝑡
Мат. ожидание и дисперсия времени ожидания начала
восстановления отказавшей ЭМ
𝑀𝜂 =
Π
𝑚𝜇 − Λ
; 𝐷𝜂 = 𝑀𝜂
2
𝑚𝜇 − Λ
− 𝑀𝜂
Основываясь на том факте, что производительность ВС 𝑛𝜔,
которая близка к суммарной производительности 𝑁𝜔, можно
считать, что 𝑛 = 𝑁 − 𝑛, Λ = 𝑁𝜆.