SlideShare a Scribd company logo
1 of 44
Download to read offline
Le RAID
Le RAID?
Notre sujet n’est pas l’unité d’élite de la police...
Le RAID?
Notre sujet n’est
pas non plus ...
Le RAID?
●
signifie "Redundant Array of Inexpensive Drives".
● inventé au début des années 80
● moins coûteux
● plus performant
Les niveaux de RAID
● RAID 0 (striping)
● RAID 1 (miroir)
● RAID 10
● RAID 4
● RAID 5
● RAID 6
● RAID Z et autres....
Le RAID 0
● Pas vraiment RAID : pas de redondance
Les plus:
● amélioration de la capacité
● Amélioration des performances
Les moins:
● Sécurité dégradée!
abcd
a
b
c
d
Le RAID 1
● Miroir, ou copie complète
Les plus:
● amélioration de la sécurité
Les moins:
● Au détriment de la capacité
abcd
abcd
abcd
Le RAID 10
● aussi RAID 0+1 ou RAID 1+0
Les plus:
● performant et capacitif comme RAID-0
● aussi sûr que RAID-1
Les moins:
● aussi coûteux que RAID-1 aussi...
abcd
ab
cd
ab
cd
Le RAID 4
●
Un disque de parité pour N disques
●
Souvent improprement appelé RAID 3 dans le passé (Ciprico, Maxstar...)
●
Souvent non assumé (DatadirectNetworks...)
Les plus:
● performance des N disques en lecture
● performance des N disques en écriture séquentielle
Les moins:
● performance d'un seul disque en écriture aléatoire
abcd
a
b
c
d
(a+b+c+d)/4
Le RAID 5
● un bloc de parité pour N blocs
● parité répartie sur tous les N+1 disques
Les plus:
● séparation possible des E/S sur disques en lecture
Les moins:
● Performances en écriture très basse si blocs
trop grands (lecture/modification/écriture) abcd
a
b
c
d
(a+b+c+d)/4
Le RAID 6
● deux blocs de parité pour N blocs
● parité répartie sur tous les N+2 disques
Les plus:
● sécurité encore meilleure statistiquement que RAID-10
● surcoût raisonnable
Les moins:
● performances limitées en écriture
( lecture/modification/écriture fréquent ) abcd
a
b
c
d
chksum1
chksum2
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Temps 3 : puis le bloc de parité
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Temps 3 : puis le bloc de parité
Temps 4 : on modifie un des blocs (mais pas tous)
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Temps 3 : puis le bloc de parité.
Temps 4 : on modifie un des blocs (mais pas tous)...
Temps 5 : on doit relire les autres blocs de la bande...
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Temps 3 : puis le bloc de parité.
Temps 4 : on modifie un des blocs (mais pas tous)...
Temps 5 : on doit relire les autres blocs de la bande...
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Temps 3 : puis le bloc de parité.
Temps 4 : on modifie un des blocs (mais pas tous)...
Temps 5 : on doit relire les autres blocs de la bande...
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Temps 3 : puis le bloc de parité.
Temps 4 : on modifie un des blocs (mais pas tous)...
Temps 5 : on doit relire les autres blocs de la bande...
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Temps 3 : puis le bloc de parité.
Temps 4 : on modifie un des blocs (mais pas tous)...
Temps 5 : on doit relire les autres blocs de la bande...
Temps 6 : pour pouvoir récrire la nouvelle parité !
Digression : Le cycle lecture/modification/écriture
On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on
ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par
disque. Exemple avec 6 disques et une parité (RAID-5) :
Temps 1 : pas de données.
Temps 2 : on écrit les données...
Temps 3 : puis le bloc de parité.
Temps 4 : on modifie un des blocs (mais pas tous)...
Temps 5 : on doit relire les autres blocs de la bande...
Temps 6 : pour pouvoir récrire la nouvelle parité !
Résultat : pour modifier quelques Ko, on peut devoir relire plusieurs Mo et récrire
plusieurs dizaines de Ko (jusqu’à trois blocs).
Digression : Le cycle lecture/modification/écriture
Le RAID Z et autres
● peut cumuler le fonctionnement des différents RAID
Les plus:
● parité calculée uniquement sur l'espace utilisé
● pas d'effet lecture/modification/écriture
● reconstruction plus rapide
● bénéfices additionnels selon les solutions : clichés,
mise en grappe, etc.
Les moins:
● presque entièrement logiciel (contention de ressources)
● enveloppe de performances souvent restreinte
Le risque de panne
●soit x la probabilité qu'un disque tombe en panne sur la période considérée;
● soit P(raid) la probabilité de panne de la grappe;
● soit N le nombre de disques :
P0 = Nx
 P1 = x² 
 P10 = x² . N/2
 
 P4 = x²  . ( N ­ 1)
 
 P5 = x²  . ( N ­ 1)
 
 P6 = x³ . ( N ­ 2)
  
Quel mode utiliser?
● RAID-0 : performance séquentielle pure
● débit : N . t
● latence : Ta / N
● RAID-10 : performance en écriture garantie
● débit en écriture : N/2 . t
●   débit en lecture : N . t
● Latence : Ta / ( N/2 )
Soit N le nombre de disques, t le débit et Ta le temps d’accès d’un disque :
Quel mode utiliser?
● RAID-4 : performance d'écriture séquentielle et sécurité
● débit : (N – 1) . t
● Latence : ( N . Ta ) / (N ­ 1)
● RAID-5 : performance en E/S et sécurité
● débit en écriture : N/2 . t
●   débit en lecture : (N ­ 1) . t
● Latence : Ta / ( N ­ 1 )
Soit N le nombre de disques, t le débit et Ta le temps d’accès d’un disque :
●RAID-6 : performance en lecture et forte sécurité
● débit en écriture : N/3 . t
●   débit en lecture : (N ­ 2) . t
● Latence : Ta / ( N ­ 2 )
RAID et taille des disques
● plus les disques sont gros,
plus la durée de reconstruction est longue
● en 1988, un disque de 40 Mo se remplissait en 2 à 3 minutes
● en 1998, un disque de 9 Go se remplissait en 15 à 20 minutes
● en 2008, un disque de 1 To se remplissait en 3 à 4 heures
● en 2010, un disque de 2 To se remplissait en 5 à 6 heures
● En 2013, un disque de 4 To se remplit en 12 à 14 heures
RAID et taille des disques
● plus les disques sont gros,
plus la durée de reconstruction est longue
● Pour éviter de rester longtemps en mode
dégradé, on utilise les modes à double parité
(RAID 6).
RAID et taille des disques
● Le taux d’erreur non recouvrable n’évolue plus :
plus les disques sont gros plus le risque est
grand
● Le RAID 5 est OBSOLÈTE.
● N’utilisez JAMAIS le RAID 5 avec des disques
plus gros que 400 Go.
Taille de « bande »
● une taille de bande optimale par rapport à
l'application permet de maximiser la
performance
● pour de petites entrées/sorties, on utilisera une
bande large pour accéder aux disques
successivement.
● pour de grosses entrées/sorties, on utilisera
une bande étroite pour accéder aux disques
simultanément.
Calcul de la parité
● Le calcul de la parité est intensif en terme de
ressources.
● le processeur en charge de ce calcul peut être dédié
● c'est le RAID matériel
● ou ce peut être le processeur central
● c'est le RAID logiciel
RAID matériel et RAID matériel
● tous les RAID matériels ne sont pas égaux
● certains sont très peu performants car sous-
dimensionnés (processeur, mémoire)
● certains utilisent une ressource interne
(mémoire) pouvant entraîner une contention
RAID matériel et RAID logiciel
● le RAID logiciel est généralement plus
performant lors des tests de vitesse disque
RAID matériel et RAID logiciel
MAIS
RAID matériel et RAID logiciel
● il entre en concurrence pour les ressources systèmes avec
les autres tâches de façon difficile à prévoir
● sur un système déjà chargé, la panne d'un disque en RAID logiciel
peut entraîner une chute catastrophique des performances
● la performance du RAID matériel est stable quelle que soit l'activité
du système par ailleurs
RAID matériel et RAID logiciel
DONC
RAID matériel et RAID logiciel
● pour des stations de travail ou des systèmes
n'exécutant qu'une seule tâche principale, ou
sous une charge modérée, le RAID logiciel est
très satisfaisant.
● pour des systèmes serveurs avec de
nombreux utilisateurs et travaillant parfois
sous une charge très élevée, le RAID logiciel
est inadapté.
RAID matériel et RAID logiciel
● Devinette
RAID matériel et RAID logiciel
● Devinette
● dans quel cas peut-on utiliser du RAID logiciel
sur un système de haute performances ?
RAID matériel et RAID logiciel
● Devinette
● dans quel cas peut-on utiliser du RAID logiciel
sur un système de haute performances ?
● lorsque c'est un système dédié dont la seule
tâche est de traiter les entrées/sorties
(Isilon, NetApp, etc).
Le RAID
● C’est fini!
● Des questions ?
info@intellique.com
● Tél: 01 78 94 84 00
Version 1.4 14/11/2013

More Related Content

What's hot

rpm package 를 이용한 MySQL 설치자동화
rpm package 를 이용한 MySQL 설치자동화rpm package 를 이용한 MySQL 설치자동화
rpm package 를 이용한 MySQL 설치자동화I Goo Lee
 
ODI ( Oracle Data Integrator ) and Git Repository Integration Basic Steps
ODI ( Oracle Data Integrator ) and Git Repository Integration Basic StepsODI ( Oracle Data Integrator ) and Git Repository Integration Basic Steps
ODI ( Oracle Data Integrator ) and Git Repository Integration Basic StepsVinayaseshu Ginjupalli
 
Learn Hadoop Administration
Learn Hadoop AdministrationLearn Hadoop Administration
Learn Hadoop AdministrationEdureka!
 
Disk health prediction for Ceph
Disk health prediction for CephDisk health prediction for Ceph
Disk health prediction for CephCeph Community
 
Cpu steal time
Cpu steal timeCpu steal time
Cpu steal timePrem Sanil
 
Linux Kernel - Virtual File System
Linux Kernel - Virtual File SystemLinux Kernel - Virtual File System
Linux Kernel - Virtual File SystemAdrian Huang
 
Cours linux complet
Cours linux completCours linux complet
Cours linux completaubin82
 
DPDK & Layer 4 Packet Processing
DPDK & Layer 4 Packet ProcessingDPDK & Layer 4 Packet Processing
DPDK & Layer 4 Packet ProcessingMichelle Holley
 
Revisiting CephFS MDS and mClock QoS Scheduler
Revisiting CephFS MDS and mClock QoS SchedulerRevisiting CephFS MDS and mClock QoS Scheduler
Revisiting CephFS MDS and mClock QoS SchedulerYongseok Oh
 
DPDK in Containers Hands-on Lab
DPDK in Containers Hands-on LabDPDK in Containers Hands-on Lab
DPDK in Containers Hands-on LabMichelle Holley
 
ceph optimization on ssd ilsoo byun-short
ceph optimization on ssd ilsoo byun-shortceph optimization on ssd ilsoo byun-short
ceph optimization on ssd ilsoo byun-shortNAVER D2
 
Alphorm.com Formation Active directory 2019 : Configuration et Bonne pratiques
Alphorm.com Formation Active directory 2019 : Configuration et Bonne pratiquesAlphorm.com Formation Active directory 2019 : Configuration et Bonne pratiques
Alphorm.com Formation Active directory 2019 : Configuration et Bonne pratiquesAlphorm
 
LAS16-406: Android Widevine on OP-TEE
LAS16-406: Android Widevine on OP-TEELAS16-406: Android Widevine on OP-TEE
LAS16-406: Android Widevine on OP-TEELinaro
 

What's hot (20)

rpm package 를 이용한 MySQL 설치자동화
rpm package 를 이용한 MySQL 설치자동화rpm package 를 이용한 MySQL 설치자동화
rpm package 를 이용한 MySQL 설치자동화
 
ODI ( Oracle Data Integrator ) and Git Repository Integration Basic Steps
ODI ( Oracle Data Integrator ) and Git Repository Integration Basic StepsODI ( Oracle Data Integrator ) and Git Repository Integration Basic Steps
ODI ( Oracle Data Integrator ) and Git Repository Integration Basic Steps
 
Learn Hadoop Administration
Learn Hadoop AdministrationLearn Hadoop Administration
Learn Hadoop Administration
 
Disk health prediction for Ceph
Disk health prediction for CephDisk health prediction for Ceph
Disk health prediction for Ceph
 
Cpu steal time
Cpu steal timeCpu steal time
Cpu steal time
 
RAID and LVM
RAID and LVMRAID and LVM
RAID and LVM
 
Ceph issue 해결 사례
Ceph issue 해결 사례Ceph issue 해결 사례
Ceph issue 해결 사례
 
Linux Kernel - Virtual File System
Linux Kernel - Virtual File SystemLinux Kernel - Virtual File System
Linux Kernel - Virtual File System
 
Dpdk performance
Dpdk performanceDpdk performance
Dpdk performance
 
Cours linux complet
Cours linux completCours linux complet
Cours linux complet
 
DPDK & Layer 4 Packet Processing
DPDK & Layer 4 Packet ProcessingDPDK & Layer 4 Packet Processing
DPDK & Layer 4 Packet Processing
 
Linux: LVM
Linux: LVMLinux: LVM
Linux: LVM
 
Revisiting CephFS MDS and mClock QoS Scheduler
Revisiting CephFS MDS and mClock QoS SchedulerRevisiting CephFS MDS and mClock QoS Scheduler
Revisiting CephFS MDS and mClock QoS Scheduler
 
Raid Technology
Raid TechnologyRaid Technology
Raid Technology
 
DPDK in Containers Hands-on Lab
DPDK in Containers Hands-on LabDPDK in Containers Hands-on Lab
DPDK in Containers Hands-on Lab
 
ceph optimization on ssd ilsoo byun-short
ceph optimization on ssd ilsoo byun-shortceph optimization on ssd ilsoo byun-short
ceph optimization on ssd ilsoo byun-short
 
Résumé vlsm et cidr
Résumé vlsm et cidrRésumé vlsm et cidr
Résumé vlsm et cidr
 
Alphorm.com Formation Active directory 2019 : Configuration et Bonne pratiques
Alphorm.com Formation Active directory 2019 : Configuration et Bonne pratiquesAlphorm.com Formation Active directory 2019 : Configuration et Bonne pratiques
Alphorm.com Formation Active directory 2019 : Configuration et Bonne pratiques
 
LAS16-406: Android Widevine on OP-TEE
LAS16-406: Android Widevine on OP-TEELAS16-406: Android Widevine on OP-TEE
LAS16-406: Android Widevine on OP-TEE
 
Hands-on DNSSEC Deployment
Hands-on DNSSEC DeploymentHands-on DNSSEC Deployment
Hands-on DNSSEC Deployment
 

Viewers also liked

ApacheCon Europe 2012 -Big Search 4 Big Data
ApacheCon Europe 2012 -Big Search 4 Big DataApacheCon Europe 2012 -Big Search 4 Big Data
ApacheCon Europe 2012 -Big Search 4 Big DataOpenSource Connections
 
Présentation de Apache Zookeeper
Présentation de Apache ZookeeperPrésentation de Apache Zookeeper
Présentation de Apache ZookeeperMichaël Morello
 
Apache Storm - Introduction au traitement temps-réel avec Storm
Apache Storm - Introduction au traitement temps-réel avec StormApache Storm - Introduction au traitement temps-réel avec Storm
Apache Storm - Introduction au traitement temps-réel avec StormParis_Storm_UG
 
Spark, ou comment traiter des données à la vitesse de l'éclair
Spark, ou comment traiter des données à la vitesse de l'éclairSpark, ou comment traiter des données à la vitesse de l'éclair
Spark, ou comment traiter des données à la vitesse de l'éclairAlexis Seigneurin
 
Apache Storm vs. Spark Streaming - two stream processing platforms compared
Apache Storm vs. Spark Streaming - two stream processing platforms comparedApache Storm vs. Spark Streaming - two stream processing platforms compared
Apache Storm vs. Spark Streaming - two stream processing platforms comparedGuido Schmutz
 
Organiser ses espaces de stockage
Organiser ses espaces de stockageOrganiser ses espaces de stockage
Organiser ses espaces de stockagealexartiste
 
Apache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performantApache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performantALTIC Altic
 
Apache storm vs. Spark Streaming
Apache storm vs. Spark StreamingApache storm vs. Spark Streaming
Apache storm vs. Spark StreamingP. Taylor Goetz
 
How to Make Awesome SlideShares: Tips & Tricks
How to Make Awesome SlideShares: Tips & TricksHow to Make Awesome SlideShares: Tips & Tricks
How to Make Awesome SlideShares: Tips & TricksSlideShare
 
Getting Started With SlideShare
Getting Started With SlideShareGetting Started With SlideShare
Getting Started With SlideShareSlideShare
 

Viewers also liked (14)

Raid
RaidRaid
Raid
 
ApacheCon Europe 2012 -Big Search 4 Big Data
ApacheCon Europe 2012 -Big Search 4 Big DataApacheCon Europe 2012 -Big Search 4 Big Data
ApacheCon Europe 2012 -Big Search 4 Big Data
 
Raid_intro.ppt
Raid_intro.pptRaid_intro.ppt
Raid_intro.ppt
 
Présentation de Apache Zookeeper
Présentation de Apache ZookeeperPrésentation de Apache Zookeeper
Présentation de Apache Zookeeper
 
Apache Storm - Introduction au traitement temps-réel avec Storm
Apache Storm - Introduction au traitement temps-réel avec StormApache Storm - Introduction au traitement temps-réel avec Storm
Apache Storm - Introduction au traitement temps-réel avec Storm
 
Spark, ou comment traiter des données à la vitesse de l'éclair
Spark, ou comment traiter des données à la vitesse de l'éclairSpark, ou comment traiter des données à la vitesse de l'éclair
Spark, ou comment traiter des données à la vitesse de l'éclair
 
Apache Storm vs. Spark Streaming - two stream processing platforms compared
Apache Storm vs. Spark Streaming - two stream processing platforms comparedApache Storm vs. Spark Streaming - two stream processing platforms compared
Apache Storm vs. Spark Streaming - two stream processing platforms compared
 
RAID seminar
RAID seminarRAID seminar
RAID seminar
 
RAID
RAIDRAID
RAID
 
Organiser ses espaces de stockage
Organiser ses espaces de stockageOrganiser ses espaces de stockage
Organiser ses espaces de stockage
 
Apache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performantApache Kafka, Un système distribué de messagerie hautement performant
Apache Kafka, Un système distribué de messagerie hautement performant
 
Apache storm vs. Spark Streaming
Apache storm vs. Spark StreamingApache storm vs. Spark Streaming
Apache storm vs. Spark Streaming
 
How to Make Awesome SlideShares: Tips & Tricks
How to Make Awesome SlideShares: Tips & TricksHow to Make Awesome SlideShares: Tips & Tricks
How to Make Awesome SlideShares: Tips & Tricks
 
Getting Started With SlideShare
Getting Started With SlideShareGetting Started With SlideShare
Getting Started With SlideShare
 

Similar to Présentation du stockage RAID

Présentation RAID (mise à jour 2016)
Présentation RAID (mise à jour 2016)Présentation RAID (mise à jour 2016)
Présentation RAID (mise à jour 2016)Emmanuel Florac
 
Annexe technologie raid
Annexe   technologie raidAnnexe   technologie raid
Annexe technologie raidNicolas Manhes
 
cour administration système.pptx
cour administration système.pptxcour administration système.pptx
cour administration système.pptxFootballLovers9
 
1173793reseauxinformatiquefpptmarocmr.ppt
1173793reseauxinformatiquefpptmarocmr.ppt1173793reseauxinformatiquefpptmarocmr.ppt
1173793reseauxinformatiquefpptmarocmr.pptachrafelbouzidi2
 
Memcached: Comprendre pour mieux utiliser
Memcached: Comprendre pour mieux utiliserMemcached: Comprendre pour mieux utiliser
Memcached: Comprendre pour mieux utiliserNimeOps
 
PerfUG - Hadoop Performances
PerfUG - Hadoop PerformancesPerfUG - Hadoop Performances
PerfUG - Hadoop PerformancesSofian Djamaa
 
Systèmes d'Exploitation - chp5-gestion fichiers
Systèmes d'Exploitation - chp5-gestion fichiersSystèmes d'Exploitation - chp5-gestion fichiers
Systèmes d'Exploitation - chp5-gestion fichiersLilia Sfaxi
 
04 01 configuration raid
04 01 configuration raid04 01 configuration raid
04 01 configuration raidNoël
 
Systèmes d'Exploitation - chp4-gestion disque
Systèmes d'Exploitation - chp4-gestion disqueSystèmes d'Exploitation - chp4-gestion disque
Systèmes d'Exploitation - chp4-gestion disqueLilia Sfaxi
 
Rapport administration systèmes et supervision réseaux tp3 diabang master1 tr
Rapport administration systèmes et supervision réseaux tp3 diabang master1 trRapport administration systèmes et supervision réseaux tp3 diabang master1 tr
Rapport administration systèmes et supervision réseaux tp3 diabang master1 trCheikh Tidiane DIABANG
 
ATELIER SYSTEME (1) FERCHICHI ABDELWAHEB
ATELIER SYSTEME (1) FERCHICHI ABDELWAHEBATELIER SYSTEME (1) FERCHICHI ABDELWAHEB
ATELIER SYSTEME (1) FERCHICHI ABDELWAHEBFerjani Bassem
 
C installation mint 17.2 partitionnement.mini
C installation mint 17.2 partitionnement.miniC installation mint 17.2 partitionnement.mini
C installation mint 17.2 partitionnement.miniOpenFactory 42
 
Cours informatique supports de stockage
Cours  informatique supports de stockage Cours  informatique supports de stockage
Cours informatique supports de stockage Tunisie collège
 
Guss webcasts Tempdb Internals - june 2013
Guss webcasts   Tempdb Internals - june 2013Guss webcasts   Tempdb Internals - june 2013
Guss webcasts Tempdb Internals - june 2013David BAFFALEUF
 
Présentation NAS - MiNET
Présentation NAS - MiNETPrésentation NAS - MiNET
Présentation NAS - MiNETMehdi Sebbar
 
Le stockage de données disruptif
Le stockage de données disruptifLe stockage de données disruptif
Le stockage de données disruptifekito
 

Similar to Présentation du stockage RAID (20)

Présentation RAID (mise à jour 2016)
Présentation RAID (mise à jour 2016)Présentation RAID (mise à jour 2016)
Présentation RAID (mise à jour 2016)
 
Annexe technologie raid
Annexe   technologie raidAnnexe   technologie raid
Annexe technologie raid
 
RAID.pdf
RAID.pdfRAID.pdf
RAID.pdf
 
Raid tuto
Raid tutoRaid tuto
Raid tuto
 
cour administration système.pptx
cour administration système.pptxcour administration système.pptx
cour administration système.pptx
 
Exchange Stockage : Mythes et Réalités
Exchange Stockage : Mythes et RéalitésExchange Stockage : Mythes et Réalités
Exchange Stockage : Mythes et Réalités
 
1173793reseauxinformatiquefpptmarocmr.ppt
1173793reseauxinformatiquefpptmarocmr.ppt1173793reseauxinformatiquefpptmarocmr.ppt
1173793reseauxinformatiquefpptmarocmr.ppt
 
Memcached: Comprendre pour mieux utiliser
Memcached: Comprendre pour mieux utiliserMemcached: Comprendre pour mieux utiliser
Memcached: Comprendre pour mieux utiliser
 
PerfUG - Hadoop Performances
PerfUG - Hadoop PerformancesPerfUG - Hadoop Performances
PerfUG - Hadoop Performances
 
Systèmes d'Exploitation - chp5-gestion fichiers
Systèmes d'Exploitation - chp5-gestion fichiersSystèmes d'Exploitation - chp5-gestion fichiers
Systèmes d'Exploitation - chp5-gestion fichiers
 
Sysadmin Day #5
Sysadmin Day #5Sysadmin Day #5
Sysadmin Day #5
 
04 01 configuration raid
04 01 configuration raid04 01 configuration raid
04 01 configuration raid
 
Systèmes d'Exploitation - chp4-gestion disque
Systèmes d'Exploitation - chp4-gestion disqueSystèmes d'Exploitation - chp4-gestion disque
Systèmes d'Exploitation - chp4-gestion disque
 
Rapport administration systèmes et supervision réseaux tp3 diabang master1 tr
Rapport administration systèmes et supervision réseaux tp3 diabang master1 trRapport administration systèmes et supervision réseaux tp3 diabang master1 tr
Rapport administration systèmes et supervision réseaux tp3 diabang master1 tr
 
ATELIER SYSTEME (1) FERCHICHI ABDELWAHEB
ATELIER SYSTEME (1) FERCHICHI ABDELWAHEBATELIER SYSTEME (1) FERCHICHI ABDELWAHEB
ATELIER SYSTEME (1) FERCHICHI ABDELWAHEB
 
C installation mint 17.2 partitionnement.mini
C installation mint 17.2 partitionnement.miniC installation mint 17.2 partitionnement.mini
C installation mint 17.2 partitionnement.mini
 
Cours informatique supports de stockage
Cours  informatique supports de stockage Cours  informatique supports de stockage
Cours informatique supports de stockage
 
Guss webcasts Tempdb Internals - june 2013
Guss webcasts   Tempdb Internals - june 2013Guss webcasts   Tempdb Internals - june 2013
Guss webcasts Tempdb Internals - june 2013
 
Présentation NAS - MiNET
Présentation NAS - MiNETPrésentation NAS - MiNET
Présentation NAS - MiNET
 
Le stockage de données disruptif
Le stockage de données disruptifLe stockage de données disruptif
Le stockage de données disruptif
 

Présentation du stockage RAID

  • 2. Le RAID? Notre sujet n’est pas l’unité d’élite de la police...
  • 3. Le RAID? Notre sujet n’est pas non plus ...
  • 4. Le RAID? ● signifie "Redundant Array of Inexpensive Drives". ● inventé au début des années 80 ● moins coûteux ● plus performant
  • 5. Les niveaux de RAID ● RAID 0 (striping) ● RAID 1 (miroir) ● RAID 10 ● RAID 4 ● RAID 5 ● RAID 6 ● RAID Z et autres....
  • 6. Le RAID 0 ● Pas vraiment RAID : pas de redondance Les plus: ● amélioration de la capacité ● Amélioration des performances Les moins: ● Sécurité dégradée! abcd a b c d
  • 7. Le RAID 1 ● Miroir, ou copie complète Les plus: ● amélioration de la sécurité Les moins: ● Au détriment de la capacité abcd abcd abcd
  • 8. Le RAID 10 ● aussi RAID 0+1 ou RAID 1+0 Les plus: ● performant et capacitif comme RAID-0 ● aussi sûr que RAID-1 Les moins: ● aussi coûteux que RAID-1 aussi... abcd ab cd ab cd
  • 9. Le RAID 4 ● Un disque de parité pour N disques ● Souvent improprement appelé RAID 3 dans le passé (Ciprico, Maxstar...) ● Souvent non assumé (DatadirectNetworks...) Les plus: ● performance des N disques en lecture ● performance des N disques en écriture séquentielle Les moins: ● performance d'un seul disque en écriture aléatoire abcd a b c d (a+b+c+d)/4
  • 10. Le RAID 5 ● un bloc de parité pour N blocs ● parité répartie sur tous les N+1 disques Les plus: ● séparation possible des E/S sur disques en lecture Les moins: ● Performances en écriture très basse si blocs trop grands (lecture/modification/écriture) abcd a b c d (a+b+c+d)/4
  • 11. Le RAID 6 ● deux blocs de parité pour N blocs ● parité répartie sur tous les N+2 disques Les plus: ● sécurité encore meilleure statistiquement que RAID-10 ● surcoût raisonnable Les moins: ● performances limitées en écriture ( lecture/modification/écriture fréquent ) abcd a b c d chksum1 chksum2
  • 12. Digression : Le cycle lecture/modification/écriture On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données.
  • 13. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Digression : Le cycle lecture/modification/écriture
  • 14. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Digression : Le cycle lecture/modification/écriture
  • 15. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Digression : Le cycle lecture/modification/écriture
  • 16. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Digression : Le cycle lecture/modification/écriture
  • 17. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Digression : Le cycle lecture/modification/écriture
  • 18. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Temps 3 : puis le bloc de parité Digression : Le cycle lecture/modification/écriture
  • 19. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Temps 3 : puis le bloc de parité Temps 4 : on modifie un des blocs (mais pas tous) Digression : Le cycle lecture/modification/écriture
  • 20. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Temps 3 : puis le bloc de parité. Temps 4 : on modifie un des blocs (mais pas tous)... Temps 5 : on doit relire les autres blocs de la bande... Digression : Le cycle lecture/modification/écriture
  • 21. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Temps 3 : puis le bloc de parité. Temps 4 : on modifie un des blocs (mais pas tous)... Temps 5 : on doit relire les autres blocs de la bande... Digression : Le cycle lecture/modification/écriture
  • 22. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Temps 3 : puis le bloc de parité. Temps 4 : on modifie un des blocs (mais pas tous)... Temps 5 : on doit relire les autres blocs de la bande... Digression : Le cycle lecture/modification/écriture
  • 23. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Temps 3 : puis le bloc de parité. Temps 4 : on modifie un des blocs (mais pas tous)... Temps 5 : on doit relire les autres blocs de la bande... Digression : Le cycle lecture/modification/écriture
  • 24. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Temps 3 : puis le bloc de parité. Temps 4 : on modifie un des blocs (mais pas tous)... Temps 5 : on doit relire les autres blocs de la bande... Temps 6 : pour pouvoir récrire la nouvelle parité ! Digression : Le cycle lecture/modification/écriture
  • 25. On répartit les données sur en blocs de taille égale (par ex. 64 Ko), et on ajoute un bloc (ou deux) de parité de même taille, puis on stocke un bloc par disque. Exemple avec 6 disques et une parité (RAID-5) : Temps 1 : pas de données. Temps 2 : on écrit les données... Temps 3 : puis le bloc de parité. Temps 4 : on modifie un des blocs (mais pas tous)... Temps 5 : on doit relire les autres blocs de la bande... Temps 6 : pour pouvoir récrire la nouvelle parité ! Résultat : pour modifier quelques Ko, on peut devoir relire plusieurs Mo et récrire plusieurs dizaines de Ko (jusqu’à trois blocs). Digression : Le cycle lecture/modification/écriture
  • 26. Le RAID Z et autres ● peut cumuler le fonctionnement des différents RAID Les plus: ● parité calculée uniquement sur l'espace utilisé ● pas d'effet lecture/modification/écriture ● reconstruction plus rapide ● bénéfices additionnels selon les solutions : clichés, mise en grappe, etc. Les moins: ● presque entièrement logiciel (contention de ressources) ● enveloppe de performances souvent restreinte
  • 27. Le risque de panne ●soit x la probabilité qu'un disque tombe en panne sur la période considérée; ● soit P(raid) la probabilité de panne de la grappe; ● soit N le nombre de disques : P0 = Nx  P1 = x²   P10 = x² . N/2    P4 = x²  . ( N ­ 1)    P5 = x²  . ( N ­ 1)    P6 = x³ . ( N ­ 2)   
  • 28. Quel mode utiliser? ● RAID-0 : performance séquentielle pure ● débit : N . t ● latence : Ta / N ● RAID-10 : performance en écriture garantie ● débit en écriture : N/2 . t ●   débit en lecture : N . t ● Latence : Ta / ( N/2 ) Soit N le nombre de disques, t le débit et Ta le temps d’accès d’un disque :
  • 29. Quel mode utiliser? ● RAID-4 : performance d'écriture séquentielle et sécurité ● débit : (N – 1) . t ● Latence : ( N . Ta ) / (N ­ 1) ● RAID-5 : performance en E/S et sécurité ● débit en écriture : N/2 . t ●   débit en lecture : (N ­ 1) . t ● Latence : Ta / ( N ­ 1 ) Soit N le nombre de disques, t le débit et Ta le temps d’accès d’un disque : ●RAID-6 : performance en lecture et forte sécurité ● débit en écriture : N/3 . t ●   débit en lecture : (N ­ 2) . t ● Latence : Ta / ( N ­ 2 )
  • 30. RAID et taille des disques ● plus les disques sont gros, plus la durée de reconstruction est longue ● en 1988, un disque de 40 Mo se remplissait en 2 à 3 minutes ● en 1998, un disque de 9 Go se remplissait en 15 à 20 minutes ● en 2008, un disque de 1 To se remplissait en 3 à 4 heures ● en 2010, un disque de 2 To se remplissait en 5 à 6 heures ● En 2013, un disque de 4 To se remplit en 12 à 14 heures
  • 31. RAID et taille des disques ● plus les disques sont gros, plus la durée de reconstruction est longue ● Pour éviter de rester longtemps en mode dégradé, on utilise les modes à double parité (RAID 6).
  • 32. RAID et taille des disques ● Le taux d’erreur non recouvrable n’évolue plus : plus les disques sont gros plus le risque est grand ● Le RAID 5 est OBSOLÈTE. ● N’utilisez JAMAIS le RAID 5 avec des disques plus gros que 400 Go.
  • 33. Taille de « bande » ● une taille de bande optimale par rapport à l'application permet de maximiser la performance ● pour de petites entrées/sorties, on utilisera une bande large pour accéder aux disques successivement. ● pour de grosses entrées/sorties, on utilisera une bande étroite pour accéder aux disques simultanément.
  • 34. Calcul de la parité ● Le calcul de la parité est intensif en terme de ressources. ● le processeur en charge de ce calcul peut être dédié ● c'est le RAID matériel ● ou ce peut être le processeur central ● c'est le RAID logiciel
  • 35. RAID matériel et RAID matériel ● tous les RAID matériels ne sont pas égaux ● certains sont très peu performants car sous- dimensionnés (processeur, mémoire) ● certains utilisent une ressource interne (mémoire) pouvant entraîner une contention
  • 36. RAID matériel et RAID logiciel ● le RAID logiciel est généralement plus performant lors des tests de vitesse disque
  • 37. RAID matériel et RAID logiciel MAIS
  • 38. RAID matériel et RAID logiciel ● il entre en concurrence pour les ressources systèmes avec les autres tâches de façon difficile à prévoir ● sur un système déjà chargé, la panne d'un disque en RAID logiciel peut entraîner une chute catastrophique des performances ● la performance du RAID matériel est stable quelle que soit l'activité du système par ailleurs
  • 39. RAID matériel et RAID logiciel DONC
  • 40. RAID matériel et RAID logiciel ● pour des stations de travail ou des systèmes n'exécutant qu'une seule tâche principale, ou sous une charge modérée, le RAID logiciel est très satisfaisant. ● pour des systèmes serveurs avec de nombreux utilisateurs et travaillant parfois sous une charge très élevée, le RAID logiciel est inadapté.
  • 41. RAID matériel et RAID logiciel ● Devinette
  • 42. RAID matériel et RAID logiciel ● Devinette ● dans quel cas peut-on utiliser du RAID logiciel sur un système de haute performances ?
  • 43. RAID matériel et RAID logiciel ● Devinette ● dans quel cas peut-on utiliser du RAID logiciel sur un système de haute performances ? ● lorsque c'est un système dédié dont la seule tâche est de traiter les entrées/sorties (Isilon, NetApp, etc).
  • 44. Le RAID ● C’est fini! ● Des questions ? info@intellique.com ● Tél: 01 78 94 84 00 Version 1.4 14/11/2013