Your SlideShare is downloading. ×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Introducing the official SlideShare app

Stunning, full-screen experience for iPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Big Data : gérer une croissance exponentielle

5,444
views

Published on

Il n’est pas exagéré de dire que les organisations sont aujourd’hui confrontées à une explosion du volume des données. Selon une récente étude, les personnes interrogées constatent des taux annuels de …

Il n’est pas exagéré de dire que les organisations sont aujourd’hui confrontées à une explosion du volume des données. Selon une récente étude, les personnes interrogées constatent des taux annuels de croissance des données compris entre 11 et 30 %. Pour 28 % d’entre eux, ces taux atteignent 30 % et plus. Le volume des données créées et répliquées augmente de façon exponentielle et les services informatiques des entreprises se démènent pour trouver des solutions qui permettront de le gérer, le stocker et le sécuriser.

Published in: Technology

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
5,444
On Slideshare
0
From Embeds
0
Number of Embeds
4
Actions
Shares
0
Downloads
30
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. L I V R E B L A N CBig Data :gérer une croissance exponentielledes donnéesL’importance du stockage N-Tier
  • 2. 2 Livre blanc | Big Data : gérer une croissance exponentielle2 Livre blanc | Big Data : gérer une croissance exponentielleTABLE DES MATIÈRESIntroduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3Envisager l’archivage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4Avantages de l’archivage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5Faire le bon choix . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6Définition des Big Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7Archivage et sauvegarde, quelles différences ? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7AvertissementIl est possible que ce livre blanc contienne des informations exclusives protégées par des droits d’auteur. Les informationsde ce document sont modifiables sans préavis et ne constituent pas un engagement de Quantum. Quantum utilise dessources présumées fiables mais ne peut être tenu responsable des inexactitudes que ce livre blanc pourrait contenir.Quantum ne s’engage pas à mettre à jour ni à actualiser les informations de ce livre blanc et se réserve le droit de luiapporter des modifications ou de suspendre sa diffusion et/ou celle de ses produits sans préavis. Aucune partie de cedocument ne peut être reproduite ni transmise sous quelque forme ou par quelque procédé que ce soit, électroniqueou mécanique, y compris par photocopie, par enregistrement ou au moyen d’un système de stockage et d’extractiond’information, pour une finalité autre que l’utilisation personnelle de l’acheteur, sans l’accord écrit exprès de Quantum.
  • 3. Big Data : gérer une croissance exponentielle | Livre blanc 3l i v r e b l a n cl i v r e b l a n cIntroductionIl n’est pas exagéré de dire que les organisations sont aujourd’hui confrontées à une explosion duvolume des données. Selon une récente étude du cabinet d’analyse Enterprise Strategy Group1, lespersonnes interrogées constatent des taux annuels de croissance des données compris entre 11 et 30 %.Pour 28 % d’entre eux, ces taux atteignent 30 % et plus. Le volume des données créées et répliquéesaugmente de façon exponentielle et les services informatiques des entreprises se démènent pour trouverdes solutions qui permettront de le gérer, le stocker et le sécuriser.Si les organisations accumulent et stockent plus de données que jamais, c’est parce que leur activitéen dépend. La tendance à exploiter les Big Data (voir « Définition des Big Data », page 7) pourobtenir un avantage concurrentiel et aider les organisations à atteindre leurs objectifs suppose decollecter de nouveaux types d’informations (commentaires postés sur des sites Web, données d’essaispharmaceutiques, résultats d’explorations sismiques, pour ne citer que quelques exemples) et de lesexaminer sous toutes les coutures pour comprendre et trouver des réponses. Par exemple, dans lecadre de son processus de séquençage de génomes, l’Institut suisse de bioinformatique crée d’énormesvolumes de données : une seule expérience produit jusqu’à 743 000 fichiers par passage, chaque passagereprésentant une capacité moyenne de 2 To et se répétant tous les 3,5 jours.Dans le même temps, les organisations collectent et convertissent toujours plus de contenu endonnées numériques. Les données vidéo, par exemple, qui ne servaient il y a quelques années qu’àagrémenter le site Web d’une entreprise, sont devenues des outils de marketing, de formation et decommunication essentiels. Les technologies avancées comme les effets spéciaux et la haute définitionaugmentent substantiellement le volume des données générées ; la vidéo 3D nécessite deux fois plusd’espace de stockage que la vidéo 2D puisqu’il faut deux caméras pour filmer une même scène, et lesressources de stockage sont donc fortement sollicitées.La prise en charge de technologies avancées de ce type peut mettre au jour des faiblesses majeuresdes architectures informatiques. Ainsi, quand l’université Brigham Young de Hawaii (BYU-H) a décidéde convertir en haute définition ses vidéos produites en interne, elle a constaté que les débits étaientinsuffisants et s’est trouvée à court d’espace de stockage à mi-projet, ce qui a contraint le personnelà décider dans l’urgence quelles données stockées il pouvait effacer afin de faire de la place pour lesnouveaux contenus. Le cabinet de conseil Coughlin Associates estime que d’ici 2015, une capacitéde stockage de près de 4 exaoctets sera nécessaire pour la création du seul contenu des médiasnumériques professionnels.L’augmentation du volume des données que les sociétés doivent stocker aujourd’hui tient aussi auxobligations toujours plus nombreuses que les réglementations et les lois imposent aux sociétés quicollectent et conservent des données sur leurs clients, leurs partenaires et même leurs employés.À mesure que les entreprises, les organismes à but non lucratif et les gouvernements se rendentcompte de l’importance des données, non seulement pour leur fonctionnement au quotidien mais aussipour leurs stratégies et leur capacité à aller de l’avant, les services informatiques sont confrontés à unproblème grandissant. Selon une étude de Gartner2de novembre 2010, la croissance des données estle principal défi en matière d’infrastructure matérielle auquel les datacenters des grandes entreprisessont confrontés : 47 % des personnes interrogées la classent parmi les trois problèmes majeurs qu’ellesrencontrent. Et 62 % de ces personnes interrogées affirmaient qu’elles prévoyaient d’investir dansl’archivage d’ici fin 2011 pour gérer les difficultés créées par la croissance des données.
  • 4. 4 Livre blanc | Big Data : gérer une croissance exponentielle« Si toutes les difficultés qui touchent l’infrastructure matérielle des plus grands datacenters ont unimpact, plus ou moins marqué en termes de coûts, la croissance des données entraîne en particulierune hausse des coûts du matériel, du logiciel, de la maintenance associée, de l’administration et desservices », indique dans un communiqué April Adams, directrice de recherche chez Gartner. « Contenirles coûts restant une priorité essentielle de la plupart des organisations, positionner les technologies pourmontrer qu’elles offrent cet avantage, en plus d’autres bénéfices, se révèle une approche prometteuse. »L’élaboration de stratégies pour aider les organisations qui dépendent de leurs données se heurte àplusieurs difficultés :• Contraintes de budget. Dans la situation économique incertaine d’aujourd’hui, les organisationsveulent exploiter au maximum les ressources dont elles disposent et rechignent à consentir desinvestissements initiaux considérables dans de nouvelles technologies.• Complexité accrue. Les techniciens talentueux étant déjà très sollicités, les servicesinformatiques veulent à tout prix éviter de compliquer davantage leurs infrastructurestechnologiques et cherchent plutôt à doter les utilisateurs finaux d’outils faciles d’emploi.• Exigences de disponibilité. Les sociétés veulent avoir l’assurance que leurs employés peuventaccéder facilement à leurs données, où qu’elles soient stockées et indépendamment de leur degréd’obsolescence.• Problèmes d’intégrité. Les sociétés attendent d’un système de stockage qu’il préserve l’intégritédes données. Les services informatiques doivent pouvoir garantir cela et tenir leur promesse.Envisager l’archivageL’approche consistant à définir des stratégies pour archiver les données de manière automatisée, fiableet économique commence à s’imposer dans des organisations opérant dans des secteurs d’activité trèsvariés. Archiver les données plus anciennes de sorte qu’elles soient transférées automatiquement vers desmédias de stockage moins onéreux, tels un disque de base ou une bande, permet de libérer une partiede la coûteuse capacité de stockage primaire. Les entreprises peuvent donc hiérarchiser les donnéesqu’elles collectent en fonction de leur ancienneté et de la fréquence des accès. Correctement appliquée,cette méthode assure un archivage fiable et économique des données qui restent aisément accessibles.Toutefois, dans l’univers complexe du stockage et de la gestion des données d’aujourd’hui, l’archivagen’a pas toujours la place qu’il mérite, ou pire, n’est pas utilisé du tout. L’archivage est souvent confonduavec la sauvegarde des données (voir « Archivage et sauvegarde, quelles différences ? », page 7), lessociétés considérant qu’effectuer l’une ou l’autre de ces opérations assurera leur sécurité. Cependant,celles qui se contentent de faire des sauvegardes utilisent leur coûteux matériel de stockage à mauvaisescient et mobilisent de précieuses ressources informatiques en conservant toutes les données sur unsystème de stockage primaire sans tenir compte de l’ancienneté des données ni de la fréquence d’accès.Elles ont une politique à courte vue puisqu’elles ne réfléchissent pas à leurs besoins à long terme,notamment au type de stockage le mieux adapté à leurs données dans la durée.« La plupart des sociétés réalisent des sauvegardes mais celles qui pratiquent l’archivage sont beaucoupmoins nombreuses », commente Eric Bassier, directeur de la gamme de produits de sauvegardeautomatisée sur bande de Quantum. « Des secteurs comme celui des médias et des loisirs, quimanipulent des volumes de données numériques tellement énormes qu’il est impossible de les conserveren totalité sur disque, préfigurent le marché de demain. »
  • 5. Big Data : gérer une croissance exponentielle | Livre blanc 5l i v r e b l a n cl i v r e b l a n cAvantages de l’archivageLes stratégies d’archivage bien planifiées procurent un certain nombre d’avantages aux organisations :• Réduction des coûts. Les systèmes d’archivage permettent de transférer les données auxquellespersonne n’a accédé depuis un certain temps (cette période étant généralement définie par leservice informatique) du coûteux espace de stockage primaire sur disque vers un stockage dedeuxième ou de troisième niveau moins onéreux, sur disque ou sur bande. Cela libère une partiede la capacité de stockage primaire pour les volumes de données en constante augmentation queles organisations collectent au quotidien.• Gestion réduite. Contrairement aux stratégies de sauvegarde qui imposent de passer parle service informatique pour effectuer des restaurations, les stratégies d’archivage complètespermettent aux utilisateurs finaux de localiser eux-mêmes les fichiers dont ils ont besoin.Les solutions d’archivage qui incluent un logiciel de gestion des fichiers facilitent cette tâcheen fournissant aux utilisateurs finaux un système de gestion de fichiers de type Windows(un « système de fichiers ») où il est facile de naviguer pour localiser les fichiers dans leur formatd’origine et y accéder. Les solutions proposant la gestion automatisée des données transfèrentvers un deuxième ou un troisième niveau de stockage les fichiers auxquels personne n’a accédépendant une certaine durée, généralement 30, 60 ou 90 jours, une valeur fixée par le serviceinformatique. Avec l’automatisation, les données sont stockées au bon moment au niveauqui convient, ce qui évite au service informatique de devoir intervenir en permanence dans leprocessus de gestion des données.• Un média de stockage adapté aux données. Les organisations doivent pouvoir accéderrapidement aux données faisant l’objet d’accès fréquents et le stockage primaire répond bienà ces besoins de performances. Cependant, lorsque les données deviennent plus anciennes etqu’elles sont moins utilisées, les entreprises peuvent réduire leurs coûts de manière substantielleen les transférant sur un disque d’entrée de gamme ou sur une bande. Les accès sont bien sûrmoins rapides qu’avec des disques haut de gamme mais cela importe peu pour les données plusanciennes qui restent inactives pendant de longues périodes. En transférant les données plusanciennes vers ce type de médias, les sociétés réduisent leurs besoins de capacité de stockageprimaire et font des économies.• Disponibilité des données garantie. Les données archivées sont souvent conservées pendantdes années et une stratégie d’archivage complète doit garantir qu’elles restent disponibles àtout moment. Les solutions qui contrôlent régulièrement l’état des médias de stockage offrentl’assurance que les données stockées à long terme restent intactes.Toutes ces caractéristiques différencient les solutions d’archivage complètes des offres moins riches quipromettent de protéger les informations mais ne se montrent pas à la hauteur concernant les besoinsd’accès.« Une solution d’archivage n’est pas vraiment bonne si, quand vous avez besoin d’un fichier, vousdevez d’abord localiser un instantané de sauvegarde datant de plusieurs années, recréer le serveur, puisle parcourir pour trouver le fichier », précise Eric Bassier. « Les archives doivent permettre les rechercheset être faciles d’accès. »Les sociétés qui mettent en œuvre des solutions d’archivage complètes et procèdent à des sauvegardescomme pour leurs systèmes de stockage primaire constatent qu’elles peuvent répondre plus facilementaux besoins, aux exigences de conformité et au changement de nature des données de l’entreprise.Surtout, elles peuvent réaliser tout cela sans devoir remanier leurs architectures informatiques ouacquérir plus de stockage primaire, tout en libérant les informaticiens pour d’autres tâches plusstratégiques.
  • 6. 6 Livre blanc | Big Data : gérer une croissance exponentielleFaire le bon choixL’archivage étant devenu un outil stratégique pour aider l’entreprise à atteindre sesobjectifs, les services informatiques doivent veiller à prendre en considération plusieursvariables et à évaluer avec soin les solutions du marché avant d’en choisir une.Avec la gamme de solutions d’archivage de Quantum, qui inclut le logiciel de gestionde données StorNext®, la librairie Scalar®i6000 et le système d’archivage StorNext AELArchive, les organisations disposent des fonctions nécessaires pour la mise en œuvre fiableet aisée d’une stratégie d’archivage complète.• Le logiciel StorNext de Quantum pour la gestion des données de bout en bout permetde créer des infrastructures qui consolident les ressources, ce qui accélère le workflowet fait baisser les coûts de fonctionnement. StorNext fournit un système de fichiershautes performances, formidable pour gérer les fichiers volumineux, et combinepartage et rétention des données, évitant aux entreprises de devoir faire fonctionnerensemble plusieurs produits susceptibles de présenter des incompatibilités.StorNext fonctionne avec n’importe quel système d’exploitation ou plate-formematérielle pour permettre à tous les hôtes d’accéder facilement à toutes les données,et automatise le processus de transfert des données à mesure que celles-ci vieillissent.Les fonctions de gestion de données professionnelles incluent le stockage N-Tieret l’archivage en ligne, la déduplication, le transfert de données distribué et larécupération de fichier partiel.• La librairie intelligente Scalar i6000 de Quantum est conçue pour améliorersensiblement la sécurité et la gestion des processus de sauvegarde, de repriseaprès incident et d’archivage dans l’entreprise. Sa fonction EDLM (Extended DataLife Management) met en place des règles pour contrôler l’intégrité des donnéesstockées sur les bandes de la librairie. Celle-ci vérifie périodiquement les bandespour s’assurer qu’elles sont en bon état et lisibles. Elle peut être configurée pouralerter automatiquement un administrateur ou le logiciel StorNext si des fichiersendommagés sont détectés, en vue de leur transfert sur une autre bande.La librairie i6000 inclut aussi Active Vault, une fonction économique et fiablepour le stockage sécurisé des bandes d’archive.• Le système d’archivage StorNext AEL Archive de Quantum combine le logicielStorNext et la librairie Scalar i6000 au sein d’une solution intégrée qui apporteà l’organisation tout ce dont elle a besoin pour créer sa stratégie d’archivage.Cette appliance hautes performances préconfigurée et évolutive se caractérisepar des coûts de fonctionnement inférieurs à ceux de ses composants vendusindividuellement ; c’est aussi un système ouvert qui s’intègre aux applicationstierces. StorNext AEL Archive est la solution d’archivage à long terme la plusfiable de l’industrie. Unique en son genre, elle s’intègre étroitement aux matérielset logiciels Quantum pour fournir une archive fiable et de grande capacitéqui s’autosurveille et s’autorépare, conçue pour le stockage à long terme ducontenu near-line.« Une solution d’archivagen’est pas vraiment bonnesi, quand vous avezbesoin d’un fichier,vous devez d’abordlocaliser un instantanéde sauvegarde datantde plusieurs années,recréer le serveur, puisle parcourir pour trouverle fichier.»Eric Bassier, Quantum
  • 7. Big Data : gérer une croissance exponentielle | Livre blanc 7l i v r e b l a n cl i v r e b l a n cLes organisations qui ont dû gérer les conséquences de l’explosion du volume des donnéessavent que les solutions de stockage complètes apportent une réponse adaptée. Afin derésoudre les problèmes de gestion et de stockage des données soulevés par le passageà la vidéo HD, BYU-H a déployé StorNext sans perturber son processus de production ;les utilisateurs ont seulement remarqué qu’ils travaillaient à partir d’une autre unitéaprès la mise en œuvre de ce logiciel. StorNext agit désormais comme un contrôleurde métadonnées pour le réseau SAN de BYU-H et permet aux spécialistes de différentsdomaines de travailler simultanément sur un même fichier. Et les débits sont passés de800 Mo/s à 8 Go/s, soit un gain d’efficacité et de productivité énorme.« Avec StorNext, nos spécialistes du graphisme, du texte et du son peuvent tousaccéder aux données en même temps. C’est une solution fantastique car nous pouvonsdésormais ingérer les données audio et vidéo pendant que d’autres intervenantséditent le texte. En matière d’édition, nous sommes au moins deux fois plus efficacesqu’auparavant », précise Russell T. Merrill, directeur des médias et de la productionpédagogiques de BYU-H.La déferlante des Big Data, la prévalence de nouveaux types de données numériquesdans l’entreprise et les coûteuses exigences de conformité obligent les organisationsde toutes tailles à gérer l’explosion du volume des données. Les solutions d’archivagestratégiques et complètes constituent des options abordables pour économiser lesressources informatiques et alléger la charge de travail des informaticiens.De surcroît, elles accompagneront l’évolution des besoins de l’entreprise.Archivage et sauvegarde, quelles différences ?La principale différence entre la sauvegarde et l’archivage des données serésume à ceci : la sauvegarde crée une copie des informations et la stockeà un autre emplacement ; l’archivage transfère les données sur un médiade stockage secondaire. Mais il y a d’autres différences :Sauvegarde• Pour la reprise après incident• Crée une copie secondaire desdonnées qui ne fera peut-êtrejamais l’objet d’un accès• Ne réduit pas la capacité disque niles coûts de stockage des données• Sécurise les données au niveauvolumeArchivage• Pour le stockage des données surle long terme• Constitue la copie primaire desdonnées qui fera l’objet d’accès• Réduit la capacité de stockageprimaire sur disque et les coûtsde stockage, les données étanttransférées vers un autre niveau• Sécurise les données au niveaufichier, ce qui facilite la localisationd’un fichier à récupérerDéfinition des Big DataLes Big Data concentrent toute l’attentiondu monde de l’informatique, et ceterme peut avoir plusieurs significations.En général, il renvoie à des types dedonnées relativement nouveaux (vidéo,images, son, etc.) qui génèrent desfichiers volumineux.Il désigne aussi de grands ensemblesde petits volumes de données(commentaires sur les sites Web desréseaux sociaux, photos du fonds marin,images des caméras de surveillance dutrafic) qui prennent leur sens lorsqu’ilscombinés. Le plus souvent, ces Big Dataconnaissent une croissance rapide etcertains ensembles de données modestesseront amenés à se développer pourdevenir des Big Data. Les organisationsont besoin de fonctionnalités de stockagecapables de gérer les fichiers volumineuxet les ensembles de données quiconnaissent une croissance rapide dansun emplacement unique.1 Vidéo commandée à Enterprise Strategy Group par Quantum en 2010 : La déduplication et la gamme DXi de Quantum2 http://www.gartner.com/it/page.jsp?id =1460213
  • 8. 8 Livre blanc | Big Data : gérer une croissance exponentiellePréserver les données les plus importantes qui soient : les vôtres.™© 2012 Quantum Corporation. Tous droits réservés. Quantum, le logo Quantum, DXi et StorNext sontdes marques, déposées ou non, de Quantum Corporation et de ses filiales aux États-Unis et dans d’autrespays. Toutes les autres marques appartiennent à leurs propriétaires respectifs. WP00166-v01F Janvier 2012À propos de QuantumQuantum Corp. (NYSE : QTM) est leader mondial dans les domaines de la sauvegarde, de la restauration etde l’archivage. Plus de 50 000 entreprises de toutes tailles font confiance à Quantum pour leurs besoins desécurisation, rétention et gestion des données. Les solutions dédiées aux environnements ouverts de Quantumoffrent des possibilités de stockage performantes et économiques. Elles minimisent les risques de perte dedonnées et pérennisent les investissements antérieurs en s’intégrant facilement dans l’existant. Ces offres incluent,notamment, trois plates-formes hautement évolutives, parmi les meilleures du marché : pour des sauvegardeset des restaurations rapides, les systèmes de déduplication et de réplication sur disque de la gamme DXi®, pourla rétention des données à longue durée et l’externalisation de support amovibles, les produits de sauvegardeautomatisée sur bande Scalar®et pour un partage et un archivage performants de fichiers, le logiciel de gestiondes données StorNext®. Quantum Corp., 1650 Technology Drive, Suite 800, San José, CA 95110, (408) 944-4000,www.quantum.com.www.quantum.com • +33 (0)1 41 43 49 00