Gestion des applications critiques avec SQL Server 2008 - Microsoft Techdays2009 DAT302 - Presentation Transcript
Gestion des applications critiques avec SQL Server 2008 Bertrand Audras, [email_address] Frédéric Pichaut, Microsoft GTSC [email_address]
Code Session : DAT302
Retours d'expériences
“ Nos utilisateurs ont récemment subi une panne. Comment rendre mon application hautement disponible sans modifier l’application et sans impacter les utilisateurs? ”
“ Avec l’augmentation des volumes et du nombre d’utilisateurs, les performances deviennent aléatoires. Au secours, notre crédibilité est en jeu !”
“ Historiquement, chaque projet est hébergé sur une plateforme dédiée et dispose de sa propre approche de la haute disponibilité. Comment standardiser mes applications et investissements par type de SLA dans le prochain plan de secours de l’entreprise? ”
Q uelques exemples
eCommerce: BWIN, paris sportifs online
Transactions : 30,000 Transactions SDBGR / Sec
1 Million de Parieurs connectés par Jour
Compression SQL2008: 12,5 TB au lieu de 100 TB
Telecom: Bouygues Telecom “Projet ISIS”
Plate forme de gestion des SMS
Disponibilité : 99,99%
15.000 transactions/sec
Industrie: ALSTOM Transport
Plateforme de gestion des configurations
Migration Unix vers Windows/SQL Server
Q uelques exemples
Sony Ericson: environnement SAP
Migration Unix/Oracle vers Windows/SQL Server
Plateforme Intel Itanium
RPO 100%: cluster + Database Mirroring remote
Acteur telecom en europe: VLDB
Datawarehouse de 37TB, 200 milliards de lignes/table de fait
Cube SSAS de 4.5TB (cible à 8TB) avec 30 dimensions
Plateforme partitionnée avec 56 cores itanium, RAM à 448GB
Baie de stockage avec près de 1000 disques
Applications critiques
Les points clés sont :
Haute disponibilité et Qualité de Service
Temps de réponse garantis
Evolutivité VLDB
Productivité en terme d’exploitation
Datacenter
Sécurité, Conformité, Intégrité
Fiabilité de la plate-forme
Agenda Gestion des applications critiques…
Disponibilité, de 99,999% jusqu’au géo-cluster
Stabilité des temps de réponse
Optimisation et suivi des performances
Sécurité et Chiffrement de données
Recommandations du support Premier pour une exploitation efficace et sereine
Contrats de service 99.9% 99.99% 99.999% 99.9999% 8.75h/an 52min/an 5.2min/an 32sec/an Jours Heures Minutes Secondes Instantané RTO: Temps de redémarrage RPO: Point de redémarrage Jours Heures Minutes Transactions Désastre Corruption des données Erreurs humaines Perte de serveurs Opérations de maintenance Pannes du stockage Causes des interruptions de service Coûts
Solutions SQL Server Haute Disponibilité Secours à distance Solution RPO RTO Bascule automatique Impact sur les performances Complexité SQL Server Database Mirroring mode Synchrone 100% 100% Oui avec témoin Faible Net Roundtrip < 10msec Moyenne Cluster local MSCS/WSFC 100% H+1min Oui Reconnexion client Non Moyenne SQL Server Log Shipping H-15min H+30min Non Faible lié à l’activité IO Simple SQL Server P2P Replication 99% H+10min Non Oui Haute Niveau table SQL Server Database Mirroring mode Asynchrone 99% H+1min Non Faible lié à l’activité IO Moyenne Géo-cluster Jusqu’à 100% H+5min Oui Reconnexion client Non Haute
Gérer les priorités Application Pool Admin Pool Admin Workload Backup Admin Tasks OLTP Workload OLTP Activity Ad-hoc Reports Executive Reports Min Memory 10% Max Memory 20% Max CPU 20% Max CPU 90% Report Workload
Ressource Governor
Agenda Gestion des applications critiques…
Disponibilité, de 99,999% jusqu’au géo-cluster
Stabilité des temps de réponse
Optimisation et suivi des performances
Sécurité et Chiffrement de données
Recommandations du support Premier pour une exploitation efficace et sereine
Optimisation et suivi des performances Démos disponibles sur le blog http://blogs.technet.com/patricg/
Et aussi Best Practices Analyser, Visual Studio for DB Pro, SQL Agent…
En fonction des « Data Provider », sait lire et exposer les données.
Collection Item
Pour un « Collector Type » définit les données à collecter et la fréquence (Collecter wait_time_ms et max_wait_time_ms depuis sys.dm_os_wait_stats DMV chaque 5 secondes).
Collection Set
Groupe de « collection items ».
Unité logique des collections.
Defined using TSQL or .Net APIs
Management Data Warehouse (MDW)
Base de donnée des donnée capturées
Architecture Data Collection UI (Object Explorer) Data Collection Configuration Collection Set Reports Base de donnée (DMW) Cible Data Collector Collection Sets Collection Sets Cible Data Collector Collection Sets Collection Sets
Data Collector Architecture Data Collector (dcexec.exe) SQL Server Operating System Data Collector Cache MDW SQL Agent SSMS msdb Upload Job (SSIS runtime)
«collection sets» système
Ils sont fournis de base sous le nom: System Data Collection Set avec un rapport prés défini pour chaque:
Disk Usage – Enregistre pour chaque bases l’utilisation des disques en thermes d’espace
Query Activity – Enregistre les requêtes les plus gourmandes
Server Activity – enregistre les «wait states», données mémoire et conteurs de performance
Il est aussi pposible de definir ses propres «collection sets» sous le nom: Custom Data Collection Set
Les captures
On peut capturer plusieurs serveurs dans un même MDW
Eviter de mesurer le «Data Collector» lui-meme
Contrôle du chargement des données
Sur un systèmes distant, charger toutes les 15 minutes
Espace nécessaire pour les «collection sets» système
Environ 250 à 350 MB par jours
Peuvent aussi dépendre de la charge
Les données sont purgées à la fréquence définie dans les «Collection Set»
Les logs sont stockés dans MSDB
Performance Data Collector
Plan Guide
Best practices Support
Tester la stratégie de sauvegarde et restauration (régulièrement)
Sur un autres système et/ou sur le system de production
Noter le temps que prend une restauration complète
Prendre une image de son système en activité normale
SQL Trace pour la capture des événements
Readtrace pour générer des rapports d’activités
SSMS Reports (en SQL 2005 SP2 possibilité de rapports personnalisés)
Performance Data Collector
Que va demander le support
Problèmes de performance, les rapports d’activité « normale »
Les ERRORLOG donc penser à les conserver et archiver
Recommandations du support Premier pour une exploitation efficace et sereine
Gestion de la sécurité
Transparent Data Encryption
Agenda Gestion des applications critiques…
Disponibilité, de 99,999% jusqu’au géo-cluster
Stabilité des temps de réponse
Optimisation et suivi des performances
Sécurité et Chiffrement de données
Recommandations du support Premier pour une exploitation efficace et sereine
Microsoft Operation Framework Le modèle de processus MOF Revue d’implémentation Revue de mise à disposition de l’application Revue de SLA Revue des opérations Changer Exploiter Supporter Optimiser Gestion de capacité Gestion de la disponibilité Optimisation des coûts Gestion des ressources Continuité de service Gestion de sécurité Help Desk, suivi des incidents, escalade Gestion des problèmes « Failover » & « Recovery » Gestion du changement Gestion de configuration Gestion des révisions
Microsoft Services (consulting et support) propose des prestations de services pour vous accompagner de « bout en bout », depuis les phases amont de réflexions, jusqu’à l’exploitation des solutions conçues
http://www.microsoft.com/mof
Gestion technique client: TAM Enquêtes régulières sur les incidents support, la satisfaction globale, mise en place d’un COS
Points d’activité réguliers TAM / CSM
Suivi du plan de services et des actions
Point sur les projets majeurs
Bilan 4 mois et 9 mois
Gestion des escalades avec les équipes support
Mise en place de services proactifs, gestion des compétences et planification des services
Coordination des ressources
Respect des délais
Mise en place d’un plan de service
Axes de travail principaux
Plan de support
Planification des actions
Informations techniques
Transfert d’informations techniques
Rapports mensuels d’activité
Consommation du contrat
Analyse des incidents
Demandes traitées par le TAM
Mise en place de Post-Mortems pour les incidents critiques
Réunion d’orientations et d’initialisation des services
Présentation du contrat
Définition des rôles
Analyse de l’existant
Organisation du client et interlocuteurs clés
Identification des projets
Connaissance et analyse du contexte du client
Connaissance de votre contexte Méthodologie Coordination
Processus d’escalade Client Support Groupe de développement CPR (Critical Problem Résolution) : Une équipe mondiale d'ingénieurs de haut niveau dont le but est de trouver des solutions aux problèmes critiques. En étroite collaboration avec les équipes de développement. Client Ingénieur Support (spécialiste) Responsable Technique de Compte (TAM) Manager Support Manager Situation Critique Ingénieur d’Escalade (CPR) Développement de correctifs (QFE) Support partenaire
Processus d’escalade PREMIER Client Support Groupe de développement CPR (Critical Problem Résolution) : Une équipe mondiale d'ingénieurs de haut niveau dont le but est de trouver des solutions aux problèmes critiques. En étroite collaboration avec les équipes de développement. Client Ingénieur Support (spécialiste) Responsable Technique de Compte (TAM) Manager Support Manager Situation Critique Ingénieur d’Escalade (CPR) Développement de correctifs (QFE)
0 comments
Post a comment