Your SlideShare is downloading. ×
Segurança no Armazenamento
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Saving this for later?

Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime - even offline.

Text the download link to your phone

Standard text messaging rates apply

Segurança no Armazenamento

1,934
views

Published on

Published in: Technology, Travel, Business

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
1,934
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
50
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide
  • Transcript

    • 1. Segurança no Armazenamento 1. Introdução Márcio Aurélio Ribeiro Moreira [email_address] http://si.uniminas.br/~marcio/ Pós-SI – 3ª Turma – 2008
    • 2. Objetivos do capítulo
      • Explicitar a necessidade de armazenamento
      • Avaliar as alternativas de solução
      • Revisar os principais conceitos de armazenamento
      • Explorar os tipos de RAID
      • Mostrar as alternativas de redes de armazenamento
      Márcio Moreira 1. Introdução – Slide
    • 3. O armazenamento não está resolvido?
      • O número total de livros produzidos desde o começo da impressa não passa de 1 bilhão:
        • Se cada livro tiver em média 500 páginas com 2000 caracteres cada. Logo, 1 MB é suficiente para armazenar cada livro sem compressão
      • Para armazenar todos os livros precisamos de 1 bilhão de MB ou 1 PetaByte (PB)
      • Considerando Us$20 / GB, 1 PB pode ser comprado por Us$20 milhões
      Márcio Moreira 1. Introdução – Slide
    • 4. O armazenamento nas organizações
      • Banco da Índia:
        • 14.000 filiais em todo o país
        • 11.000 escritórios conectados ao Data Center
        • Mais de 20 milhões de clientes
        • ≈ 100 TB armazenados
          • Crescimento exponencial
        • Questões de segurança:
          • Compressão / Cifragem
          • Antivírus
          • Firewall e IDS
      Márcio Moreira 1. Introdução – Slide Fonte: Ramakrishnan
    • 5. Demanda de performance e espaço Márcio Moreira 1. Introdução – Slide Fonte: Ramakrishnan 1X 2X 3X 4X 5X 6X 7X 8X Hoje 1 Ano 2 anos 3 anos 4 anos 5 anos 50% 100% 150% 200% 250% 300% Demanda Performance Demanda Espaço Demanda anual de 50% de espaço e performance 1X 1.5X 2.3X 3.4X 5.1X 7.6X 253% 169% 113% 75% 50%
    • 6. Alternativas para a demanda
      • Podemos resolver com RAMs?
        • Caras e voláteis  só para processamento
      • Podemos utilizar fitas?
        • Baratas e lentas por serem seqüenciais  backups
      • Podemos resolver com CDs e DVDs?
        • Baratos e aleatórios. Mas, lentos  distribuição
      • Podemos resolver com HDs?
        • Preço justo, aleatórios e rápidos  muitos HDs
        • Onde colocar tantos HDs? Fora do gabinete
      Márcio Moreira 1. Introdução – Slide
    • 7. Camadas de dados Márcio Moreira 1. Introdução – Slide Computadores Notebooks Dispositivos Pessoas e Coisas Camada de Banco de Dados Camada web Camada Aplicações Fonte: Ramakrishnan Camada de Storage
    • 8. 1º dispositivo magnético Márcio Moreira 1. Introdução – Slide
      • A superfície do disco (ou fita) é coberta com uma substância magnética
      • Movimento mecânico posiciona cabeça do dispositivo para:
        • Gravação: definir a polarização. Leitura: testar a polarização
      • Por ser magnética, a polarização é mantida mesmo sem energia
    • 9. Armazenamento em discos
      • Organiza os dados em áreas endereçáveis
      • Devem ser formatados para serem endereçáveis pelos sistemas operacionais
      • O acesso direto provê performance adequada para acessos seqüencial ou randômico
      • O desempenho do disco é impactado pelo tempo de posicionamento da cabeça para o acesso
      • Os discos são conectados fisicamente ao sistema:
        • É inviável movê-los para um novo local ou novo sistema
        • Como conectar vários discos num mesmo sistema?
      Márcio Moreira 1. Introdução – Slide
    • 10. Vamos olhar os discos de perto Márcio Moreira 1. Introdução – Slide
    • 11. Formatação para acesso direto Márcio Moreira 1. Introdução – Slide Fonte: EMC Trilha Cada prato do disco é segmentado em vários anéis concêntricos chamados trilhas O endereço único de uma área em um drive de disco é composto de: Cilindro, Cabeça e Setor. Um setor é a menor parte endereçável de uma trilha Setor Cilindro Um cilindro é o conjunto formato por uma trilha específica em todos os pratos juntas
    • 12. Tempo de acesso ao drive de disco
      • Seek Time :
        • Tempo de busca
        • Média de tempo gasto para mover o braço do atuador para a posição de leitura ou gravação da cabeça na trilha
      Márcio Moreira 1. Introdução – Slide Fonte: EMC
    • 13. Tempo de acesso ao drive de disco
      • Latency :
        • Tempo de Latência
        • Média de tempo gasto para esperar o disco girar e o setor desejado chegar o início da posição de acesso
        • Também conhecido como espera racional
      Márcio Moreira 1. Introdução – Slide Fonte: EMC
    • 14. Tempo de acesso ao drive de disco
      • Transfer Rate :
        • Taxa de Transferência
        • Média de tempo gasto para ler (ou escrever) e enviar (ou receber) os dados do setor para o drive de disco
      Márcio Moreira 1. Introdução – Slide Fonte: EMC
    • 15. Variáveis da performance de discos
      • Tempo de busca
      • Velocidade rotação RPM:
        •  RPM   Latência
        •  RPM tem menor impacto na Taxa de Transferência
      • Velocidade da interface do drive:
        • Ultra SCSI: 40 MB/sec
        • Canal de fibra: 100 MB/sec
      Márcio Moreira 1. Introdução – Slide Fonte: EMC
    • 16. Evolução da tecnologia de discos
      • A capacidade continua aumentando muito com o aumento da densidade dos dados
      • A performance aumenta marginalmente com:
        • Aumento da velocidade de rotação (RPM)
        • Aumento do uso da memória e cache no nível de drive
      • As interfaces são dirigidas por padrões da indústria:
        • ATA ( Advanced Technology Attachment )
        • Ultra SCSI ( Small Computer System Interface )
        • Canal de Fibra
      • Desafios da indústria:
        • Aumentar a capacidade por disco reduzindo custo. Mas, …
        • Reduzir o número de atuadores mantendo a capacidade
      Márcio Moreira 1. Introdução – Slide Fonte: EMC
    • 17. Necessidades de armazenamento Márcio Moreira 1. Introdução – Slide Fonte: Ramakrishnan High-End Us$40/GB Deman-da do negócio Alta Performance Tempo Crítico Midrange Us$20/GB SATA Us$5/GB Tape Us$0.5/GB Alta Capacidade Custo Crítico 100% 99.999% 99.9% Longo Prazo
    • 18. Tecnologia RAID
      • Como obter performance e confiabilidade?
        • RAID:
          • R edundant A rray of I ndependent D isks
          • Um conjunto de HDs é visto pelo SO como uma única unidade de disco
        • Vantagens:
          • Grande capacidade de armazenamento
          • Acesso paralelo  melhor performance
          • Permite o espelhamento de dados
        • Desvantagens:
          • Custo: requer hardware ou software especial
          • Se espelhado: requer o dobro de espaço
      Márcio Moreira 1. Introdução – Slide
    • 19. Conexões físicas dos discos
      • Variáveis para conexões físicas:
        • Tipos de cabos
        • Número de vias
        • Conectores físicos
      • Regras para conexões lógicas:
        • Identificar os comandos (de leitura e gravação) e os dados
      • Formato do drive:
        • Esquema de endereçamento
      • Sistema
      • controlador ou
      • placa de circuito:
        • ESCON para mainframe
        • H ost B us A dapter (placas para fibra ótica) para sistemas abertos
        • Placas proprietárias para o AS/400
      Márcio Moreira 1. Introdução – Slide Fonte: EMC System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA
    • 20. Como a operação de I/O ocorre
      • Iniciando uma requisição de leitura:
      Márcio Moreira 1. Introdução – Slide Fonte: EMC System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA
    • 21. Como a operação de I/O ocorre
      • Completando a requisição de leitura:
      Márcio Moreira 1. Introdução – Slide Fonte: EMC System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA
    • 22. Usando melhor a CPU e a memória
      • “ Vamos ver”:
        • Acessamos o cliente 1
        • Depois o cliente 2
        • Qual será o próximo?
        • Presumo o cliente 3
      • Técnica:
        • Cache
        • Read ahead
      Márcio Moreira 1. Introdução – Slide Fonte: EMC Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading CACHE System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading
    • 23.
      • Usar controladora no RAID:
        • Libera processamento
        • Libera memória RAM
      Melhorando ainda mais Márcio Moreira 1. Introdução – Slide Fonte: EMC Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading CACHE CPU System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading
    • 24.
      • Iniciando um comando de escrita:
      Como a operação de I/O ocorre Márcio Moreira 1. Introdução – Slide Fonte: EMC System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA
    • 25.
      • Completando o comando de escrita:
      Como a operação de I/O ocorre Márcio Moreira 1. Introdução – Slide Fonte: EMC System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA
    • 26. Melhor uso da CPU e memória Márcio Moreira 1. Introdução – Slide Fonte: EMC Customer 1 Meter Reading Customer 2 Meter Reading Customer 3 Meter Reading CACHE CPU System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory) HBA Comando de escrita: “ Grave a conta mensal do cliente no disco”. A confirmação de escrita é emitida assim que os dados e o comando de gravação estão seguros dentro de uma área completamente tolerante à falha
    • 27. Por dentro dos Disk Arrays Márcio Moreira 1. Introdução – Slide Fonte: EMC Gaveta do sistema operacional Gavetas de discos Fault Tolerant Cache Memory Array Controller Array Controller Disk Directors Disk Directors Host Interface Host Interface
    • 28. RAID 0 - Striping ou Fracionamento
      • Os dados são divididos em segmentos e estes são colocados nos HDs
      • Não há redundância
      Márcio Moreira 1. Introdução – Slide Fonte: EMC Volume 1 End Com RAID 0: Os volumes são divididos em blocos e movidos para balancear a carga de atividades. Volume 1 Middle Volume 1 Beginning Sem RAID: 3 HDs num mesmo host. Cada HD contem um volume Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning Volume 1 End Volume 2 End Volume 3 End Volume 1 Middle Volume 2 Middle Volume 3 Middle Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning
    • 29. RAID 1 - Mirroring ou Espelhamento
      • Os dados de um HD são espelhados em outro gerando redundância
      Márcio Moreira 1. Introdução – Slide Fonte: EMC Sem RAID: 3 HDs num mesmo host. Com RAID 1: Um espelho de cada HD é criado gerando um para de HDs. Volume 1 End Volume 1 Middle Volume 1 Beginning Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning Volume 1 End Volume 1 Middle Volume 1 Beginning Volume 1 End Volume 1 Middle Volume 1 Beginning Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning
    • 30. RAID 1+0 - Performance e Redundância
      • Os HDs (volumes físicos) são espelhados e os volumes lógicos divididos
      Márcio Moreira 1. Introdução – Slide Fonte: EMC Sem RAID: 3 HDs num mesmo host. Com RAID 1+0: HDs espelhados. Volumes lógicos fracionados para balancear carga. Volume 1 End Volume 1 Middle Volume 1 Beginning Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning Volume 1 End Volume 2 End Volume 3 End Volume 1 End Volume 2 End Volume 3 End Volume 1 Middle Volume 2 Middle Volume 3 Middle Volume 1 Middle Volume 2 Middle Volume 3 Middle Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning
    • 31. Paridade de dados
      • A paridade é utilizada para tentar recuperar dados perdidos
      Márcio Moreira 1. Introdução – Slide Fonte: EMC Parity for 3 rd Group = 1 1 LOST DATA 1 Parity for 2nd Group = 1 0 1 0 Parity for 1 st Group = 0 0 1 1 Group 1 Group 2 Group 3 Group 1 0 + 1 + 1 = 0 Group 2 0 + 1 + 0 = 1 Group 3 1 + 1 + ? = 1 DATA + DATA + DATA = Parity
    • 32. RAID 5 - Fracionamento e paridade
      • Divide os dados no nível de bloco e acrescenta um bloco de paridade
      • Requer no mínimo 3 discos
      Márcio Moreira 1. Introdução – Slide Fonte: EMC Parity for 1st Group Volume 1 End Volume 2 End Volume 3 End Parity for 2nd Group Volume 1 Middle Volume 2 Middle Volume 3 Middle Parity for 3rd Group Volume 1 Beginning Volume 2 Beginning Volume 3 Beginning Sem RAID: 3 HDs num mesmo host. Volume 1 End Volume 1 Middle Volume 1 Beginning Volume 2 End Volume 2 Middle Volume 2 Beginning Volume 3 End Volume 3 Middle Volume 3 Beginning Com RAID 5: Um grupo de drives são agrupados como um volume físico.
    • 33. Níveis de RAID Márcio Moreira 1. Introdução – Slide Fonte: EMC, IBM, Wikipedia e experiência.
      • Níveis mais usados comercialmente: 0, 1, 3, 5 e 10 (1+0):
      • Múltiplos I/O  Independência de leitura e gravação (acesso múltiplo).
      • Custo comparado para níveis que oferecem mesmos benefícios.
      Nível Técnica Mínimo Discos Aplicação Comentários 0 Fracionamento em blocos 2 Alta performance Sem redundância 1 Espelhamento 2 Alta disponibilidade e performance Implantação simples 2 Fracionamento em bits Monitoramento em RAM 2 Alta performance e disponibilidade Nenhum uso comercial 3 Fracionamento em bytes Disco de paridade 3 Alta performance e disponibilidade Menor custo 4 Fracionamento em blocos (Múltiplos I/O) Disco de paridade 3 Processamento de transações Alta disponibilidade Alta taxa de leitura Baixo uso comercial 5 Fracionamento em blocos (Múltiplos I/O) Discos de paridade independentes 3 Processamento de transações Alta disponibilidade Alta taxa de leitura 6 Fracionamento em blocos (Múltiplos I/O) Múltiplos discos de paridade independentes 4 Processamento de transações Alta disponibilidade Alta taxa de leitura Baixo uso comercial
    • 34. Arquiteturas típicas de storage
      • DAS:
        • Direct Attached Storage
      • NAS:
        • Network Attached Storage
      • SAN:
        • Storage Area Network
      Direct Attached Storage (DAS) Windows NT/2K Linux/Unix Netware Network Attached Storage (NAS) Windows NT/2K Linux/Unix Netware Storage Area Network (SAN) Netware Windows NT/2K Linux/Unix Storage FC Switch NAS
    • 35. Conexões típicas HBA HBA NIC HBA Storage Array Tape Drive Device Network Router SAN Switch System Bus CPU MAIN MEMORY (RAM) ROM (Read Only Memory)
    • 36. Produtos de Storage da EMC Symmetrix CLARiiON Centera SAN / NAS SAN / NAS / Backup- to-Disk CAS Tape & Tape Emulation DMX800 DMX1000-M2 DMX1000 DMX2000-M2 DMX2000 DMX3000-M2 DMX3000 CX700 CX500 CX300 Centera AX 100 Netwin 110 NS700/G Celerra CNS ADIC Scalar Series DL700
    • 37. Referências
      • EMC. Storage Basics . EMC. Jun-2006.
      • S. Ramakrishnan. Management of large scale Terabyte Store information servers . IACITS 2007. Jul-2007.
      • Khattar, Murphy, Tarella e Nystrom. Introduction to Storage Area Network, SAN . IBM. Redbooks. SG24-5470-00. 1999.
      Márcio Moreira 1. Introdução – Slide