Your SlideShare is downloading. ×
0
UNIVERSIDADE DO VALE DO RIO DOS SINOS - UNISINOS
UNIDADE ACADÊMICA DE GRADUAÇÃO
CURSO DE SEGURANÇA DA INFORMAÇÃO
MARCELO D...
MARCELO DIEDER
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA
PARA A INFRAESTRUTURA DE COMPUTAÇÃO NAS NUVENS UTILIZ...
Dedico totalmente este trabalho para a minha família, que me deu forças para
conseguir superar minhas dificuldades e seren...
AGRADECIMENTOS
Primeiramente a Deus, por mostrar-me os melhores caminhos a
seguir e à minha família que sempre me acolheu ...
"Nossas dúvidas são traidoras e nos fazem perder o que, com frequência,
poderíamos ganhar, por simples medo de arriscar."
...
RESUMO
O conceito de Computação nas Nuvens é um grande salto tecnológico após o
surgimento da Internet. Na necessidade de ...
ABSTRACT
The concept of Computing in the Clouds is a great technological leap after the
advent of the Internet. The need t...
LISTA DE FIGURAS
Figura 1 - Arquitetura do modelo de computação nas nuvens........................27
Figura 2 - Camadas da...
LISTA DE QUADROS
Quadro 1 - Comparativo de opções de infraestrutura em TI...........................28
Quadro 2 - Soluções...
LISTA DE TABELAS
Tabela 1 - Versões de lançamento do Openstack ..........................................66
Tabela 2 - Tip...
LISTA DE ABREVIATURAS E SIGLAS
AMQP Advanced Message Queuing Protocol
API Application Programming Interface
ARP Address Re...
12
LVM Logical Volume Manager
LXC Linux Containers
MTBF Mean Time Betwenn Failures
NAS Network Attached Storage
NASA Natio...
13
VPN Virtual Private Network
XFS High-Performance Journaling File System
XML Extensible Markup Language
SUMÁRIO
1 INTRODUÇÃO ........................................................................................................
15
2.3 VIRTUALIZAÇÃO................................................................................................49
2.3...
16
3.4.1 Visão Global....................................................................................................6...
17
4.3 ANÁLISE DOS DADOS OBTIDOS......................................................................95
4.3.1 Da latência...
18
1 INTRODUÇÃO
Computação nas Nuvens é um dos principais assuntos no atual momento da
Tecnologia da Informação. A Computa...
19
houvesse uma definição exata de um modelo estruturado que garantisse a
padronização desta nova arquitetura.
De acordo c...
20
mesma de código fechado. O grande esforço destas plataformas é garantir a
interoperabilidade com os diferentes tipos de...
21
a oferecer serviços de IaaS, além de agregar maior segurança para a computação
nas nuvens?
1.2 OBJETIVOS
Serão descrito...
22
1.3 JUSTIFICATIVA
O poder de cálculo dos atuais processadores, associado a grande evolução
das mídias de armazenamento ...
23
e demonstra testes de desempenho realizados no ambiente controlado por ele,
entretanto seus testes são focados, em sua ...
24
durante a implantação do projeto dará ênfase apenas ao emulador QEMU, não
utilizando demais sistemas de virtualização.
25
2 FUNDAMENTAÇÃO TEÓRICA
Este capítulo descreverá a conceituação de Computação nas Nuvens,
apresentando suas principais ...
26
2.1 COMPUTAÇÃO NAS NUVENS
Computação nas Nuvens, ou Cloud Computing é um novo modelo
computacional que busca principalm...
27
computadores independentes, que aparecem para um usuário de um sistema como
um único computador”. A figura 1, abaixo ap...
28
 baixo custo com a aquisição de computadores para usuários;
 aumento de desempenho;
 baixo custo com infraestrutura ...
29
Ao mesmo tempo em que a Computação nas Nuvens pode reduzir o
investimento de capital inicial para novos projetos de TI,...
30
aumento de segurança das soluções utilizadas, na medida em que os fornecedores
possuem políticas de privacidade rigoros...
31
2.1.2 A Importância da Virtualização e o Armazenamento Centralizado
A nuvem surgiu a partir do desenvolvimento e amadur...
32
consideravelmente o tempo com o gerenciamento e instalação de novos sistemas,
além de reduzir custos com a administraçã...
33
Figura 3 – Visão Global da Computação nas Nuvens.
Fonte: Editado pelo autor com base em Sosinsky (2011).
2.1.4 Principa...
34
serviços da nuvem. Assim como ocorre com outros serviços sob
demanda, como o consumo de água e eletricidade, os serviço...
35
2.1.5 Arquiteturas
Podemos classificar os modelos de arquitetura da nuvem em quatro principais
tipos. Não há um modelo ...
36
2.1.5.3 Comunitário
Também é possível trabalhar de forma mais segura do que o ambiente
público, sem ter que realizar o ...
37
 SaaS (Software as a Service)
Figura 4 - Limites entre IaaS, PaaS, SaaS
Fonte: CSA (2011b).
A figura anterior explana ...
38
Naturalmente, já existem outras definições para diferentes tipos de serviços,
conforme ocorre o crescimento da evolução...
39
utilização de seus serviços e aumentaria dinamicamente para Y ciclos de CPU e
memória em momentos de grande demanda por...
40
modelo SaaS é, provavelmente, o mais conhecido e difundido da Computação nas
Nuvens. Segundo Velte Ant; Velte Tob et al...
41
que se mantenham íntegros. Também é indispensável que estes dados estejam
sempre disponíveis, a qualquer hora e em qual...
42
garantir um melhor nível de serviço prestado. Sosinsky (2011, p. 426, tradução
nossa) reforça que:
A computação em nuve...
43
2.2.2.1 Confidencialidade das informações
Segundo a norma NBR ISO/IEC 27001 (2006, pag. 2), a definição para
confidenci...
44
estejam disponíveis a qualquer momento e que tenham desempenho suficiente para
atender as demandas das aplicações. O fo...
45
uma outra fonte é a legislação vigente, os estatutos, a regulamentação e as
cláusulas contratuais que a organização, se...
46
2.2.2.6 Dependência do fornecedor
Certas aplicações são desenvolvidas na nuvem atendendo os requisitos de
determinado f...
47
migração dos serviços para a nuvem. De acordo com o guia, uma empresa que for
realizar a migração de um ativo para a nu...
48
Figura 6 - Responsabilidades entre modelos computacionais da nuvem
Fonte: CSA GUIA PT-BR (2011b).
49
2.3 VIRTUALIZAÇÃO
Apesar de não ser um requisito obrigatório, a virtualização é um dos motores
que impulsionaram a comp...
50
A tecnologia de virtualização evoluiu muito a partir do ano de 1999. Nos dias
atuais é possível encontrar soluções de d...
51
É evidente que as desvantagens citadas são pequenas, se comparadas com
as vantagens da tecnologia. Estas desvantagens p...
52
Intel19
e AMD20
possuem suporte aos recursos VT-x e AMD-V respectivamente, que
garantem a possibilidade de execução da ...
53
Figura 7 - Tipos de arquitetura de virtualização.
Fonte: Elaborado pelo autor.
2.3.4 Soluções de Virtualização
Existem,...
54
2.3.4.1 Kernel-based Virtual Machine
O KVM (Kernel-based Virtual Machine), mantido pela RedHat21
, é uma
solução de cód...
55
empregada, também, como base para soluções proprietárias de virtualização como o
XenServer22
da Citrix Systems e como s...
56
português brasileiro significa “armazenamento”, é um termo técnico utilizado e
generalizado como um dispositivo central...
57
o acesso aos dados, ao mesmo tempo em que necessitam da escalabilidade para o
crescimento futuro. Em uma mesma rede SAN...
58
3 SOLUÇÃO PARA GERÊNCIA DA INFRAESTRUTURA DA NUVEM
Neste capítulo, serão abordadas as diversas soluções para orquestrar...
59
o gerenciamento de uma infraestrutura para a nuvem. O quadro abaixo apresenta
seis principais soluções escolhidas.
Quad...
60
estrutura EC2 da Amazon, possibilitando a criação de instâncias, grupos de
segurança, controles de acesso, entre outros...
61
infraestrutura de uma nuvem híbrida e privada, apesar de também ser suportado
para o gerenciamento de uma nuvem pública...
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO
Upcoming SlideShare
Loading in...5
×

UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO

3,410

Published on

Projeto de pesquisa para conclusão de curso baseado no Openstack e da análise de outras soluções de nuvem IaaS.

Published in: Technology
0 Comments
2 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
3,410
On Slideshare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
113
Comments
0
Likes
2
Embeds 0
No embeds

No notes for slide

Transcript of "UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA DE NUVEM HÍBRIDA UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO"

  1. 1. UNIVERSIDADE DO VALE DO RIO DOS SINOS - UNISINOS UNIDADE ACADÊMICA DE GRADUAÇÃO CURSO DE SEGURANÇA DA INFORMAÇÃO MARCELO DIEDER UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA PARA A INFRAESTRUTURA DE COMPUTAÇÃO NAS NUVENS UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO São Leopoldo 2012
  2. 2. MARCELO DIEDER UM ESTUDO PARA A IMPLANTAÇÃO DE UM MODELO DE GERÊNCIA PARA A INFRAESTRUTURA DE COMPUTAÇÃO NAS NUVENS UTILIZANDO SOLUÇÕES DE CÓDIGO ABERTO Trabalho de Conclusão de Curso apresentado como requisito parcial para a obtenção do título de Tecnólogo em Segurança da Informação na Universidade do Vale do Rio dos Sinos - UNISINOS Orientador: Prof. Ms. Jeferson Prevedello São Leopoldo 2012
  3. 3. Dedico totalmente este trabalho para a minha família, que me deu forças para conseguir superar minhas dificuldades e serenidade para continuar a trilhar pelos caminhos obscuros. Aos meus pais e à minha irmã, que desde meus primeiros momentos de vida me transmitiram ensinamentos e caráter de vida, tão importante nesta atual fase da minha vida. Agradeço muito à minha esposa e à minha filha, pelo apoio incondicional que me proporcionaram nos momentos difíceis e que, com simples sorrisos, conseguiam me motivar ainda mais em busca de melhores resultados.
  4. 4. AGRADECIMENTOS Primeiramente a Deus, por mostrar-me os melhores caminhos a seguir e à minha família que sempre me acolheu e me aconselhou durante a fase de estudos. Ao meu orientador Jeferson Prevedello, que soube me criticar construtivamente em minhas dúvidas e anseios. . Aos meus colegas de curso, que me possibilitaram a troca de conhecimentos durante todos estes anos de estudo. Ao pessoal das comunidades openstack e openstack-br, que estavam prontamente disponíveis para tirar dúvidas e trocar ideias. Por fim, gostaria de agradecer a todos aqueles que me ajudaram diretamente ou indiretamente no desenvolvimento deste trabalho.
  5. 5. "Nossas dúvidas são traidoras e nos fazem perder o que, com frequência, poderíamos ganhar, por simples medo de arriscar." (William Shakespeare)
  6. 6. RESUMO O conceito de Computação nas Nuvens é um grande salto tecnológico após o surgimento da Internet. Na necessidade de buscar soluções que possam reduzir custos e agregar mais segurança e desempenho para as aplicações, surge o modelo de entrega de serviços computacionais sob demanda. Por meio de uma pesquisa bibliográfica, este trabalho buscou entender os principais conceitos da computação nas nuvens, seus principais problemas e os limites impostos pela nova tecnologia. A pesquisa também abordou os sistemas de IaaS Eucalyptus e OpenStack, apresentando suas principais características e descrevendo o modelo de arquitetura de cada plataforma. Além disso, utilizando uma abordagem experimental, o sistema OpenStack foi implantando com o intuito de entender melhor o seu funcionamento e obter respostas quanto a seu nível de maturidade atual. A partir da implantação do sistema OpenStack, foi possível entender na prática seu funcionamento, revelando ser uma plataforma robusta e estável, e que pode ser utilizado para orquestrar uma infraestrutura heterogênea que possua um conjunto de diferentes sistemas e equipamentos. Este trabalho também poderá ser utilizado como base para futuros projetos de pesquisa, que buscam o desenvolvimento de uma solução para a computação nas nuvens ou mesmo para corporações que desejam executar seu próprio modelo de nuvem pública ou privada. Palavras-chave: computação nas nuvens, Openstack, serviços sob demanda.
  7. 7. ABSTRACT The concept of Computing in the Clouds is a great technological leap after the advent of the Internet. The need to seek solutions that can reduce costs and add more security and performance for applications, the model appears to deliver on- demand computing services. Through a bibliographical survey, this study sought to understand the key concepts of cloud computing, its main problems and the limits imposed by the new technology. The research also addressed the IaaS systems Eucalyptus and OpenStack, presenting their main characteristics and describe the architectural model of every platform. Furthermore, using an experimental approach, the OpenStack system was implemented in order to better understand their operation and get answers about their current maturity level. Upon deployment of the OpenStack, in practice it was possible to understand its operation, proving to be a robust and stable plataform and can be used to orchestrate a heterogeneous infrastructure that has a large set of different systems and equipment. This work may also be used as a basis for future research projects aimed at developing a solution to the cloud, or even for corporations that want to run their own model of public or private cloud. Keywords: cloud computing, openstack, on-demand services.
  8. 8. LISTA DE FIGURAS Figura 1 - Arquitetura do modelo de computação nas nuvens........................27 Figura 2 - Camadas da Computação nas Nuvens..........................................31 Figura 3 – Visão Global da Computação nas Nuvens. ...................................33 Figura 4 - Limites entre IaaS, PaaS, SaaS .....................................................37 Figura 5 - Pesquisa sobre Computação nas Nuvens......................................41 Figura 6 - Responsabilidades entre modelos computacionais da nuvem .......48 Figura 7 - Tipos de arquitetura de virtualização..............................................53 Figura 8 - Arquitetura principal do Eucalyptus. ...............................................64 Figura 9 - Arquitetura conceitual do Openstack..............................................67 Figura 10- Arquitetura de serviços do Openstack Compute (Nova)................69 Figura 11 - Arquitetura de rede do nova-network. ..........................................73 Figura 12 - Arquitetura do nova-volume..........................................................74 Figura 13 - Fluxograma do processo de decisão do nova-scheduler. ............76 Figura 14 - Exemplo de arquitetura do OpenStack Swift. ...............................78 Figura 15 - Exemplo de anel utilizado no OpenStack Swift. ...........................80 Figura 16 - Arquitetura lógica do OpenStack Glance......................................81 Figura 17 - Processo para criação de um serviço validado pelo Keystone.....86 Figura 18 - Tela de gerenciamento de instâncias do Horizon.........................88 Figura 19 - Estrutura externa do ambiente proposto. .....................................92 Figura 20 - Estrutura externa do ambiente proposto. .....................................93 Figura 21 - Gráfico do resultado da análise dos dados de rede. ....................96 Figura 22 - Gráfico de desempenho das operações de leitura e escrita.........98
  9. 9. LISTA DE QUADROS Quadro 1 - Comparativo de opções de infraestrutura em TI...........................28 Quadro 2 - Soluções para gerenciamento de ambientes IaaS. ......................59 Quadro 3 - Filtros para utilização no nova-scheduler. ....................................75 Quadro 4 - Estados de uma imagem no Glance.............................................82 Quadro 5 - Tipos de imagens suportados pelo Glance...................................83 Quadro 6 - Tipos de containers suportados pelo Glance................................84 Quadro 7 - Comparativo de características entre OpenStack e Eucalyptus. ..89 Quadro 8 - Requisitos dos servidores para a estrutura...................................91 Quadro 9 - Gráfico de desempenho das operações de leitura e escrita.........99
  10. 10. LISTA DE TABELAS Tabela 1 - Versões de lançamento do Openstack ..........................................66 Tabela 2 - Tipos de instâncias pré-definidas pelo EC2...................................77 Tabela 3 - Lista de serviços ativos e inativos do Nova. ..................................95 Tabela 4 - Tabela do resultado da análise dos dados de rede. ......................96 Tabela 5 - Valores de desempenho das operações de leitura e escrita. ........97
  11. 11. LISTA DE ABREVIATURAS E SIGLAS AMQP Advanced Message Queuing Protocol API Application Programming Interface ARP Address Resolution Protocol AWS Amazon Web Services CIFS Common Internet Filesystem CLC Cloud Controler SC Storage Controller CC Cluster Controller CMAAS Compliance as a Service CPU Central Processing Unit CSA Cloud Security Alliance DAS Direct Attached Storage DHCP Dynamic Host Configuration Protocol EBS Elastic Block Store EC2 Amazon Elastic Compute Cloud FC Fibre Channel GPL General Public License HP Hewlett-Packard ICMP Internet Control Message Protocol HTTP HyperText Transfer Protocol Secure I/O Input/Output IAAS Infrastructure as a Service IBM International Business Machines IDAAS Identity as a Service IDC International Data Corporation IP Internet Protocol ISCSI Internet Small Computer System Interface JSON Javascript Object Notation KVM Kernel-based Virtual Machine LAN Local Area Network LDAP Lightweight Directory Access Protocol LUN Logical Unit Number
  12. 12. 12 LVM Logical Volume Manager LXC Linux Containers MTBF Mean Time Betwenn Failures NAS Network Attached Storage NASA National Aeronautics and Space Administration NBR Normas Brasileiras de Regulação NC Node Controller NFS Network File System PAAS Platform as a Service PATA Parallel Technology Attachment PCI Payment Card Industry PCI DDS PCI Data Security Standard RAID Redundant Array of Independent Disks REST Representational State Transfer S3 Amazon Simple Storage Service SAAS Software as a Service SAN Storage Area Network SAS Serial Attached SCSI SAS 70 Statement on Auditing Standards No. 70 SATA Serial Advanced Technology Attachment SC Storage Controller SCSI Small Computer System Interface SPI SaaS PaaS IaaS SSH Secure Shell STAAS Storage as a Service TCP Transmission Control Protocol TCP/IP Transmission Control Protocol / Internet Protocol TI Tecnologia da Informação UML User Mode Linux VLAN Virtual Lan VM Virtual Machine VMM Virtual Machine Monitor VNC Virtual Network Computing
  13. 13. 13 VPN Virtual Private Network XFS High-Performance Journaling File System XML Extensible Markup Language
  14. 14. SUMÁRIO 1 INTRODUÇÃO .......................................................................................................18 1.1 DEFINIÇÃO DO PROBLEMA..............................................................................18 1.2 OBJETIVOS ........................................................................................................21 1.2.1 Objetivo Geral.................................................................................................21 1.2.2 Objetivos Específicos ....................................................................................21 1.3 JUSTIFICATIVA ..................................................................................................22 1.4 DELIMITAÇÃO DO TEMA...................................................................................23 2 FUNDAMENTAÇÃO TEÓRICA.............................................................................25 2.1 COMPUTAÇÃO NAS NUVENS ..........................................................................26 2.1.1 Características do Modelo Computacional em Nuvem...............................27 2.1.2 A Importância da Virtualização e o Armazenamento Centralizado............31 2.1.3 O Modelo Computacional da Computação nas Nuvens .............................32 2.1.4 Principais Conceitos......................................................................................33 2.1.5 Arquiteturas....................................................................................................35 2.1.5.1 Público...........................................................................................................35 2.1.5.2 Privado ..........................................................................................................35 2.1.5.3 Comunitário...................................................................................................36 2.1.5.4 Híbrido...........................................................................................................36 2.1.6 Tipos de Serviço.............................................................................................36 2.1.6.1 Infraestrutura como um Serviço ....................................................................38 2.1.6.2 Plataforma como um Serviço ........................................................................39 2.1.6.3 Software como um Serviço............................................................................39 2.2 A SEGURANÇA E OS LIMITES DA COMPUTAÇÃO NAS NUVENS .................40 2.2.1 Principais Preocupações...............................................................................41 2.2.2 Limites da nuvem ...........................................................................................42 2.2.2.1 Confidencialidade das informações...............................................................43 2.2.2.2 Disponibilidade de serviços ...........................................................................43 2.2.2.3 Tipos de aplicações.......................................................................................44 2.2.2.4 Conformidade com a legislação vigente........................................................44 2.2.2.5 Multi-Inquilino ................................................................................................45 2.2.2.6 Dependência do fornecedor ..........................................................................46 2.2.3 Cloud Security Alliance .................................................................................46
  15. 15. 15 2.3 VIRTUALIZAÇÃO................................................................................................49 2.3.1 Vantagens .......................................................................................................50 2.3.2 Desvantagens .................................................................................................50 2.3.3 Virtual Machine Monitor.................................................................................51 2.3.4 Soluções de Virtualização .............................................................................53 2.3.4.1 Kernel-based Virtual Machine .......................................................................54 2.3.4.2 Qemu.............................................................................................................54 2.3.4.3 Xen................................................................................................................54 2.3.4.4 Vmware ESX.................................................................................................55 2.3.4.5 Virtualbox ......................................................................................................55 2.4 O ARMAZENAMENTO DE DADOS ....................................................................55 2.4.1 Direct Attached Storage.................................................................................56 2.4.2 Network Attached Storage.............................................................................56 2.4.3 Storage Area Network....................................................................................56 3 SOLUÇÃO PARA GERÊNCIA DA INFRAESTRUTURA DA NUVEM ..................58 3.1 ORQUESTAR O AMBIENTE DA NUVEM...........................................................58 3.2 SOLUÇÕES DE IAAS EXISTENTES ..................................................................58 3.2.1 Amazon Web Services ...................................................................................59 3.2.2 Nimbus ............................................................................................................60 3.2.3 OpenNebula ....................................................................................................60 3.2.4 Eucalyptus ......................................................................................................61 3.2.5 OpenStack.......................................................................................................61 3.2.6 Análise Parcial das Soluções........................................................................62 3.3 EUCALYPTUS ....................................................................................................63 3.3.1 Principais Componentes ...............................................................................63 3.3.1.1 Cloud Controller (CLC)..................................................................................64 3.3.1.2 Walrus ...........................................................................................................64 3.3.1.3 Cluster Controller (CC)..................................................................................64 3.3.1.4 Storage Controller (SC).................................................................................65 3.3.1.5 Node Controller (NC).....................................................................................65 3.3.1.6 VMware Broker..............................................................................................65 3.3.1.7 Euca2ools......................................................................................................65 3.4 OPENSTACK ......................................................................................................66
  16. 16. 16 3.4.1 Visão Global....................................................................................................67 3.4.2 Openstack Compute (Nova) ..........................................................................68 3.4.2.1 API Server (nova-api)....................................................................................70 3.4.2.2 Message Queue (Rabbit MQ Server) ............................................................71 3.4.2.3 Compute Worker (nova-compute) .................................................................71 3.4.2.4 Network Controller (nova-network)................................................................71 3.4.2.5 Volume Workers (nova-volume)....................................................................73 3.4.2.6 Nova Objectstore (nova-objectstore).............................................................74 3.4.2.7 Scheduler (nova-scheduler) ..........................................................................74 3.4.2.8 Tipos de Instâncias (Flavors) ........................................................................76 3.4.3 Openstack Storage Infrastructure (Swift).....................................................77 3.4.3.1 Swift Proxy Server.........................................................................................78 3.4.3.2 Swift Object Server........................................................................................78 3.4.3.3 Swift Container Server...................................................................................79 3.4.3.4 Swift Account Server .....................................................................................79 3.4.3.5 The Ring........................................................................................................79 3.4.4 Openstack Imaging Service (Glance) ...........................................................81 3.4.4.1 Glance-api.....................................................................................................82 3.4.4.2 Glance-registry ..............................................................................................83 3.4.4.2 Formato de Discos e Containers ...................................................................83 3.4.5 OpenStack Identity Service (Keystone)........................................................84 3.4.5.1 Base de Dados..............................................................................................86 3.4.6 Openstack Administrative Web-Interface (Horizon)....................................86 3.5 ANÁLISE DO EUCALYPTUS E OPENSTACK....................................................88 4 PROJETO PRÁTICO E RESULTADOS OBTIDOS...............................................90 4.1 AMBIENTE DA PROPOSTA DE TRABALHO.....................................................90 4.1.1 Requisitos da infraestrutura..........................................................................91 4.1.2 Arquitetura do ambiente................................................................................91 4.1.3 Processo de Instalação..................................................................................93 4.2 COLETA DE DADOS DO AMBIENTE.................................................................94 4.2.1 Testes de Latência de Rede X Testes de Troca de Tráfego........................94 4.2.2 Testes de Leitura e Gravação de Dados.......................................................94 4.2.3 Simulação de falhas nos serviços do Nova .................................................95
  17. 17. 17 4.3 ANÁLISE DOS DADOS OBTIDOS......................................................................95 4.3.1 Da latência e desempenho da rede...............................................................95 4.3.2 Da latência e velocidade das operações de disco ......................................96 4.3.3 Da análise da disponibilidade dos componentes........................................98 5 CONCLUSÃO ......................................................................................................100 REFERÊNCIAS.......................................................................................................103 APÊNDICE A ..........................................................................................................111
  18. 18. 18 1 INTRODUÇÃO Computação nas Nuvens é um dos principais assuntos no atual momento da Tecnologia da Informação. A Computação nas Nuvens traz consigo conceitos de entrega de tecnologia como um serviço computacional, da mesma forma que serviços como água e a eletricidade, entregando-os sob demanda. Computação nas Nuvens não é uma nova tecnologia ou um novo sistema computacional, é uma nova maneira de utilização de recursos computacionais de forma distribuída e descentralizada, utilizando como meio de transporte, principalmente, a Internet. Pode-se utilizar a nuvem para o armazenamento e processamento de informações, de forma escalável e sob a demanda necessária, ou seja, conforme aumenta a necessidade de processamento e cresce o volume de informações, pode-se dinamicamente alocar mais recursos computacionais, conforme necessário. Observa-se, desta maneira, que ao invés de investir-se em uma infraestrutura computacional completa, repleta de ativos computacionais, pode-se focar em investimento de serviços. Neste caso, o custo é apenas dos recursos utilizados, além de reduzir as despesas com infraestrutura. Nem sempre a utilização de serviços sob demanda pode ser vantajoso, isso pode depender do tipo de aplicação e da demanda necessária para atender a determinados requisitos. Também é importante salientar que na nuvem não se sabe onde está a informação, ou onde ela será processada, mas é essencial que a informação esteja íntegra e sempre disponível. Este trabalho está dividido em cinco capítulos. No primeiro capítulo será realizada a introdução do tema a ser abordado. No capítulo dois, é apresentada uma fundamentação teórica dos assuntos relacionados. No capítulo três, são descritas as soluções de gerenciamento da nuvem. No capítulo quatro, será descrito a implantação do projeto. E por fim, no capítulo cinco, será realizada a conclusão do tema. 1.1 DEFINIÇÃO DO PROBLEMA Com o avanço do conceito de tecnologia em nuvem, diversas soluções surgiram para orquestrar diferentes tipos de plataformas e serviços, mas sem que
  19. 19. 19 houvesse uma definição exata de um modelo estruturado que garantisse a padronização desta nova arquitetura. De acordo com pesquisa realizada em 2011 com 500 organizações, encomendada pela Symantec Corporation sobre a situação da Cloud Computing na América Latina, SYMANTEC (2011), foi possível apontar quatro principais preocupações que as organizações possuem quanto à utilização da Cloud, conforme é possível observar a seguir:  segurança das Informações;  falta de experiência de equipes de TI;  diferentes tipos de soluções e ausência de testes efetivos na nuvem;  retorno sobre investimento abaixo do esperado. É possível observar que a pesquisa apresenta dados concretos sobre algumas das dificuldades das corporações utilizarem a nova tecnologia, principalmente pelas dúvidas quanto à segurança dos dados e pela falta de experiência de equipes, juntamente com os diferentes tipos de tecnologias para enviar os dados para a nuvem. O caminho para a utilização de Cloud Computing passa pelos conceitos de virtualização e de armazenamento de informação centralizado, que são essenciais para o desenvolvimento da plataforma descentralizada. Atualmente, existem diversas soluções que podem realizar a virtualização de máquinas, assim como também existem diversos tipos de sistemas de armazenamento disponíveis. As grandes dificuldades estão em garantir a integração entre os diferentes tipos de sistemas, em efetuar o gerenciamento do ambiente heterogêneo e, também, de possibilitar a migração dos dados entre eles de forma rápida e funcional. Além disso, a preocupação com a segurança dos dados na nuvem é outro fator impeditivo para várias corporações, ao analisarem o risco na utilização de suas informações na nuvem. Em um ambiente de nuvem que fornece infraestrutura, como máquinas virtuais e espaço de alocação de dados, toda essa gerência é executada pelo chamado Cloud Controler, o controlador de recursos da nuvem1 . Atualmente existem inúmeras plataformas controladoras, sejam elas do modelo de código aberto ou
  20. 20. 20 mesma de código fechado. O grande esforço destas plataformas é garantir a interoperabilidade com os diferentes tipos de hypervisors2 , storages3 , redes de comunicação e as API (Application Programming Interface)4 de integração, de modo que as corporações possam percorrer pelos diferentes tipos de tecnologias de forma rápida e facilitada. No cenário atual, podemos citar com destaque as operações realizadas pelos fornecedores Amazon5 e Rackspace6 , duas das principais empresas mundiais que providenciam serviço de infraestrutura na nuvem. Das soluções existentes, que possibilitam que empresas públicas e privadas tenham sua própria nuvem, pode-se citar inúmeras aplicações, sejam elas de código fechado ou aberto. A Citrix Systems oferece uma solução proprietária de gerenciamento de infraestrutura chamado CloudStack, que apresenta integração com múltiplos tipos de sistemas. A Vmware Inc, possui uma solução proprietária conhecida como vCloud, porém gerencia apenas suas próprias aplicações de virtualização. Entre as soluções de código aberto, também é possível apresentar várias aplicações, dentre as quais são possíveis citar o OpenNebula, Nimbus, OpenStack e o Eucalyptus (disponibiliza versão aberta e proprietária). Entretanto, apesar da grande oferta de aplicações existentes, vários padrões foram desenvolvidos, dificultando a comunicação harmoniosa entre os diferentes tipos de sistemas. As soluções de plataforma fechada tendem a ditar “as regras do jogo”, buscando sempre os interesses do próprio negócio. Do contrário, as soluções de código aberto buscam atender aos interesses de todos os envolvidos no projeto, aumentando, consequentemente, a interoperabilidade entre diferentes sistemas, e atribuindo o controle do projeto para todos os seus participantes. A nuvem é um ambiente complexo e heterogêneo, e necessita de colaboração mútua entre todos os personagens deste sistema. Diante deste cenário, é possível delinear a definição do problema: É possível que uma plataforma de software aberto, no esforço de seus colaboradores mundiais, consiga apresentar uma solução segura e eficaz, que possa controlar e gerenciar a infraestrutura de diferentes soluções de virtualização e de armazenamento de forma 1 Conhecido também como IaaS ( Infrastructure as a Service) – Tipo de serviço oferecido na nuvem. 2 Hypervisor – Camada de software que realiza a virtualização de máquinas virtuais. 3 Storage – Equipamento de armazenamento de dados centralizado. 4 API – Interface para comunicação entre vários tipos de sistemas. 5 Amazon – Empresa multinacional de comercio eletrônico com base nos EUA.
  21. 21. 21 a oferecer serviços de IaaS, além de agregar maior segurança para a computação nas nuvens? 1.2 OBJETIVOS Serão descritos a seguir, os objetivos geral e específicos deste trabalho, de modo a esclarecer o escopo do trabalho. 1.2.1 Objetivo Geral Este trabalho terá como objetivo geral a descrição das terminologias que envolvem a Computação nas Nuvens, a apresentação dos resultados qualitativos obtidos a partir do comparativo com entre o OpenStack e o Eucalyptus, e da implantação de um ambiente da nuvem utilizando o projeto de código aberto Openstack. 1.2.2 Objetivos Específicos - Apresentar e descrever os modelos e a arquitetura que envolve a computação nas nuvens, evidenciando os principais benefícios de sua utilização e seus principais riscos. - Identificar os componentes que formam o projeto Openstack, apresentando detalhadamente quais são suas responsabilidades e atribuições, e quais os níveis de maturidade destes componentes. - Apresentar os resultados obtidos da implantação de uma infraestrutura de nuvem, utilizando o projeto Openstack, salientando, também, questões de desempenho, de confiabilidade, integridade e disponibilidade. - Através de pesquisas, apresentar a descrição dos componentes da aplicação Eucalyptus e uma tabela comparativa com as principais funcionalidades, capacidades e limites dos projetos Openstack e Eucalyptus. 6 Rackspace – Empresa multinacional provedora de serviços de TI, com base nos EUA.
  22. 22. 22 1.3 JUSTIFICATIVA O poder de cálculo dos atuais processadores, associado a grande evolução das mídias de armazenamento de informações, despontou a tecnologia de virtualização, possibilitando o aproveitando de recursos ociosos, reduzindo custos de infraestrutura, além de aumentar a disponibilidade dos sistemas e garantir aumentos de produtividade. A partir da propulsão da virtualização, com seus múltiplos hypervisors e de diferentes fabricantes, emerge a necessidade de um gerenciador central que tivesse o papel de integrar diferentes soluções; surgindo, assim, a computação nas nuvens. De acordo com Velte Ant; Velte Tob et al (2011,p.3), a computação em nuvem (Cloud Computing) está em toda parte. Abra qualquer revista de tecnologia ou visite qualquer site ou blog e certamente você verá alguma matéria sobre cloud computing. O único problema é que nem todos concordam com o que isso significa. Pergunte a dez profissionais diferentes o que é cloud computing e você obterá dez respostas distintas. Segundo a definição sobre nuvem de SCHUBERT et al (2010,p.8, tradução nossa), “a nuvem é uma execução elástica de recursos envolvendo múltiplos interessados e que provêm um serviço medido através de múltiplas granularidades para um nível de serviço adequado.” Existem diversos trabalhos publicados com o propósito de explicar a conceituação da computação nas nuvens, exaltando as principais características e evidenciando os problemas existentes da utilização de uma estrutura na nuvem. A proposta de Miranda et al. (2011), consiste em realizar o compartilhamento e estudo de grandes volumes de dados biológicos, utilizando processamento paralelo de uma Cloud, porém, não foca na descrição de uma solução para o gerenciamento do ambiente. Já o artigo de Nurmi et al. (2009) realiza a descrição da solução open- source Eucalyptus, apresentando a conceituação da Cloud e demonstrando a arquitetura interna do sistema, mas não traça um comparativo com demais soluções. Sotomayor et al. (2009), procura realizar um comparativo entre as principais soluções de administração do ambiente de Cloud Computing, destacando soluções como Amazon EC2, Nimbus, Eucalyptus, OpenNebula, entre outros, mas seu estudo não aprofunda em questões internas de cada aplicação. O trabalho de Delgado (2010) descreve detalhadamente a conceituação da nuvem, apresenta o Eucalyptus,
  23. 23. 23 e demonstra testes de desempenho realizados no ambiente controlado por ele, entretanto seus testes são focados, em sua maioria, nos sistemas de virtualização e não na plataforma da nuvem. O critério para a escolha pela implantação da solução Openstack ocorreu, pois não foram localizados trabalhos acadêmicos com comparativos entre o OpenStack e outras ferramentas de gerência da infraestrutura da nuvem. Além disso, a comparação com o Eucalyptus ocorrerá por ele ser uma plataforma estável e totalmente compatível com os serviços de nuvem oferecidos pela Amazon (Eucalyptus Systems, 2012a). Academicamente, o termo Cloud Computing é tema de diversos trabalhos, no entanto, também existem carências de trabalhos com foco no desenvolvimento e apresentação de soluções que possam gerenciar um ambiente complexo e heterogêneo como a nuvem. Enquanto a virtualização assume sua importância nos pilares da nuvem, existe, também, a necessidade de uma solução neutra, sem vínculos comerciais, capaz de gerenciar ambientes heterogêneos na nuvem e ser utilizada por pequenas, médias e grandes corporações. Dentro desta realidade, este trabalho justifica-se pela necessidade de um estudo que possa expor de uma forma clara, as definições sobre cloud computing e que relate como o projeto Openstack pode ajudar a viabilizar infraestrutura de nuvens públicas e privadas. 1.4 DELIMITAÇÃO DO TEMA Este estudo irá focar nas terminologias envolvendo a computação em nuvem, apresentando e descrevendo seus principais conceitos. Também apresentará o projeto Openstack, circunstanciando seus componentes e sua arquitetura de comunicação e também apresentará um análise comparativa entre as soluções OpenStack e Eucalyptus. A partir de um piloto prático, este trabalho irá realizar a instalação dos componentes Nova e Glance do OpenStack, irá apresentar a arquitetura do ambiente implantado e descreverá os testes realizados nos componentes. Ao final, a partir da coleta de dados, disponibilizará resultados qualitativos e quantitativos da solução implantada. Este trabalho não irá focar na integração com equipamentos de armazenamento centralizados, na implantação prática da aplicação Eucalyptus e
  24. 24. 24 durante a implantação do projeto dará ênfase apenas ao emulador QEMU, não utilizando demais sistemas de virtualização.
  25. 25. 25 2 FUNDAMENTAÇÃO TEÓRICA Este capítulo descreverá a conceituação de Computação nas Nuvens, apresentando suas principais características, modelos de arquiteturas, suas limitações, informando, também, suas principais vantagens e desvantagens, salientando no decorrer do texto, como ocorreu a evolução natural deste modelo computacional. O capítulo também apresentará a definição de virtualização e armazenamento de dados centralizados, e como eles estão ligados diretamente com a computação nas nuvens. Para a elaboração deste trabalho realizou-se o levantamento bibliográfico por meio de livros e artigos científicos que abordam sobre o tema apresentado no trabalho, além de sites de soluções utilizadas para a computação nas nuvens e que são reconhecidas na sua área de atuação. A elaboração dessa etapa foi fundamental para oferecer sustentação à pesquisa experimental realizada para a conclusão deste estudo. Ander-Egg (1978, apud Lakatos; Marconi, 2002, p. 15), afirma que a pesquisa é caracterizada por “um procedimento reflexivo sistemático, controlado e crítico, que permite descobrir novos fatos ou dados, relações ou leis, em qualquer campo do conhecimento”. Lakatos e Marconi (2002) ainda acrescentam que a pesquisa é considerada um caminho em busca do descobrimento da realidade e de verdades parciais, e, devido a isto, torna-se necessário um tratamento científico. A metodologia escolhida para a elaboração deste trabalho monográfico foi de pesquisa bibliográfica e experimental. A pesquisa bibliográfica, de acordo com Manzo (1971, apud Lakatos; Marconi, 2002, p. 71), “oferece meios para definir, resolver, não somente problemas conhecidos, como também explorar novas áreas onde os problemas não se cristalizam suficientemente” Trujillo (1974, apud Lakatos; Marconi, 2002, p. 71) complementa esta afirmação quando diz que a pesquisa bibliográfica “não é mera repetição do que já foi dito ou escrito sobre certo assunto, mas propicia o exame de um tema sob novo enfoque ou abordagem, chegando a conclusões inovadoras”.
  26. 26. 26 2.1 COMPUTAÇÃO NAS NUVENS Computação nas Nuvens, ou Cloud Computing é um novo modelo computacional que busca principalmente a redução de custos e o aumento de produtividade. A definição de Velte Ant; Velte Tob et al (2011,p.3) sobre cloud é que “a função da computação em nuvem (cloud computing) é cortar custos operacionais e o mais importante, permitir que departamentos de TI se concentrem em projetos estratégicos em vez de manter o data center funcionando”. O futuro da Cloud Computing pode ser comparado com a história da energia elétrica. Segundo Miller (2008, p.8, tradução nossa), O surgimento da computação em nuvem é o equivalente à revolução da energia elétrica do século passado. Antes do episódio de utilitários elétricos, cada fazenda e empresa de negócios produzia sua própria eletricidade a partir de geradores autônomos. Após a criação da rede elétrica, fazendas e empresas desativaram seus geradores e a energia elétrica foi comprada dos serviços públicos a um preço muito menor (e com confiabilidade muito maior) do que poderiam produzir por conta própria. Olhe para o mesmo tipo de revolução que ocorre com a computação em nuvem. De acordo com a definição do Nist7 (2011, p.2, tradução nossa), Computação nas Nuvens é, um modelo para permitir a onipresença, conveniente, o acesso à rede sob demanda para um pool compartilhado de recursos computacionais configuráveis (por exemplo, redes, servidores, armazenamento, aplicativos e serviços) que podem ser rapidamente fornecidos e liberados com o esforço de gerenciamento mínimo ou interação com o provedor de serviço. A arquitetura computacional do modelo da Cloud Computing evoluiu ao longo dos anos, a partir de outros modelos computacionais existentes, como o modelo cliente-servidor, o modelo peer-to-peer 8 , o modelo computacional distribuído, e o modelo grid de trabalho em grupo. Miller (2008) A nuvem utiliza-se de características de todos os modelos citados anteriormente, mas assemelha-se principalmente ao modelo computacional de Sistemas Distribuídos, onde várias máquinas trabalham em conjunto. Segundo Tanenbaum (1995, p.2, tradução nossa), “um sistema distribuído é uma coleção de 7 NIST - U.S. National Institute of Standards and Technology 8 Peer-to-Peer – Tipo de arquitetura de um sistema distribuído.
  27. 27. 27 computadores independentes, que aparecem para um usuário de um sistema como um único computador”. A figura 1, abaixo apresentada, ilustra o modelo computacional da Cloud Computing. Figura 1 - Arquitetura do modelo de computação nas nuvens Fonte: Editado pelo autor com base em Miller (2008, p. 16) Conforme Miller (2008, p. 16, tradução nossa), usuários individuais conectam na nuvem a partir de seus próprios computadores pessoais ou aparelhos portáteis, através da Internet. Para estes usuários individuais, a nuvem é vista como uma única aplicação, documento ou dispositivo. O hardware na nuvem (e do sistema operacional que gerencia as conexões de hardware) é invisível. 2.1.1 Características do Modelo Computacional em Nuvem A utilização do módulo computacional em nuvem, é conduzido pelas corporações em sua grande maioria, quando o objetivo principal é a redução de custos com infraestrutura. Entretanto, a cloud possibilita que corporações, ou até mesmo usuários finais, possam se beneficiar de outras características positivas que este modelo proporciona. Miller (2008, p. 24, tradução nossa) cita diversas vantagens da Cloud Computing:
  28. 28. 28  baixo custo com a aquisição de computadores para usuários;  aumento de desempenho;  baixo custo com infraestrutura de Tecnologia da Informação;  menor custo para manutenções de hardware e software;  menor custo aquisição de software;  atualização instantânea de sistemas;  aumento de poder de processamento;  capacidade de armazenamento ilimitada;  aumento de segurança no armazenamento de informações;  Aumento de compatibilidade entre sistemas distintos. As características citadas são vantagens que usuários finais ou corporações podem usufruir, não só reduzindo o custo, como também agregando maior qualidade aos serviços utilizados da TI. De acordo com o quadro de Reese (2009) apresentado a seguir, é possível observar o comparativo qualitativo entre uma solução em nuvem e duas opções comumente utilizadas pelas corporações para manter sua infraestrutura de TI. A primeira e mais clássica, é a utilização de uma infraestrutura interna onde a própria corporação é responsável por manter o capital físico e o capital humano. A segunda opção é a utilização de um serviço terceirizado, onde previamente existe um acordo mútuo entre a empresa contratante e a empresa contratada, de forma que possam delimitar as atribuições de cada um. A empresa terceirizada é responsável por manter toda a infraestrutura física, inclusive os serviços por ela prestados. Por fim, é ilustrada a utilização de serviços na nuvem, onde claramente se pode observar uma mescla de vantagens entre a opção de “TI Interna” e “Serviços Terceirizados”. Quadro 1 - Comparativo de opções de infraestrutura em TI TI Interna Serviços Tercerizados Computação nas Nuvens Investimento de Capital Significante Moderado Insignificante Despesas Moderado Significante Baseado na utilização Tempo de Provisionamento Significante Moderado Nenhum Flexibilidade Limitado Moderado Flexível Requisitos de Experiência Equipe Significante Limitado Moderado Confiança Varia Alto Moderado para Alto Fonte: Editado pelo autor com base em Reese (2009, p. 12)
  29. 29. 29 Ao mesmo tempo em que a Computação nas Nuvens pode reduzir o investimento de capital inicial para novos projetos de TI, diminui-se o tempo de provisionamento para novas instalações e aumenta-se a flexibilidade da infraestrutura de TI. Na opção pela nuvem, também é possível observar a necessidade de manter-se uma equipe de TI com experiência para que seja possível a integração entre sistemas internos e os sistemas alocados fora da empresa. Quanto à confiança da utilização dos serviços na nuvem, o que pode se observar é um acréscimo de segurança da infraestrutura, afinal provedores de soluções em nuvem utilizam de uma forma geral equipamentos redundantes e equipes especializadas e dedicadas em regime de tempo de 24x7x365. Além disso, operam de acordo com normatizações de segurança tais como a Statement on Auditing Standards Nº. 70 (SAS 70) 9 , Payment Card Industry - Data Security Standard (PCI DSS) 10 e a ISO IEC 27001 11 . Segundo Reese (2009, p. 9, tradução nossa), a nuvem necessariamente precisa ter um Mean Time Between Failures (MTBF)12 maior que uma estrutura interna, um desafio fundamental para qualquer sistema que exige longa vida de nós em uma infraestrutura de nuvem, é o fato básico de que o tempo médio entre falhas (MTBF) de um servidor virtual é necessariamente menor do que para o hardware subjacente. Desta maneira, pressupõe-se que uma infraestrutura na Cloud, terá um MTBF sempre maior que uma estrutura interna, afinal ela possui uma estrutura grande o suficiente para reduzir o número de falhas em equipamentos por meio da utilização de equipamentos redundantes e trabalhando cooperativamente. Velte Ant; Velte Tob et al. (2011, p. 30), também observa que a cloud computing pode oferecer diversos benefícios. Ele cita a escalabilidade, prevendo um crescimento futuro; a simplicidade do ambiente, permitindo que novos ambientes de infraestrutura estejam disponíveis de imediato; o aumento na qualidade dos serviços, afinal os fornecedores são qualificados para a realização de suas tarefas, e o 9 SAS 70 - Certificação que visa o controle e utilização de melhores práticas para empresas de prestação de serviços. http://sas70.com/sas70_overview.html 10 PCI DSS – Padrão de segurança de dados do setor de cartões de pagamento. https://www.pcisecuritystandards.org 11 ISO/IEC 27001 - Norma padrão para um sistema de gestão da segurança da informação. http://www.iso27001security.com/html/27001.html
  30. 30. 30 aumento de segurança das soluções utilizadas, na medida em que os fornecedores possuem políticas de privacidade rigorosas que garantem, possivelmente, mais segurança do que na própria TI local. Apesar dos benefícios que ambientes da nuvem podem proporcionar, nem tudo é vantajoso. Além das vantagens, Miller (2008, p. 24, tradução nossa) também cita algumas desvantagens na sua utilização:  necessidade constante de conexão à internet;  desempenho ruim com conexões de internet lenta;  mesmo em conexões rápidas, algumas aplicações podem ser mais lentas, quando comparadas com uma execução em um computador local;  limitações de determinados tipos de aplicações;  insegurança quanto à confidencialidade de informações;  indisponibilidade dos dados na eventual falha de um provedor de serviços na nuvem. A nuvem pode não ser a solução ideal para determinado perfil de empresa ou usuário. Conforme o comparativo de Reese apresentando anteriormente, os custos com a Cloud podem ser, inclusive, maiores se comparado a uma infraestrutura interna. A partir destas definições, as desvantagens citadas por Miller, como a incerteza na confidencialidade dos dados, podem inibir a ascensão da Cloud. Entretanto, as desvantagens da utilização desta nova arquitetura não devem interromper o seu crescimento, de acordo com pesquisas realizadas. Segundo estudo realizado pelo IDC (2010)13 , a previsão de crescimento da nuvem será de 27% por ano, entre 2009 até 2014. As corporações que pretendem fornecer serviços na nuvem, precisarão se posicionar de uma forma agressiva até o ano de 2013, para que não fiquem de fora do mercado. 12 MTBF – Cálculo utilizado para verificar o período médio entre falhas de um determinado dispositivo. 13 International Data Corporation – Empresa que realiza pesquisas de mercado. http://www.idc.com
  31. 31. 31 2.1.2 A Importância da Virtualização e o Armazenamento Centralizado A nuvem surgiu a partir do desenvolvimento e amadurecimento de soluções como a virtualização e o armazenamento centralizado. A tecnologia de virtualização permite que um hardware físico possa ser utilizado para instalação de diversas máquinas virtuais. A tecnologia de armazenamento centralizado permite unificar todas as informações em redes de armazenamento, simplificando a administração e aumentando a flexibilidade para a alocação de dados. É possível analisar na figura a seguir, que a nuvem está apoiada sob ambientes de virtualização e de armazenamento centralizado, ainda que a utilização destas soluções não seja obrigatória. Figura 2 - Camadas da Computação nas Nuvens Fonte: Editado pelo autor com base em IBM (2011) A virtualização é um dos pilares da Computação nas Nuvens, afinal ela possibilita uma melhor utilização de recursos computacionais, por meio da criação de diversos ambientes virtuais em máquinas físicas. Com a técnica da virtualização, é possível executar diversos sistemas operacionais de diferentes fabricantes em um mesmo servidor físico. Isso garante o aproveitamento máximo da utilização de processamento, memória e armazenamento de servidores, diminui
  32. 32. 32 consideravelmente o tempo com o gerenciamento e instalação de novos sistemas, além de reduzir custos com a administração do ambiente tecnológico e da aquisição de equipamentos físicos. O armazenamento de dados é um item indispensável para a Cloud Computing. É neste pilar que se situam as maiores dúvidas quanto a segurança e disponibilidade de dados. Na nuvem, todos os dados estão armazenados em diferentes locais, garantindo, assim, que as informações possam ser acessadas a qualquer momento e de qualquer lugar. Os dados podem estar alocados em diferentes tipos de sistemas de armazenamento, sejam eles equipamentos dedicados como storages, servidores, ou redes de armazenamento conhecidos como SAN (Storage Area Network). Um sistema robusto de gerenciamento é necessário para garantir a disponibilidade e o controle adequado das informações. 2.1.3 O Modelo Computacional da Computação nas Nuvens O modelo computacional da computação nas nuvens está dividido em conceitos, tipos de serviços e tipos de arquitetura. Este modelo computacional é essencial para o entendimento de como tudo funciona e, naturalmente, vem se adaptando aos novos conceitos, funcionalidades e arquiteturas. De acordo com MELL; GRANCE (2008, apud Sosinsky, 2011, p. 63), a nuvem é classificada em quatro tipos de arquiteturas, três modelos de serviço e, também, cinco principais conceitos sobre o funcionamento da cloud. Esta definição, criada originalmente pelo NIST, define as arquiteturas da nuvem em modelo comunitário, híbrido, privado e público. Também classifica os tipos de serviço em IaaS (Infrastructure as a Service), PaaS (Platform as a Service) e SaaS (Software as a Service). Por fim, define os cinco conceitos principais como conjunto de recursos, acesso amplo à rede, serviço medido, serviço sob demanda e rápida elasticidade. Conforme a figura apresentada a seguir, é possível observar a classificação acima descrita.
  33. 33. 33 Figura 3 – Visão Global da Computação nas Nuvens. Fonte: Editado pelo autor com base em Sosinsky (2011). 2.1.4 Principais Conceitos Com base no descritivo apresentado por Sosinsky e definido pelo NIST, é possível descrever os conceitos da Computação nas Nuvens.  Pool de Recursos: o Pool de Recursos está associado à quantidade de recursos computacionais que estarão disponíveis para os usuários finais, como a quantidade de processamento, memória e espaço de armazenamento. Com a definição da quantidade de recursos disponíveis, pode-se definir quanto será destinado para cada situação, e quando serão compartilhados. Os recursos podem ser compartilhados entre diversos usuários ao mesmo tempo, modo conhecido como multi-inquilino. Além disso, estes recursos podem estar geograficamente espalhados, porém de forma transparente para os usuários finais. Por exemplo, se pode definir um Pool de Recursos para um determinado grupo de usuários domésticos e outro para usuários corporativos. Sosinsky (2011, p. 63)  Serviços Sob Demanda: conhecido também como “on-demand”, o conceito de serviço sob demanda define como serão utilizados os
  34. 34. 34 serviços da nuvem. Assim como ocorre com outros serviços sob demanda, como o consumo de água e eletricidade, os serviços tecnológicos da cloud são utilizados conforme a necessidade, e são alocados dinamicamente, de acordo com o crescimento da demanda. Dessa forma, o custo total é a soma de todos os recursos utilizados em determinado período. Isto possibilita que aplicações cresçam dinamicamente, alocando automaticamente mais recursos sem que seja necessário mudanças na infraestrutura local. Sosinsky (2011, p. 63)  Elasticidade e Escalabilidade: a elasticidade e a escalabilidade estão vinculadas diretamente com o pool de recursos e os serviços sob demanda. Estes conceitos garantem a possibilidade de crescer gradativamente o ambiente tecnológico para cada tipo de necessidade de forma automática ou manual. Em uma demanda inicial, pode-se utilizar X ciclos de processamento, memória e armazenamento, e estes ciclos podem aumentar dinamicamente conforme a necessidade. Do ponto de vista do cliente, os recursos podem ser adquiridos em qualquer quantidade e em qualquer momento. Sosinsky (2011, p. 63)  Serviço Medido: os recursos utilizados pelo usuário em determinado período são mensurados, de forma que seja possível a identificação da quantidade memória, CPU, I/O (Input/Output) de disco, ou utilização da rede que foram de fato consumidos. A partir deste relatório, o usuário é tarifado, baseado nas métricas de utilização. Sosinsky (2011, p. 64)  Acesso Amplo à Rede: capacidade da rede possuir arquiteturas heterogêneas, de modo que diversos dispositivos como celulares, tablets, laptops e desktops possam acessar o ambiente em qualquer local e a qualquer momento. Sosinsky (2011, p. 63)
  35. 35. 35 2.1.5 Arquiteturas Podemos classificar os modelos de arquitetura da nuvem em quatro principais tipos. Não há um modelo que tenha vantagem sobre outro, a utilização destes modelos vai depender da necessidade de cada corporação, questões de custo, necessidades regulatórias, ou questões de segurança da informação. 2.1.5.1 Público O modelo público é aquele em que a nuvem tem os seus recursos compartilhados entre o público geral. Apesar de existir uma divisão lógica que garanta a separação entre todos os usuários, sua infraestrutura física é a mesma para todos (Sosinsky, 2011, p. 48). De pontos positivos, é possível citar o baixo custo e a grande quantidade de oferta no mercado. Como aspecto negativo, é possível relatar problemas de desempenho e segurança das informações quanto a sua confidencialidade e disponibilidade, afinal, todos os dados estão alocados em meios de armazenamento compartilhados. 2.1.5.2 Privado O modelo privado, diferentemente do modelo público, é exclusivo de um usuário ou um grupo. Ele pode estar situado dentro de uma corporação ou pode estar alocado em um terceiro que garanta a sua utilização exclusiva. Este modelo assegura que a infraestrutura será de uso dedicado, sem que haja o compartilhamento de recursos. Sosinsky (2011, p. 48). Dentre os pontos positivos, está a garantia de segurança dos dados, e o desempenho que este modelo pode garantir. Os pontos negativos assinalam para o alto custo que um modelo como este pode representar, por necessitar de uma infraestrutura dedicada, em que não exista a concorrência por recursos computacionais.
  36. 36. 36 2.1.5.3 Comunitário Também é possível trabalhar de forma mais segura do que o ambiente público, sem ter que realizar o investimento total de um modelo privado. Neste caso, há caracterizado o modelo chamado comunitário, em que duas ou mais organizações realizam investimentos em comum acordo, para viabilizar a utilização de um modelo privado, compartilhando os recursos entre ambas. Ainda se pode destacar neste modelo, os mesmos problemas com segurança e desempenho que existem no modelo público, mas minimizados com a redução do número de participantes de uma infraestrutura. Sosinsky (2011, p. 48). 2.1.5.4 Híbrido Quando existe a união de dois ou mais modelos destacados anteriormente, consideramos um modelo do tipo híbrido. Este é um dos modelos mais promissores da Cloud Computing, pelo fato de utilizar as vantagens dos demais modelos, e ser uma alternativa inicial para as corporações que desejam começar a utilizar serviços da nuvem. Por exemplo, um cliente que esteja preocupado com a segurança e disponibilidade de seus dados, poderia utilizar um modelo privado, mas quando utilizar a nuvem para alocação de dados não críticos, poderia utilizar o modelo público que lhe atenderia da mesma forma que o modelo privado, mas sem o seu alto custo. Sosinsky (2011, p. 48). 2.1.6 Tipos de Serviço Além dos modelos de arquitetura existentes da nuvem, ela também é classificada quanto ao tipo de serviço que é prestado com a nomenclatura “como um serviço”, ou na língua inglesa, “as a service”. Ofertar tudo como serviço faz parte da estratégia de ascender a computação nas nuvens ao modelo de utilidade. A lista de tipos de serviços oferecidos é extensa, mas serão citados aqui os principais tipos, conforme se observa a seguir. Velte Ant; Velte Tob et al., (2011, p. 11)  IaaS (Infrastructure as a Service)  PaaS (Platform as a Service)
  37. 37. 37  SaaS (Software as a Service) Figura 4 - Limites entre IaaS, PaaS, SaaS Fonte: CSA (2011b). A figura anterior explana as delimitações entre IaaS, Paas e Saas. Com base nisso, se pode classificar o modelo IaaS como responsável por manter uma infraestrutura física; o modelo PaaS em entregar uma solução para o desenvolvimento e execução de aplicações; e o modelo SaaS por entregar uma aplicação final e pronta para uso.
  38. 38. 38 Naturalmente, já existem outras definições para diferentes tipos de serviços, conforme ocorre o crescimento da evolução dos serviços na nuvem. Sosinsky (2011, p. 53, tradução nossa), reforça que: os três tipos de modelos de serviços em conjunto, têm vindo a ser conhecido como o modelo SPI (SaaS, PaaS, IaaS) da computação em nuvem. Muitos outros modelos de serviço também já foram mencionados: StaaS, armazenamento como um serviço; IdaaS, Identidade como um serviço; CmaaS, compliance como um serviço, e assim por diante. No entanto, os tipos de serviço SPI abrangem todas as outras possibilidades. 2.1.6.1 Infraestrutura como um Serviço Conforme ilustrado pela figura 5, o modelo IaaS é a base de apoio de todos os demais modelos. Nele são fornecidos serviços ligados ao hardware e equipamentos de infraestrutura. De acordo com Sosinsky (2011, p. 52), a grande vantagem deste tipo de utilidade é que um usuário não precisa se preocupar com quais equipamentos serão adquiridos para sua utilização, já que seu prestador de serviço irá garantir todos os recursos necessários. Sua preocupação é focada em dimensionar a quantidade de recursos tecnológicos que irá precisar para executar determinada tarefa, e seu custo ficará definido pela quantidade cumulativa dos recursos que utilizar. Um usuário, por exemplo, poderia adquirir os tipos de serviços IaaS conforme citados abaixo:  ciclos de CPU;  quantidade de memória;  espaço de armazenamento;  velocidade de link de dados;  firewalls e roteadores. Para o prestador de serviços, a grande vantagem é que ele poderá compartilhar sua infraestrutura física, e comercializar os serviços para diversos locatários ao mesmo tempo. Outra característica do IaaS é que os recursos podem ser dinamicamente ajustados, conforme a demanda dos serviços. Um usuário, por exemplo, poderia utilizar X ciclos de CPU e memória em uma situação normal de
  39. 39. 39 utilização de seus serviços e aumentaria dinamicamente para Y ciclos de CPU e memória em momentos de grande demanda por parte das atividades que executa, sem que precise, para isso, realizar mudanças físicas em seu ambiente. Velte Ant; Velte Tob et al.(2011, p. 15) 2.1.6.2 Plataforma como um Serviço O PaaS é um modelo executado acima do modelo IaaS (vide figura 5), e tem como objetivo fornecer um meio compartilhado para que se possa criar e executar aplicativos e serviços na nuvem. Velte Ant; Velte Tob et al., (2011, pag. 14) cita alguns exemplos de utilização do PaaS que incluem principalmente:  ambientes de desenvolvimento com bancos de dados;  desenvolvimento de sistemas;  integração de serviços web;  hospedagem de serviços;  utilização de sistemas operacionais. O modelo PaaS, assim como os demais tipos de serviços, podem atribuir vantagens ao usuário final e ao fornecedor do tipo de serviço. Um usuário de um ambiente PaaS não tem controle sobre a infraestrutura, como CPU, quantidade de memória alocada e espaço de armazenamento, porém tem o controle sobre o ambiente operacional de determinada aplicação. Para o fornecedor, o modelo PaaS é muito interessante, já que pode atender a múltiplos usuários simultaneamente em uma mesma estrutura. Um dos pontos contrários aos PaaS é que a interoperabilidade e a portabilidade entre fornecedores é prejudicada pelo fato de utilizarem soluções de padrões diferentes e incompatíveis, dificultando a migração entre fornecedores. Velte Ant; Velte Tob et al., (2011, pag. 14) 2.1.6.3 Software como um Serviço Conforme ilustrado na figura 5, o SaaS está acima da camada do PaaS, referenciado como uma aplicação final. De acordo com Miller (2008, p. 40), o
  40. 40. 40 modelo SaaS é, provavelmente, o mais conhecido e difundido da Computação nas Nuvens. Segundo Velte Ant; Velte Tob et al., (2011, pag. 12), este modelo proporciona aplicativos para serem utilizados por meio da Internet, sem que o cliente precise se preocupar com a infraestrutura necessária para utilizá-lo. O propósito central é que o usuário possa acessar aplicativos utilizando um navegador de páginas em qualquer lugar e a qualquer momento. Será de responsabilidade do provedor do serviço manter toda a infraestrutura necessária para que o software seja executado adequadamente. Miller (2008, p. 40, tradução nossa) também descreve que, cada organização servida pelo fornecedor é chamada de um inquilino, e esse tipo de arranjo é chamado de arquitetura multi-inquilino. Os servidores do fornecedor são virtualmente particionados para que cada organização trabalhe com uma instância de aplicativo virtual personalizado. Também é reforçado por Velte Ant; Velte Tob et al., (2011, pag. 14) que, o SaaS difere das antigas distribuições de soluções de computação, uma vez o SaaS foi desenvolvido especificamente para uso de ferramentas web, como o navegador. Isto torna-os web-nativos. Foi construído também com um múltiplo back-end, que permite a múltiplos clientes usarem o mesmo aplicativo. Como o ambiente é compartilhado entre diferentes usuários, o fornecedor que disponibiliza serviços de SaaS terá o seu trabalho reduzido para efetuar atualizações e manutenções, na medida em o fará em apenas poucos locais, diferentemente do modelo existente, onde cada usuário precisa executar sua própria atualização, ou mesmo manutenção. 2.2 A SEGURANÇA E OS LIMITES DA COMPUTAÇÃO NAS NUVENS Um dos grandes percalços na caminhada em direção à utilização da nuvem é a preocupação quanto à segurança da informação. Além disso, a nuvem também tem suas limitações e pode não se adequar a realidade de todos os ambientes. As corporações se preocupam muito quanto à confidencialidade, à disponibilidade e à integridade dos dados. Quando dados sensíveis são enviados para a nuvem, espera-se que eles sejam mantidos seguros, livres de acessos não autorizados e
  41. 41. 41 que se mantenham íntegros. Também é indispensável que estes dados estejam sempre disponíveis, a qualquer hora e em qualquer lugar. 2.2.1 Principais Preocupações Uma pesquisa foi realizada pelo IDC e apresentada por Velte Ant; Velte Tob et al., (2011, pag. 35), conforme ilustrada na figura 6, esta investigação apresenta a opinião de 244 executivos de TI sobre a utilização de serviços na nuvem. Do total de entrevistados, um grupo de 74,5% mostrou preocupação com a segurança de suas informações. Outros dois grupos com 58%, mostraram preocupação com a disponibilidade das informações e com o desempenho de soluções migradas para a nuvem. Figura 5 - Pesquisa sobre Computação nas Nuvens Fonte: Velte Ant; Velte Tob et al., (2011, pag. 35) Assim como ocorrem nas estruturas locais de TI, também podem ocorrer na nuvem diversos tipos de ataques que buscam acessar informações privilegiadas, ou mesmo interromper serviços ativos. De acordo com Velte Ant; Velte Tob et al., (2011, pag. 31), de fato existem muitos riscos na utilização da nuvem, porém muitas empresas provedoras de serviço estão se esforçando ao máximo em manter todo o ambiente da cloud computing seguro. Muitas vezes o ambiente mantido na nuvem pelo provedor é inclusive mais seguro do que nas próprias corporações que utilizam o serviço. Os provedores de serviços utilizam normas e recomendações que visam a
  42. 42. 42 garantir um melhor nível de serviço prestado. Sosinsky (2011, p. 426, tradução nossa) reforça que: A computação em nuvem tem muitas propriedades únicas que a tornam muito valiosa. Infelizmente, muitas dessas propriedades tornaram a segurança uma preocupação singular. Muitas das ferramentas e técnicas que poderiam ser utilizadas para proteger seus dados, cumprir com os regulamentos, e manter a integridade de seus sistemas são complicados pelo fato de que você compartilha seus sistemas com os outros e, muitas vezes, terceirizam suas operações. Prestadores de serviços de computação em nuvem estão bem cientes destas preocupações e estão desenvolvendo novas tecnologias para lidar com elas. Também é importante ressaltar que é possível ter diferentes níveis de segurança em diferentes tipos de modelos de utilização da nuvem. Por exemplo, seria possível a utilização de um serviço em IaaS com um nível mínimo de segurança, e um nível maior com a utilização de serviço do modelo SaaS. A utilização dos serviços na cloud necessitará que cada corporação elabore um mapeamento dos controles já existentes na sua infraestrutura local, que verifique quais os mecanismos de segurança necessários, e que estabeleça uma relação com os controles e mecanismos que os provedores de nuvem podem fornecer. Sosinsky (2011, p. 426) Com base nas pesquisas citadas, manter de forma segura as informações armazenadas, é o principal desafio que as organizações precisam se concentrar. Ainda de acordo com Sosinsky (2011, p. 437), mecanismos de controle de acesso podem ser utilizados para mitigar os riscos da nuvem, como a autenticação, garantindo as credenciais de determinado usuário; a autorização, atribuindo aos usuários direitos e permissões de acesso e a auditoria, buscando contabilizar e registrar as ações realizadas na nuvem. 2.2.2 Limites da nuvem Como qualquer outra tecnologia, a nuvem também possui suas deficiências e que precisam ser levadas em conta antes da tomada de qualquer decisão em utilizar serviços fora dos limites das corporações.
  43. 43. 43 2.2.2.1 Confidencialidade das informações Segundo a norma NBR ISO/IEC 27001 (2006, pag. 2), a definição para confidencialidade é a “propriedade de que a informação não esteja disponível ou revelada a indivíduos, entidades ou processos não autorizados”. Quando os dados são enviados para um centro de dados terceirizado, esta propriedade pode ser quebrada, já que a garantia pela confidencialidade das informações passa a ser também de responsabilidade do fornecedor. As informações percorrem por diferentes tipos de sistemas, arquiteturas, redes de informações e estão sujeitas a serem abertas de forma silenciosa, sem que seus proprietários tenham conhecimento do vazamento de suas informações. Segundo Velte Ant; Velte Tob et al., (2011, pag. 31), quando os dados são enviadas para nuvem, perde-se uma camada de controle das informações que foram alocadas em um ambiente externo. Reese (2009, p. 100), destaca algumas situações em que a confidencialidade dos dados poderia estar comprometida; como a falência declarada de um fornecedor; um processo judicial que obrigaria o fornecedor a conceder acesso às informações; ou ainda uma falha eventual de algum processo que venha a comprometer as informações alocadas. Com base nestes relatos, percebe-se que a criptografia tem papel vital para mitigar incidentes quanto à confidencialidade dos dados. Antes das informações serem enviadas para ambientes na nuvem, os dados devem ser criptografados, garantindo consequentemente uma maior segurança. É importante ressaltar que, apesar dos benefícios resultantes da criptografia dos dados, perde-se também desempenho no acesso das informações, em razão dos cálculos matemáticos necessários para criptografar e descriptografar constantemente as informações. Além disso, mecanismos de criptografia podem não serem aplicáveis em todos os tipos de sistema, inviabilizando a utilização dos serviços na nuvem quando se é necessário o total controle das informações. 2.2.2.2 Disponibilidade de serviços A norma NBR ISO/IEC 27001 (2006, pag. 2), descreve disponibilidade como “propriedade de estar acessível e utilizável sob demanda por uma entidade autorizada”. É necessário que quando serviços são utilizados na nuvem, eles
  44. 44. 44 estejam disponíveis a qualquer momento e que tenham desempenho suficiente para atender as demandas das aplicações. O fornecedor de serviços precisa garantir a disponibilidade das aplicações, como também é necessário que ele tenha uma grande capacidade de comunicação com a Internet, visando atender todos os seus clientes de forma satisfatória com os serviços que está prestando. Do lado do cliente, também é necessário que ele também mantenha uma infraestrutura de comunicação com a Internet adequada para os tipos de serviços que irá utilizar. Ainda assim, manter uma estrutura de backup local ou mesmo em outro fornecedor de nuvem, pode ser uma boa alternativa para garantir uma maior disponibilidade dos serviços. 2.2.2.3 Tipos de aplicações Há alguns tipos de aplicações que não justificam sua movimentação para uma plataforma na nuvem, em função de suas próprias características. Por exemplo, uma aplicação que demanda uma quantidade significativa de troca de tráfego, poderia ser inviabilizada em uma estrutura na nuvem pelo seu alto custo relacionado. Além disso, aplicações legadas que não tenham condições de serem migradas, podem não serem portadas para o ambiente externo por questões de compatibilidade. É necessário que entenda-se a necessidade do negócio e das aplicações, para que seja possível uma análise prévia dos tipos de aplicações e serviços que teriam vantagens se utilizados em ambientes da cloud. 2.2.2.4 Conformidade com a legislação vigente A conformidade com a legislação vigente é outro fator que precisa ser observado. Os países possuem legislações diferentes e que podem influenciar na segurança dos dados. Países como o EUA (Estados Unidos da América) permitem ao governo o acesso às informações armazenadas na nuvem em casos de necessidades de investigações Velte Ant; Velte Tob et al (2011,p.32). Uma citação do código de prática da NBR ISO/IEC 27005 (2005, pag. xi), descreve que,
  45. 45. 45 uma outra fonte é a legislação vigente, os estatutos, a regulamentação e as cláusulas contratuais que a organização, seus parceiros comerciais, contratados, e provedores de serviço tem que atender, além do seu ambiente sociocultural. Conforme observou-se, esta definição que visa descrever as fontes para estabelecer os requisitos de segurança da informação, também trás a preocupação com a legislação vigente. Como as informações armazenadas podem estar alocadas em diversos países, é importante observar qual a legislação vigente nestes locais. Em eventuais intimações com o provedor do serviço na nuvem, os dados de todos os clientes lá alocados podem ser abertos durante uma investigação. 2.2.2.5 Multi-Inquilino De acordo com Reese (2009, p. 3), o conceito de multi-inquilino ou como definido na língua inglesa, multi-tenant é a capacidade de um sistema oferecer múltiplas instâncias de serviços compartilhando os mesmos recursos com vários usuários ao mesmo tempo. Este tipo de conceito permite que a infraestrutura seja compartilhada, reduzindo investimentos e o custo atribuído com desenvolvimento e suporte necessário para manter as aplicações. Conforme Sosinsky (2011, p. 202, tradução nossa), multi-locação também tende para a média da variabilidade intrínseca da procura individual, porque o "coeficiente de variáveis aleatórias" é sempre menor do que ou igual a qualquer uma das variáveis individuais. Com uma demanda mais previsível e menos variação, serviços na nuvem podem ser executados em maiores taxas de utilização do que os sistemas individuais. Isso permite que sistemas de nuvem operem com maior eficiência e menores custos. Entretanto, o conceito de multi-inquilino pode resultar em alguns problemas para usuários que utilizam serviços compartilhados. Quando um fornecedor determina a quantidade de recursos destinada para uma determinada infraestrutura, ele poderá realizar uma análise pela média de utilização estimada para um serviço que irá fornecer. Ocorre que se este nível médio de utilização exceder o nível previsto poderá resultar em impactos para seus clientes. Por exemplo, um determinado usuário que utiliza massivamente o acesso ao sistema de armazenamento, através de operações de leitura e gravação randômicas, afetaria provavelmente os demais usuários que estão utilizando o mesmo serviço.
  46. 46. 46 2.2.2.6 Dependência do fornecedor Certas aplicações são desenvolvidas na nuvem atendendo os requisitos de determinado fornecedor. O problema é que o usuário pode ficar sem alternativas quando necessitar da portabilidade para sistemas de outros prestadores de serviços. Como a aplicação foi desenvolvida utilizando métodos disponibilizados pelo terceiro, ela pode ficar totalmente dependente do ambiente utilizado, causando o que é chamado de “vendor lock-in”. É indispensável que os fornecedores sejam analisados, buscando entender as padronizações utilizadas, e se elas poderão ser portadas para outros sistemas sem a necessidade de adaptações. 2.2.3 Cloud Security Alliance Os problemas relacionados com segurança na nuvem evidenciaram a necessidade de existir um estudo que apontasse os principais riscos da utilização de um ambiente em cloud e como estes riscos poderiam ser mitigados. Com base nesta necessidade, uma associação sem fins lucrativos chamada CSA (Cloud Security Alliance)14 foi criada, buscando a realização de pesquisas e a identificação dos principais problemas com segurança na nuvem, sugerindo as melhores práticas de segurança no contexto da computação nas nuvens. Este grupo de estudo é apoiado por profissionais da indústria, empresas, associações e demais partes interessadas. O documento divulgado como “CSA Guidance” fruto do estudo do grupo, está atualmente na versão 3.0, e traz as definições sobre cloud computing, métodos de governança e operação da nuvem. Ele está dividido em três grandes sessões:  arquitetura da Nuvem;  governança na Nuvem;  operação na Nuvem. Além das sessões principais, o guia traz consigo quatorze domínios que tratam assuntos relacionados à segurança e arquitetura de rede da nuvem. O estudo sugere que as organizações adotem abordagens baseadas em riscos durante a 14 CSA – http://www.cloudsecurityalliance.org
  47. 47. 47 migração dos serviços para a nuvem. De acordo com o guia, uma empresa que for realizar a migração de um ativo para a nuvem, deverá classificá-lo em dados ou aplicações. A partir desta classificação, deverá avaliar os potenciais riscos quando estiverem em um ambiente da nuvem e qual a importância deles para a corporação. Com a definição de risco do ativo definida, pode-se determinar qual tipo de arquitetura utilizar: CSA (2011a).  público;  privado – interno (dentro da corporação);  privado – externo (provedor terceiro);  comunitário;  híbrido. Segundo o CSA (2011a) também é importante, nesta etapa, possuir um mapeamento de processos das aplicações e dados, buscando encontrar a arquitetura ideal e o tipo de serviço que será utilizado, seja IaaS, PaaS ou SaaS. No ambiente da nuvem, dependendo da arquitetura escolhida e do tipo de serviço para determinada aplicação, podem existir diferentes responsabilidades entre a organização que está utilizando a nuvem e o provedor do serviço. A ilustração a seguir apresenta as responsabilidades entre os tipos de modelos computacionais da nuvem, visando o entendimento das responsabilidades entre a organização e o provedor de serviço da nuvem.
  48. 48. 48 Figura 6 - Responsabilidades entre modelos computacionais da nuvem Fonte: CSA GUIA PT-BR (2011b).
  49. 49. 49 2.3 VIRTUALIZAÇÃO Apesar de não ser um requisito obrigatório, a virtualização é um dos motores que impulsionaram a computação nas nuvens. Esta tecnologia busca aproveitar melhor os recursos computacionais, evitando desperdícios e garantindo, principalmente, flexibilidade na criação e movimentação de máquinas virtuais. O conceito de virtualização iniciou a partir de ano de 1960, quando a IBM15 utilizou seus grandes mainframes16 para dividi-los em diversas máquinas virtuais, buscando maximizar a eficiência da utilização dos grandes computadores. Dessa forma, era possível que diversas máquinas virtuais trabalhassem ao mesmo tempo, compartilhando recursos. Com o passar dos anos, por volta de 1980, o modelo cliente-servidor dos processadores x8617 acabou dominando o mercado da tecnologia de computadores, deixando a virtualização em desuso. A tecnologia x86 tinha um baixo custo e permitia um modelo de computação distribuído. Neste modelo era possível que servidores com processadores x86 de alto poder de processamento executassem aplicações para diversas máquinas clientes ao mesmo tempo. Blokdijk; Menken (2009, p. 11) Os processadores foram evoluindo ao longo dos anos, crescendo verticalmente em capacidade de processamento e horizontalmente em número de núcleos. Apesar da grande evolução dos processadores, eles não eram utilizados em sua totalidade, passando a ficar ociosos durante sua maior parte da carga de trabalho. Somado a isto, novas necessidades surgiam, buscando reduzir custos com TI, e aumentando a disponibilidade de sistemas computacionais. A solução para isso seria a volta da tecnologia de virtualização iniciada na década de 1960. A VMware18 introduziu em 1999 a primeira solução para virtualização em processadores x86, resgatando a tecnologia que havia sido deixada para trás. Blokdijk; Menken (2009, p. 12) 15 IBM – International Business Machines – Empresa situada nos EUA, voltada para a área de informática. 16 Mainframe – Computador de grande porte, com alto poder de processamento. 17 Tipo de arquitetura de processadores 18 VMware – Empresa situada nos EUA, desenvolvedora de software para virtualização.
  50. 50. 50 A tecnologia de virtualização evoluiu muito a partir do ano de 1999. Nos dias atuais é possível encontrar soluções de diferentes fabricantes que possuem soluções para virtualização, para diferentes plataformas e tipos de serviços. 2.3.1 Vantagens A virtualização oferece uma série de vantagens, buscando maximizar a utilização dos recursos de TI e reduzindo consequentemente seu custo. Dentre as vantagens, é possível citar:  redução no custo de infraestrutura;  aumento de disponibilidade de sistemas;  melhor aproveitamento de recursos ociosos;  maior taxa de consolidação;  menor tempo para entrega de serviços computacionais;  facilidades na recuperação de desastres;  gerenciamento centralizado;  economia de espaço físico. 2.3.2 Desvantagens A utilização da virtualização possui uma série de benefícios, entretanto também traz algumas desvantagens em sua adoção como:  alto consumo de memória física, podendo ser um gargalo na infraestrutura física;  concentrador de risco, quando há mais de uma máquina virtual em um mesmo hardware;  perda de desempenho quando comparado ao hardware físico;  segurança na camada de virtualização.
  51. 51. 51 É evidente que as desvantagens citadas são pequenas, se comparadas com as vantagens da tecnologia. Estas desvantagens podem ser facilmente analisadas e mitigadas através de análises pontuais dos riscos. 2.3.3 Virtual Machine Monitor Segundo Sosinsky (2011, p. 202), uma VMM (Virtual Machine Monitor) ou hypervisor como também é referenciado, é um programa de baixo nível para fornecer ao sistema operacional acesso a recursos da máquina física. A virtualização pode ser classificada em dois tipos de arquitetura, o “tipo I” e o “tipo II”. O “tipo I” adiciona uma camada de virtualização entre o hardware e o sistema operacional convidado, garantindo um melhor desempenho, evitando a competição de processos entre o sistema operacional convidado e a camada de virtualização. Um hypervisor que executa um sistema operacional convidado no “tipo I” pode trabalhar como uma virtualização completa de processador (Full Virtualization) ou como uma para-virtualização (paravirtualization). Na virtualização completa, a máquina virtual tem acesso direto às instruções do processador, garantindo em algumas ocasiões um melhor desempenho. Na para-virtualização, é necessário uma interface entre o hypervisor e a máquina virtual que está sendo executada, geralmente modificando o sistema operacional convidado e garantindo, assim, um melhor desempenho. Sem a interface, ocorre uma emulação completa do hardware, reduzindo o desempenho da máquina virtual. Sosinsky (2011, p. 202) Já a virtualização de “tipo II”, tem instalada a camada de virtualização dentro de um sistema operacional hospedeiro subjacente. O grande problema do tipo II é que o sistema operacional hospedeiro irá concorrer na utilização de recursos com a camada de virtualização, afetando o desempenho dos sistemas operacionais convidados. Quando o “tipo II” executa uma máquina virtual, ela está virtualizada por meio da para-virtualização, da virtualização total, ou por meio de uma emulação completa de hardware. Sosinsky (2011, p. 203) É importante ressaltar que, para que a virtualização completa possa ter um desempenho maior que a para-virtualização, é necessário que o processador esteja preparado para entender as instruções corretas. Os processadores mais recentes da
  52. 52. 52 Intel19 e AMD20 possuem suporte aos recursos VT-x e AMD-V respectivamente, que garantem a possibilidade de execução da virtualização completa com o maior desempenho possível. Este tipo de virtualização com suporte nos processadores, também é conhecido como a virtualização com hardware assistido. Quando o recurso de virtualização no processador é inexistente, os hypervisors para- virtualizados costumam ter um desempenho superior que a virtualização completa, pois conseguem analisar rapidamente as requisições das máquinas virtuais por meio da modificação existente no sistema operacional convidado. Mattos (2012) Em grande parte das instalações, o “tipo I“ é utilizado para provedores de serviço ou corporações com serviços locais de TI que buscam o melhor desempenho para as máquinas virtuais. Já o “tipo II”, é comumente utilizado para desenvolvimento e homologação de aplicações, ou mesmo para utilização doméstica. A figura 8 exemplifica a arquitetura de um ambiente virtual conhecido como virtualização de “tipo I” e o “tipo II”. O modelo “tipo I” é o mais utilizado para consolidar aplicações legadas da TI local de uma corporação. 19 INTEL - Empresa multinacional de tecnologia dos Estados Unidos da América. 20 AMD - Advanced Micro Devices – Empresa multinacional dos Estados Unidos da América.
  53. 53. 53 Figura 7 - Tipos de arquitetura de virtualização. Fonte: Elaborado pelo autor. 2.3.4 Soluções de Virtualização Existem, atualmente, inúmeras soluções com o propósito de realizar a virtualização de máquinas virtuais. Algumas soluções trabalham exclusivamente com o “tipo I“, e outras com o “tipo II”. Este trabalho irá apresentar brevemente as soluções Qemu, KVM, Xen, VirtualBox e o VMware ESX. Estes hypervisors citados estão entre os mais utilizados para ambientes de produção e também para ambientes de testes e homologação.
  54. 54. 54 2.3.4.1 Kernel-based Virtual Machine O KVM (Kernel-based Virtual Machine), mantido pela RedHat21 , é uma solução de código aberto para a infraestrutura de virtualização de máquinas virtuais e utilizado concomitantemente com o emulador e virtualizador Qemu. O KVM é instalado como um módulo do kernel do Linux e foi originalmente desenvolvido para arquitetura x86 e x86_64. Para utilizar o KVM é necessário que o processador do hardware hospedeiro contenha a extensão de virtualização disponível nos processadores AMD ou INTEL. O KVM executa em modo de virtualização completa de processador, embora utilize a para-virtualização para dispositivos de entrada/saída. Kvm (2011) 2.3.4.2 Qemu O Qemu é uma aplicação de código aberto que realiza a emulação e virtualização de máquinas virtuais. O Qemu pode trabalhar em modo usuário para emulação de sistemas operacionais e para diferentes plataformas de CPU ou no modo de virtualização completa, onde consegue virtualizar completamente a arquitetura de hardware para uma máquina virtual. É importante ressaltar que o Qemu é utilizado como complemento de virtualização para diversos hypervisors. Nestes casos, o Qemu é empregado para a para-virtualização de dispositivos de entrada/saída. É possível citar entre eles o KVM, Xen e Virtualbox. Qemu (2012a) 2.3.4.3 Xen O Xen é uma plataforma de código aberto para realizar a virtualização de máquinas virtuais de diversas arquiteturas como x86 e x86_64, além de outras. O Xen possui variações da sua plataforma, que trabalham como “tipo I“ ou “tipo II”, e também da forma para-virtualizada ou virtualização completa. Assim como o KVM, o Xen necessita que o processador do hardware hospedeiro contenha a extensão de virtualização disponível nos processadores AMD ou INTEL, para que possa realizar a virtualização completa. A plataforma Xen é uma das mais utilizadas atualmente e 21 RedHat – Empresa multinacional com base nos Estados Unidos da América que produz software baseado no sistema operacional Linux.
  55. 55. 55 empregada, também, como base para soluções proprietárias de virtualização como o XenServer22 da Citrix Systems e como solução de virtualização da Oracle23 , conhecida como Oracle VM24 . Xen (2012) 2.3.4.4 Vmware ESX O VMware ESX é uma solução proprietária de virtualização pertencente a corporação VMware, Inc., subsidiária da EMC Corporation25 . O hypervisor do VMware ESX trabalha no “tipo I” e permite a virtualização de diversos sistemas operacionais no modo para-virtualizado ou virtualização completa. Vmware (2012b) 2.3.4.5 Virtualbox O Virtualbox é uma solução de virtualização pertencente a Oracle e que utiliza como modelo de trabalho o “tipo II” de virtualização. O VirtualBox é instalado em um sistema operacional hospedeiro realizando a para-virtualização ou, ainda, a virtualização completa, quando o processador possuir suporte a extensão de virtualização ativa. Por trabalhar exclusivamente com o “tipo II”, o VirtualBox tem uma maior adoção em ambientes domésticos e de homologação. Virtualbox (2012) 2.4 O ARMAZENAMENTO DE DADOS Assim como a virtualização, as tecnologias de armazenamento de dados são de suma importância para o crescimento da computação nas nuvens. Muitas tecnologias foram desenvolvidas e aprimoradas para garantir o máximo de confiança quanto se fala de armazenamento de dados. Existem diversas alternativas de arquiteturas para armazenamento de informações, sejam elas de acesso local ou acesso compartilhado em redes de dados, das quais podemos citar os tipos de storage DAS (Direct Attached Storage), NAS (Network Attached Storage) e SAN (Storage Area Network). A palavra da língua inglesa “storage”, que na tradução do 22 XenServer – Solução proprietária de virtualização - www.xensource.com. 23 Oracle – Empresa multinacional de tecnologia dos Estados Unidos da América. 24 Oracle VM - http://www.oracle.com/us/technologies/virtualization 25 EMC Corporation - Empresa multinacional fornecedora de sistemas para infraestrutura e situada nos Estados Unidos da América.
  56. 56. 56 português brasileiro significa “armazenamento”, é um termo técnico utilizado e generalizado como um dispositivo centralizado para o armazenamento de dados. 2.4.1 Direct Attached Storage O storage do tipo DAS utiliza uma conexão direta entre o storage e o host cliente. Todas as requisições de acesso ao disco são feitas diretamente para o storage, que pode ser desde um simples disco conectado, até um equipamento storage dedicado em configuração raid 26 ativa, para o armazenamento de dados. Tecnologias como PATA (Parallel Technology Attachment), SCSI (Small Computer System Interface), SATA (Serial Advanced Technology Attachment), SAS (Serial Attached SCSI) e FC (Fibre Channel) são algumas tecnologias de conexões utilizadas em modelos do tipo DAS. Sacks (2001) 2.4.2 Network Attached Storage Um equipamento de storage do tipo NAS é aquele que fornece um meio de armazenamento de dados por meio de uma rede LAN (Local Area network), utilizada concomitantemente com a estrutura existente para a comunicação de serviços de rede baseados em TCP/IP. Normalmente estes tipos de dispositivos são servidores ou equipamentos dedicados com vários discos de armazenamento de dados. Estes discos, geralmente, participam de um grupo de raid, buscando um maior desempenho de I/O (Input/Output) de dados e redundância de discos. Para a comunicação do NAS com os clientes (hosts), normalmente utilizam-se protocolos como o CIFS (Common Internet File System) e o NFS (Network File System). Sacks (2001) 2.4.3 Storage Area Network Storage Area Network é a forma de armazenamento de dados utilizando uma rede de dados dedicada, exclusivamente, para o tráfego de informações. Este tipo de storage é indicado para aplicações que necessitam de um alto desempenho para 26 Raid – Tipo de tecnologia utilizada para criar uma redundância em um conjunto de discos independentes, além de oferecer mais desempenho para o acesso e gravação de dados.
  57. 57. 57 o acesso aos dados, ao mesmo tempo em que necessitam da escalabilidade para o crescimento futuro. Em uma mesma rede SAN, podem estar disponíveis vários equipamentos de armazenamento de dados, os quais são acessados por diversos hosts simultaneamente. Usualmente, a comunicação dos dados em uma rede SAN pode ocorrer utilizando a tecnologia de transporte de dados FC, ou utilizando o protocolo de internet IP conhecido como iSCSI (Internet Small Computer System Interface), que utiliza como meio de transporte a rede do tipo ethernet. Assim como os equipamentos NAS, os discos de um equipamento do tipo SAN, geralmente participam de um grupo de raid buscando um maior desempenho de I/O (Input/Output) de dados e redundância de discos. Sacks (2001) Também é importante ressaltar, que em uma SAN os discos de armazenamento são apresentados aos seus clientes como uma LUN (Logical Unit Number). Uma LUN é uma referência utilizada para identificar uma unidade lógica em uma rede SAN. Por exemplo, um dispositivo SAN disponibiliza uma determinada LUN de nome lun0 com determinado volume e mapeia esta LUN para um host específico. Sacks (2001)
  58. 58. 58 3 SOLUÇÃO PARA GERÊNCIA DA INFRAESTRUTURA DA NUVEM Neste capítulo, serão abordadas as diversas soluções para orquestrar um ambiente de infraestrutura da nuvem. A sessão 3.1 irá definir o conceito de orquestrar a nuvem, enquanto a sessão 3.2 irá apresentar as diversas soluções existentes, bem como uma análise parcial das soluções de IaaS existentes. As sessões 3.3 e 3.4 irão apresentar em maiores detalhes, as soluções Eucalyptus e Openstack respectivamente. Por fim, a sessão 3.5 irá apresentar um estudo comparativo entre OpenStack e Eucalyptus. 3.1 ORQUESTAR O AMBIENTE DA NUVEM Segundo o dicionário MICHAELLIS (2009), a palavra orquestrar significa “Compor as diferentes partes de uma peça musical para ser executada por orquestra” ou ainda “Orquestrar os componentes de uma equipe”. Em uma orquestra sinfônica, grupos orquestrais são regidos por um maestro que tem a responsabilidade de conduzir estes grupos a um objetivo final, a apresentação ao grande público. Fazendo uma analogia com a Computação nas Nuvens, o maestro, é a aplicação que controlará os diferentes tipos de sistemas de virtualização, as diferentes plataformas de armazenamento, as atribuições e os controles de acesso, delineando, por fim, a estrutura que será disponibilizada ao usuário. Os conceitos de virtualização e armazenamento centralizado são, atualmente, bem compreendidos e utilizados por grande parte das corporações, mas a grande oferta de soluções e padrões estabelecidos evidenciou o desafio existente em orquestrar esta variedade de soluções e garantir uma organização e simplificação do ambiente na nuvem. 3.2 SOLUÇÕES DE IAAS EXISTENTES Nesta sessão serão descritas soluções de IaaS utilizadas como referência para o desenvolvimento deste trabalho. Os principais serviços da Amazon serão descritos e, conforme citado anteriormente neste trabalho, também existem diversas soluções de código aberto que foram desenvolvidas e estão disponíveis para realizar
  59. 59. 59 o gerenciamento de uma infraestrutura para a nuvem. O quadro abaixo apresenta seis principais soluções escolhidas. Quadro 2 - Soluções para gerenciamento de ambientes IaaS. Nome Tipo de Plataforma Versões código Arquitetura Amazon AWS IaaS Proprietário Público Eucalyptus IaaS Proprietário/Aberto Privado/Híbrido Nimbus IaaS Aberto Privado/Híbrido OpenNebula IaaS Aberto Privado/Híbrido OpenStack IaaS Aberto Público/Híbrido/Privado Fonte: Elaborado pelo autor. 3.2.1 Amazon Web Services A Amazon é uma grande empresa de comércio eletrônico dos EUA, que no ano de 2002 começou a oferecer serviços na internet conhecidos como AWS27 (Amazon Web Services). Estes serviços evoluíram ao longo dos anos e, de forma pioneira, a Amazon aprimorou sua estrutura de modo a oferecer serviços sob demanda. Atualmente, os serviços da AWS formam um conjunto de soluções para oferecer IaaS para empresas e usuários domésticos. A Amazon possui zonas de sua infraestrutura espalhadas em algumas localidades do mundo, incluindo o Brasil, onde está instalada na cidade de São Paulo. Amazon (2012c) Dentre os diversos serviços oferecidos, este trabalho irá destacar três principais: EC2 (Elastic Compute Cloud): Serviço que oferece capacidade de computação redimensionável na nuvem. Com o EC2 é possível gerenciar instâncias de máquinas virtuais em poucos minutos, escalonando para mais ou para menos a quantidade de recursos necessários. Além das diversas características, o EC2 fornece um conjunto de funções que podem ser executadas via API. Estas funções permitem que sistemas de gerenciamento de terceiros sejam integrados com a 27 AWS – http://aws.amazon.com
  60. 60. 60 estrutura EC2 da Amazon, possibilitando a criação de instâncias, grupos de segurança, controles de acesso, entre outros. Amazon (2012a) EBS (Elastic Block Store): O serviço EBS fornece volumes de armazenamento em bloco para a utilização com instâncias EC2. Os volumes EBS são armazenados fora da instância e garantem uma vida independente da instância. Os volumes EBS podem ser utilizados para banco de dados, sistema de arquivos ou acesso a um armazenamento bruto do bloco. Amazon (2012e) S3 (Simple Storage Service): Assim como o EBS, o S3 fornece um serviço de armazenamento de dados, porém com utilização projetada para utilização na internet via protocolo HTTP28 ou BitTorrent29 . Outra grande diferença do S3 para o EBS é que o EBS mantém os dados apenas em uma zona da Amazon, enquanto o S3 pode replicar os dados do volume ao longo das demais zonas, garantindo réplicas dos dados alocados. Em contrapartida, a velocidade de leitura e gravação de dados ao S3 pode ser menor se comparada com o EBS. Além disso, o S3 permite manter imagens de estado (snapshots) do serviço EBS, garantindo, assim, backups dos volumes EBS. Também é fornecido pelo S3 interfaces de integração (API) SOAP e REST para o gerenciamento de arquivos. Amazon (2012b) 3.2.2 Nimbus O Nimbus é uma plataforma focada na infraestrutura da computação nas nuvens. Possui integração com Xen e KVM, e é compatível como o padrão de API EC2 e S3 da Amazon. Apesar de ele poder ser utilizado tanto para provedores que desejam oferecer serviços em nuvem como para usuários finais ou desenvolvedores que precisam testar aplicações, ele tem um forte apelo acadêmico, o qual é utilizado para gerenciar alguns tipos de aplicações legadas. Nimbus (2012a) 3.2.3 OpenNebula O OpenNebula, é um projeto de código aberto que busca desenvolver uma padronização para a indústria, com o objetivo de gerenciar ambientes virtualizados e 28 HTTP - Hypertext Transfer Protocol – Protocolo utilizado para comunicação de sites web. 29 BitTorrent – Protoloco de transferências de arquivos em topologia peer-to-peer.
  61. 61. 61 infraestrutura de uma nuvem híbrida e privada, apesar de também ser suportado para o gerenciamento de uma nuvem pública. O projeto OpenNebula foi iniciado como uma pesquisa no ano de 2005, e teve sua primeira versão disponibilizada em 2008. O OpenNebula pode gerenciar os hypervisors Xen, KVM, e VMware além de suportar integração com o modelo de API EC2 da Amazon. Opennenula (2012a) 3.2.4 Eucalyptus O Eucalyptus é uma aplicação madura, open-source, que trabalha com alguns tipos de hypervisors como o Xen e KVM, e realiza a integração com o padrão de API EC2 e S3 da Amazon. Iniciado a partir de um projeto de pesquisa da Universidade da Califórnia, Santa Barbara em 2007, ele foi desenvolvido com base na infraestrutura do fornecedor de IaaS Amazon, buscando adicionar suas principais características e funcionalidades. O Eucalyptus possui duas divisões internas, uma divisão open-source baseada na licença GPL v3, e outra proprietária. A licença proprietária disponibiliza outras funcionalidades, como integração com hypervisor VMware ESX e suporte técnico, que não estão inclusas na versão open-source. Eucalyptus (2012b) 3.2.5 OpenStack O Openstack é uma solução de gerência de uma nuvem IaaS, seu código é totalmente livre e surgiu em 2010, fruto de um de projeto de pesquisa e desenvolvimento a partir da união da NASA (National Aeronautics and Space Administration) dos Estados Unidos e da empresa privada de infraestrutura, Rackpace. O conceito principal do Openstack, que está baseada na licença Apache 2.0, é fornecer uma plataforma de gerenciamento de infraestrutura neutra e compatível com o maior número possível de desenvolvedores de aplicações e infraestrutura. O OpenStack pode controlar os hypervisors Xen/XenServer, KVM, VMware/ESX, LXC (Linux Containers) UML (User Mode Linux), Hyper-V, Qemu e também realiza a integração com o padrão de API EC2 e S3 da Amazon. OpenStack (2012b)
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×