Tendências de Inovações para a Tecnologia de
Big Data

Outubro/2013

Relatório preparado pela Cysneiros Consultores Associ...
2

Sumário
1

Introdução.....................................................................................................
3

Índice de Figuras
Figura 1. Dados de busca sobre a expressão Big Data no Google Trends (do dia 14/03/2013) ...............
4

1

Introdução

Este relatório foi produzido no âmbito no projeto CICTEC - Centro de Inteligência
Competitiva para Parqu...
5

2

Análise das Tendências de Mercado em Tecnologia da Informação e Comunicação
(TIC)

Big Data (termo que se aplica à i...
6

usar novos modelos de detecção de fraudes não estiverem disponíveis com baixa latência,
quando forem descobertos os nov...
7

2.1 Análise da Tecnologia de Big Data

Big Data não implica dizer que os dados pré-existentes são “pequenos” (o que não...
8

Enfoques de Big Data requerem novas ferramentas tais como Analíticas Social, InMemory, Texto, ou Semântica, que permite...
9

Pode parecer uma coisa “maluca” (principalmente para os economistas mais
conservadores ou que ainda estão na era pré-In...
10

No artigo em questão, os autores discutem a estrutura estatística relevante à hipótese
que levantam. E como exemplo, e...
11

E qual é a importância econômica do Big Data como tendência tecnológica? Segundo
estimativas de janeiro de 2013 da emp...
12

Figura 4. IDC prevê que Big Data valerá US$ 23,8 bilhões em 2016

Neste sentido, Ignatius agrupou algumas das melhores...
13

Parterns, identificam cientistas de dados como tendo o “mais sexy” trabalho de nossa era e
explicam como achá-los e at...
14

2.2

Macrotendências de Inovação Tecnológica em Big Data

Já que Big Data é uma tendência tecnológica que veio para fi...
15

Figura 6. Visão Geral de BI&A: Evolução, Aplicações e Pesquisa Emergente.

Fonte: Chen, Hsinchun, Chiang, Roger H. L.,...
16

2.3

Recomendações às Empresas de Tecnologia da Informação e Comunicação (TIC)

As macrotendências abordadas no item a...
17

tanto em escala quanto em escopo, está apontando para um novo horizonte que pode
contribuir enormemente para o crescim...
18

Tabela 1. Aplicações de BI&A: De Big Data para Grande Impacto
Comércio Eletrônico
e Inteligência de
Mercado

Ciência e...
19

Segundo Zikopoulos et. al. (2012), desde a virada deste milênio:
- 80% (oitenta por cento) da informação do mundo é de...
20

empresas encontrarem nos seus dados (ou nos dados dos seus clientes) as associações e
correlações que possibilitem a o...
21

3

Conclusão

Neste documento, foram apresentadas tendências de inovação tecnológica nos setores
de Tecnologia da Info...
22

4

Referências

Chen, Hsinchun, Roger H. L. Chiang, Veda C. Storey (2012). “Business Intelligence
and Analytics: From ...
23

5 Glossário e Acrônimos

Analytics – ferramentas, técnicas e modelos para analisar Big Data
Big Data – informação que ...
Upcoming SlideShare
Loading in …5
×

Tendências de inovações para a tecnologia de big data

812 views

Published on

0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
812
On SlideShare
0
From Embeds
0
Number of Embeds
2
Actions
Shares
0
Downloads
31
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Tendências de inovações para a tecnologia de big data

  1. 1. Tendências de Inovações para a Tecnologia de Big Data Outubro/2013 Relatório preparado pela Cysneiros Consultores Associados para a Secretaria de Ciência e Tecnologia do Estado de Pernambuco. Pesquisadores Responsáveis Tecnologias da Informação e Comunicação: José Carlos Cavalcanti
  2. 2. 2 Sumário 1 Introdução........................................................................................................................ 4 2 Análise das Tendências de Mercado em Tecnologia da Informação e Comunicação (TIC)5 2.1 Análise da Tecnologia de Big Data....................................................................................... 7 2.2 Macrotendências de Inovação Tecnológica em Big Data ................................................. 14 2.3 Recomendações às Empresas de Tecnologia da Informação e Comunicação (TIC) ..... 16 3 Conclusão....................................................................................................................... 21 4 Referências..................................................................................................................... 22 5 Glossário e Acrônimos................................................................................................... 23 Índice de Tabelas Tabela 1. Aplicações de BI&A: De Big Data para Grande Impacto .................................................................... 18
  3. 3. 3 Índice de Figuras Figura 1. Dados de busca sobre a expressão Big Data no Google Trends (do dia 14/03/2013) ........................... 8 Figura 2. Vendas mensais da Ford Figura 3. Google Trends da Ford ......................................... 10 Figura 4. IDC prevê que Big Data valerá US$ 23,8 bilhões em 2016 ................................................................. 12 Figura 5. Big Data: A Revolução Gerencial ........................................................................................................ 13 Figura 6. Visão Geral de BI&A: Evolução, Aplicações e Pesquisa Emergente. .................................................. 15 Figura 7. Capa da revista VEJA de 15/05/2013 ................................................................................................... 20
  4. 4. 4 1 Introdução Este relatório foi produzido no âmbito no projeto CICTEC - Centro de Inteligência Competitiva para Parques Tecnológicos, e apresenta as principais tendências de inovação tecnológica para o setor de Tecnologia da Informação e Comunicação (TICs) apontando oportunidades de inovação para as empresas Pernambucanas. O documento trata especificamente as oportunidades de inovação, no que se refere ao fenôneno chamado de Big data, a qual se apresenta como uma das mais importantes tecnologias de informação e comunicação recentes do mundo contemporâneo, e que gradualmente vem assumindo um papel de relevância central. Big Data está revolucionando a forma como conduzimos nossas vidas, como trabalhamos, como aprendemos, e com nos entretemos, sendo de vital importância para os negócios do setor.
  5. 5. 5 2 Análise das Tendências de Mercado em Tecnologia da Informação e Comunicação (TIC) Big Data (termo que se aplica à informação que não pode ser processada ou analisada usando processos ou ferramentas tradicionais) é uma das mais importantes tecnologias de informação e comunicação - TICs recentes do mundo contemporâneo, e está assumindo este papel de relevância em função de uma série de princípios. Tomando como referência o que é apontado no livro de Zikopoulos et. al. (2012), Big Data é importante devido a alguns princípios chave: - Soluções de Big Data são ideais para analisar não somente dados brutos estruturados, mas também data semiestruturados e dados não estruturados a partir de uma ampla variedade de fontes; - Soluções de Big Data são ideais para análises interativas e exploratórias quando medidas de negócios com dados não são pré-determinadas; - Big Data é uma tecnologia adequada para resolver desafios de informação que não podem ser tratados pelos enfoques tradicionais de bancos de dados relacionais usuais no mercado. Um das melhores maneiras de entender o desafio que vem sendo colocado por esta tendência é o tratamento de alguns problemas usuais no mundo das TICs. Tomando como referência o exemplo de Detecção de Fraudes (muito comum nas transações econômicas, marcadamente as financeiras, tais como leilões on-line, solicitação de seguros, etc.). Em qualquer lugar do mundo a existência de uma transação financeira representa um potencial para mau uso e para o espectro da fraude. Os vários desafios nos padrões de detecção de fraude são diretamente atribuídos ao uso exclusivo de tecnologias convencionais. O tema mais comum e mais recorrente que se percebe em todos os padrões de Big Data é o limite no que se pode armazenar bem como a disponibilidade de recursos computacionais para processar seus objetivos. Sem tecnologias de Big Data, estes fatores limitam o que pode ser modelado. Menos dados significam modelagem restringida. Ademais, os ambientes altamente dinâmicos têm padrões cíclicos de fraudes que podem vir e ir em horas, dias ou semanas. Se os dados usados para identificar ou
  6. 6. 6 usar novos modelos de detecção de fraudes não estiverem disponíveis com baixa latência, quando forem descobertos os novos padrões pode ser muito tarde e algum prejuízo pode já ter sido instaurado. Mas talvez o padrão de uso de Big Data mais comentado seja o das redes sociais (tais como Facebook, Twiiter, YouTube, etc.), ou da mídia social e do sentimento do consumidor. Neste caso, Big Data é usado para detectar o que os consumidores estão dizendo sobre você (e talvez o que eles estão dizendo sobre os seus competidores). Além disso, você pode usar este novo discernimento para verificar como este sentimento impacta as decisões que você está tomando e o modo como sua empresa se engaja. Mais especificamente, você pode determinar como o sentimento dos consumidores está impactando nas vendas, a efetividade ou receptividade de suas campanhas de mercado, a eficácia de seu mix de marketing (produto, preço, promoção, etc.) e por aí vai. Em resumo, Big Data está revolucionando a forma como conduzimos nossas vidas, como trabalhamos, como aprendemos, e como entretemos. Neste sentido, entender os principais aspectos das tendências recentes da inovação tecnológica em termos de Big Data é de vital importância, e constitui o principal objetivo deste documento.
  7. 7. 7 2.1 Análise da Tecnologia de Big Data Big Data não implica dizer que os dados pré-existentes são “pequenos” (o que não são) ou que seu único desafio é o seu tamanho (tamanho é apenas um deles). O termo Big Data se aplica à informação que não pode ser processada ou analisada usando processos ou ferramentas tradicionais (Zikopoulos et. al. 2012). De forma crescente, as organizações de hoje estão enfrentando mais e mais desafios de Big Data (ver sobre o explosivo crescimento do universo digital em: http://bit.ly/13QKLgj. Elas têm acesso a uma riqueza de informações, mas elas não sabem com extrair valor desta riqueza porque elas (as informações) estão em sua maioria em formato bruto, ou em formato semi desestruturado ou desestruturado; e como resultado, as organizações nem mesmo sabem se vale a pena mantêlas. Uma pesquisa recente da IBM observou que mais da metade dos atuais líderes de negócios chegaram à conclusão que eles não têm acesso aos insights (discernimentos) que eles precisam para conduzir seus trabalhos. Empresas estão enfrentando estes desafios em um ambiente onde elas têm a habilidade para armazenar qualquer coisa e elas estão gerando dados como nunca na história; de forma combinada, isto representa um desafio real de informação. Ou seja, a capacidade de processar os dados (extraindo valor) é cada vez mais um desafio a ser enfrentado. Três características definem Big Data: volume, variedade, e velocidade (os conhecidos 3 V´s). Juntas, estas características definem o que a IBM se refere à Big Data. Os Professores Hans Buhl e Maximillian Roglinger, da Universidade de Augsburg, na Alemanha, e Julia Heidemann, da empresa McKinsey da Alemanha, acrescentam outra caraterística (outro V): a da veracidade. O fenômeno do Big Data é impulsionado pela massiva redução em custo na gestão de dados, combinada com o aumento exponencial da capacidade de processamento computacional que vemos nos dias atuais. Novas tecnologias, tais como Quantum Computing, ou sistemas In Memory Database permitem a manipulação de novas dimensões de quantidades de dados rapidamente e de forma economicamente eficiente (volume e velocidade).
  8. 8. 8 Enfoques de Big Data requerem novas ferramentas tais como Analíticas Social, InMemory, Texto, ou Semântica, que permitem analisar novas quantidades de diferentes fontes de informação, por exemplo, de redes sociais, engenhos de busca, transações de pagamentos, ou todas as categorias de e-Commerce (variedade). O sucesso de Big Data é inevitavelmente relacionado com uma gestão inteligente de seleção e uso de dados, bem como esforços conjuntos em direção a regras claras com respeito à qualidade dos dados. Uma clara governança de dados e uma clara política de dados são inevitáveis para capacitar um uso de significado dos dados (veracidade). Para que se perceba a importância de Big Data como uma tecnologia emergente, basta que se observe os dados coletados pela ferramenta (de Big Data) chamada Google Trends (Figura 01 à frente). Google Trends é uma poderosa ferramenta que emergiu a partir da existência do Google, e pode ser apresentada a partir de um importante artigo recente do Prof. Hal Varian (tratado logo à frente), o qual revela sua contribuição para esta nova era de Big Data e Analítica. Figura 1. Dados de busca sobre a expressão Big Data no Google Trends (do dia 14/03/2013)
  9. 9. 9 Pode parecer uma coisa “maluca” (principalmente para os economistas mais conservadores ou que ainda estão na era pré-Internet), mas a ferramenta denominada Google Trends, ferramenta simples e gratuita baseada nos dados de buscas do Google, pode sim ajudar a prever o nível presente de atividade econômica, e há pelo menos três anos está revolucionando as análises econômicas neste novo mundo do BIG DATA e da Analytics. Quem afirma isso é nada mais nada menos do que o Prof. Hal Varian, economista internacionalmente conhecido por seus trabalhos em microeconomia, hoje aposentado pela Universidade da California, em Berkeley/EUA, e atualmente o Chief Economist Officer do Google. No ano de 2002 o Prof. Varian foi convidado por Eric Schmidt (ex- Chief Executive Officer) para ser consultor do Google. Desde então ele tem desenvolvido atividades nas áreas de projeto de leilões eletrônicos de propaganda, econometria, finanças, estratégia corporativa e política pública. Em abril 2009, em coautoria com Hyunyoung Choi, também do Google, ele escreveu (e publicou no site do Google) uma “versão beta” do artigo intitulado “Predicting the Present with Google Trends” (Prevendo o Presente com Google Trends)(artigo finalmente publicado por uma revista econômica tradicional, em 2012). Neste artigo os autores avançam a hipótese de que os dados de busca do Google podem estar correlacionados com o presente nível da atividade econômica em indústrias dadas e, por conseguinte, podem ser úteis em prever as subsequentes liberações de dados. Eles defendem que o Google Trends não ajuda a prever o futuro, mas sim ajuda a prever o presente. Como mostram os autores, o Google Trends provê um índice do volume das buscas/perguntas do Google por localização geográfica e categoria. Os dados da ferramenta não reportam o nível bruto das perguntas para um dado termo de busca. Na realidade eles reportam um “índice de pergunta” (query index). O índice de pergunta começa com a “porção de perguntas”: o volume total de perguntas por termo de busca em uma dada região geográfica, dividido pelo número total de perguntas naquela região em um ponto no tempo. Os números da participação das perguntas são então normalizados de forma que eles comecem a partir de 01 de janeiro de 2004. Números após esta data indicam um desvio percentual da porção de busca no dia 01 de janeiro de 2004.
  10. 10. 10 No artigo em questão, os autores discutem a estrutura estatística relevante à hipótese que levantam. E como exemplo, eles iniciam a análise se baseando nos dados de vendas mensais de automóveis da marca Ford de janeiro de 2004 a agosto de 2008, como reportado na revista Automobile News. Os dados do Google para a categoria Automobile/Vehicle Brands/Ford foram usados para o índice de perguntas. Para que pudessem estabelecer a correlação entre os dados de busca do Google e os dados de vendas de automóveis da marca Ford (o que pode ser, de alguma forma, visualizado pelos gráficos dos dados trabalhados, nas Figuras 02 e 03 à frente), os autores desenvolveram um modelo de projeção, conhecido na área de econometria como modelo “auto regressivo sazonal”. Em resumo, com o modelo encontrado os autores chegaram à seguinte conclusão: o coeficiente da variável Google Trends no modelo implica que 1% de aumento no volume de buscas está associado à aproximadamente 0,5% de aumento de vendas. Os autores ainda apresentam outros exemplos de correlações em outros setores econômicos, tais como vendas no varejo, vendas de imóveis e dados de viagens. Finalmente, o que pretendemos afirmar com esta breve apresentação da utilização do Google Trends é que, nos dias atuais, com o crescimento no volume, na velocidade e na variedade de dados à nossa disposição, temos que nos valer deste crescente “dilúvio de dados/informações” (e das novas ferramentas que estão emergindo concomitantemente, tais como Google Consumer Surveys, que falaremos em outra oportunidade) para extrairmos novos insights (discernimentos) a partir destes dados/informações. Figura 2. Vendas mensais da Ford Figura 3. Google Trends da Ford
  11. 11. 11 E qual é a importância econômica do Big Data como tendência tecnológica? Segundo estimativas de janeiro de 2013 da empresa IDC- International Data Corporation, Big Data representará em 2016 um mercado da ordem de US$ 24 bilhões, o que não é desprezível para um mercado ainda na sua infância (Figura 04). Como saber se Big Data é uma tendência que pode ser considerada hype ou não? Ano passado (2012) o Editor da Harvard Business Review (http://hbr.org/)(das mais prestigiosas revistas de negócios do mundo), Adi Ignatius, percebeu que estava havendo um grande interesse por big data, mas também um grande hiato de clareza sobre o tema. Logo, perguntou-se: o que diferencia “big” data de mero “data” – e como as organizações supostamente os estão usando em seus benefícios? Ele também aprendeu que muitos dos céticos ponderavam se algumas das companhias vendendo “soluções” de big data estão simplesmente capitalizando no emergente hype.
  12. 12. 12 Figura 4. IDC prevê que Big Data valerá US$ 23,8 bilhões em 2016 Neste sentido, Ignatius agrupou algumas das melhores mentes do campo para iluminar o tópico (ver edição especial collections/insight/big-data). de outubro de 2012 em http://hbr.org/special- Andrew MacAfee e Erik Brynjolfsson, ambos do MIT, apresentaram o argumento de que big data tem o potencial de revolucionar a arte de administrar (gerir). Domini Barton e David Court, da McKinsey, concordam. Eles demonstram que com o correto suporte organizacional, big data pode ajudar a propalar as companhias a níveis de desempenho que não tínhamos visto há duas décadas. Tom Davenport, Professor Visitante da Harvard Business School, e D. J. Patil, da Greylock
  13. 13. 13 Parterns, identificam cientistas de dados como tendo o “mais sexy” trabalho de nossa era e explicam como achá-los e atraí-los. Destacamos aqui apenas partes do trabalho de Andrew MacAfee e Erik Brynjolfsson (Figura 05 à frente), que se intitula “Big Data: The Management Revolution”. Os autores logo de partida argumentam que à medida que ferramentas e filosofias de big data se espalham, elas irão mudar as ideias arraigadas sobre valor da experiência, a natureza da expertise, e a prática da administração (gestão). Líderes inteligentes ao longo das indústrias irão ver que usar big data pelo que ele é: uma revolução administrativa (gerencial). Apesar de constituir um amplo conjunto de oportunidades, a tendência de Big Data traz consigo um conjunto preocupante de aspectos para um país como o Brasil. Como o país enfrenta uma série de dificuldades na “saúde de sua indústria de TICs” (como demonstrado pela sua posição no Global Network Readiness Index- NRI), e como as tecnologias de Big Data demandam uma série de competências e habilidades para sua absorção, capacitação e oferta de bens e serviços, faz-se necessário estabelecer dentro do país forças tarefas, tanto na iniciativa privada quanto nas esferas do setor público, para proporcionar o desenvolvimento das competências e habilidades compatíveis com a complexidade do Big Data. Figura 5. Big Data: A Revolução Gerencial
  14. 14. 14 2.2 Macrotendências de Inovação Tecnológica em Big Data Já que Big Data é uma tendência tecnológica que veio para ficar, quais seriam então aquelas macrotendências (em termos de novos desenvolvimentos e aplicações) que estão conformando, e estão sendo conformadas, pelo avanço do Big Data? Como pode ser visto na Figura 06 à frente, retirada de um artigo de Chen et. al. (2012), e que diz respeito à evolução de Inteligência de Negócios (Business Intelligence- BI) e Analítica (BI&A na tabela), uma grande tendência trazida pelo Big Data é a evolução da atual fase de uso dos chamados Database Management Systems – DBMS (Sistemas de Gerenciamento de Bancos de Dados), que lidam com conteúdos de dados estruturados (a etapa BI&A 1.0), para a fase BI&A 2.0, onde estão sendo (e serão ainda mais) tratados conteúdos de dados não estruturados (marcadamente baseados na Web). A fase seguinte na evolução proporcionada por Big Data será a de conteúdos baseados em artefatos móveis e em sensores (a etapa BI&A 3.0). Estas evoluções estão impactando (e impactarão ainda mais) nas aplicações de comércio eletrônico e inteligência de mercado, governo eletrônico, em política, ciência e tecnologia, saúde e bem-estar, segurança e proteção pública. Estes impactos estão fazendo emergir (e irão fazer ainda mais no futuro) novas áreas de pesquisa, tais como Analítica de Big Data, Analítica de Textos, Analítica da Web, Analítica de Redes e Analítica de Dispositivos Móveis.
  15. 15. 15 Figura 6. Visão Geral de BI&A: Evolução, Aplicações e Pesquisa Emergente. Fonte: Chen, Hsinchun, Chiang, Roger H. L., and Storey, Veda C. (2012). “Business Intelligence and Analytics: From Big Data to Big Impact”. MIS Quarterly, Vol. 36, No. 4, 1165-1188, December.
  16. 16. 16 2.3 Recomendações às Empresas de Tecnologia da Informação e Comunicação (TIC) As macrotendências abordadas no item anterior são indicativas da geração de um enorme leque de oportunidades que estão sendo (e serão ainda mais) abertas pelo crescimento da área de Big Data. Como é possível contatar na Tabela 01 à frente, retirada de Chen et. al. (2012), e tomando como exemplo o segmento econômico de comércio eletrônico e inteligência de mercado, as aplicações que estão surgindo são de variada natureza. Neste sentido, podemos destacar como novas aplicações os sistemas de recomendação, monitoramento e análise de mídia social, sistemas de crowdsourcing (onde crowd, vem de multidão, e sourcing, de práticas de contratação, tais como as de procurement, ou seja, compras, licitações, etc., e que se refere à capitalização do potencial de grandes e abertos grupos de pessoas via Internet), jogos sociais e virtuais. Em termos de dados propriamente ditos, temos os logs de busca e de usuário, registros de transações de consumidores, cujas características podem ser dados estruturados baseados na web, conteúdo gerado por usuários, rede rica em informação, e opiniões informais desestruturadas. Em relação à analítica, podemos ter ferramentas de mineração por regras de associação, segmentação de bancos de dados e clusterização, detecção de anomalias, mineração de gráficos, análise de redes sociais, analítica de texto e da web, e análise de sentimento e de afetação. Elencar oportunidades neste universo parece ser algo simples, já que o conjunto de evidências que estão surgindo sobre as “maravilhas” de Big Data não para de surgir. No entanto, nem só de oportunidades vivem os mercados, e ameaças surgem a qualquer momento. Duas que são frequentemente citadas são aquelas que dizem respeito à Segurança dos Dados e de Informações e Privacidade. No entanto, ainda é muito cedo para se tratar destas ameaças no âmbito de tecnologias tão sofisticadas como as que estão sendo aqui discutidas. De qualquer forma estas ameaças serão tratadas em maior detalhe no documento sobre cloud computing, já que este é o espaço onde estão se estruturando as maiores iniciativas de Big Data. Em resumo, estendendo a observação pontual acima conduzida para as outras áreas da Tabela 3, pode-se inferir que o universo de oportunidades que estão se abrindo com Big Data,
  17. 17. 17 tanto em escala quanto em escopo, está apontando para um novo horizonte que pode contribuir enormemente para o crescimento das empresas brasileiras em geral, e das empresas pernambucanas em particular. A emergência da tecnologia de Big Data é uma chance para todos do mundo da tecnologia decidirem em que campo eles estarão, à medida que esta área está trazendo (e trará ainda mais no futuro) a maior oportunidade para empresas e indivíduos em tecnologia desde o alvorecer da Internet.
  18. 18. 18 Tabela 1. Aplicações de BI&A: De Big Data para Grande Impacto Comércio Eletrônico e Inteligência de Mercado Ciência e Tecnologia Saúde Inteligente e Bem Estar Segurança e Defesa Pública • Sistemas de Recomendação •Serviços de governo ubíquos •Inovação em Ciência e Tecnologia •Genômica humana e de plantas • Monitoramento e Analítica de Mídia Social Aplicações Governo Eletrônico e Política 2.0 •Acesso igualitário e serviços públicos •Teste de hipóteses •Suporte à decisão em cuidados da saúde •Análise de crime; •Criminologia computacional; •Informática de terrorismo; •Inteligência de código aberto; •Segurança cibernética • Sistemas de Crowdsourcing •Jogos sociais e virtuais •Campanha política e eleição eletrônica •Logs de busca e de usuários •Informações e serviços do governo •Registros de transações de consumidores Dados •Engajamento de cidadãos e participação •Regras e regulações •Descoberta de conhecimento •Análise de comunidades de pacientes •Instrumentos de Ciência e Tecnologia e dados gerados por sistemas •Dados de genômica e de sequenciamentos •Registros eletrônicos de saúde •Registros criminais; •Mapas criminais; •Redes criminais; •Notícias e conteúdos web; •Bancos de dados de incidentes terroristas; • Vírus, ataques cibernéticos e botnets •Feedback do cidadão e comentários •Conteúdo de sensores e redes Características Características Características Características Características Conteúdo estruturado gerado pelo consumidor, baseado na web, rica informação de rede, opiniões informais não estruturadas Fontes de informação fragmentadas e sistemas legados, rico conteúdo textual, conversações informais desestruturadas de cidadãos Coleta de dados baseados em instrumentos de alto throughput, registros de múltipla modalidade e larga escala, formatos de dados específicos de Ciência e Tecnologia Conteúdos disparatados mas altamente relacionados, conteúdo específico personalizado, HIPAA, IRB e questões de ética Informação de identificação pessoal, conteúdo incompleto e desviante, informação de grupo e de redes, conteúdo de múltiplas línguas •Regra de mineração por associação •Integração de informação •Segmentação de banco e dados e clustering •Analítica de conteúdo e de texto •Modelos matemáticos e analíticos baseados em domínios específicos de Ciência e Tecnologia •Análise e visualização de genômica e sequenciamento; •Mineração e clusterização de associação de EHR; •Monitoramento e análise de mídia de saúde social; •Analítica de texto de saúde; •Regra de associação criminal em mineração e clusterização; •Análise de rede criminal; •Análise espacial-temporal e visualização; •Analítica de textos multilinguais; •Conteúdo gerado por consumidores Analítica •Detecção de anomalias •Mineração gráfica •Serviços de informação semântica de governo •Analítica de texto e web •Análise de sentimento e afetação Impactos •Monitoramento e analítica de mídia social •Análise de sentimento e afetação Marketing da caudalonga e recomendações personalizadas, venda aumentada e satisfação do consumidor Transformando governos, empoderando cidadãos, melhorando transparência, participação e igualdade •Mídia social de saúde e de pacientes •Análise de sentimento e afetação •Análise e distribuição de ataques cibernéticos •Ontologias de saúde •Análise de rede de pacientes •Avanços de Ciência e Tecnologia, impacto científico •Qualidade melhorada dos cuidados da saúde, cuidado de longo prazo melhorado, empoderamento do paciente Melhoria na segurança e defesa públicas
  19. 19. 19 Segundo Zikopoulos et. al. (2012), desde a virada deste milênio: - 80% (oitenta por cento) da informação do mundo é desestruturada; - A informação desestruturada cresce 15 (quinze) vezes mais do que a taxa da informação estruturada; - O poder computacional bruto está crescendo a uma taxa tão grande hoje uma caixa tirada de uma prateleira hoje está começando a mostrar um poder que um supercomputador mostrava uma década atrás; - O acesso à informação tem se democratizado: ele é (e deve ser) disponível a todos. Este é o novo “normal” do nosso cotidiano e para o qual Big Data se apresenta como uma gigantesca resposta a estes desafios. E pensando no futuro, e na evolução das TICs no Brasil como um todo, e em Pernambuco em particular, este documento procurou focar sua atenção para Big Data. E como foi possível registrar, Big Data, em seus complexos aspectos de volume, variedade, velocidade e veracidade, constitui uma grande oportunidade tecnológica e econômica, bem como uma revolução gerencial, que está trazendo um amplíssimo conjunto de novas fronteiras para o desenvolvimento de novos produtos e serviços, que podem contribuir enormemente para o presente e para o futuro das nossas empresas brasileiras e pernambucanas em primeiro lugar, e, no limite, para o bem estar de suas populações. A título de exemplo de como Big Data está se tornando popular, basta que se mencione recente matéria da revista VEJA, de 15/05/2013 (Figura 07 a seguir), onde o tema de Big Data além ter sido capa desta popular revista, ocupou 11 (onze) páginas da edição e foi alçado à importância da emergência da Internet. Nesta matéria, entre vários exemplos que foram citados do uso de Big Data, um chama especial atenção. Segundo a revista, Big Data oferece significado, correlação, mas não oferece a causa dos eventos. E cita uma pesquisa da Universidade de Cambridge (Inglaterra), com base em dados de 58.000 usuários do Facebook, descobriu uma relação inusitada: pessoas com alto QI (Quociente de Inteligência) têm apreço especial pela voz do ator norte-americano Morgan Freeman. Por quê? Ninguém sabe! De toda forma, este exemplo é apenas um daqueles interessantes que o fenômeno do Big Data proporciona aos seus usuários. Como enfatizado aqui neste documento, cabe às
  20. 20. 20 empresas encontrarem nos seus dados (ou nos dados dos seus clientes) as associações e correlações que possibilitem a obtenção de mais vantagens aos seus negócios. Figura 7. Capa da revista VEJA de 15/05/2013
  21. 21. 21 3 Conclusão Neste documento, foram apresentadas tendências de inovação tecnológica nos setores de Tecnologia da Informação e Comunicação (TICs) apontando oportunidades de inovação para as empresas Pernambucanas. Apresentamos as tecnologias de Big Data e as novas possibilidades de produção de inteligências a partir da análise de dados semiestruturados. Assim, percebemos que o fenômeno do Big Data é impulsionado pela massiva redução em custo na gestão de dados, combinada com o aumento exponencial da capacidade de processamento computacional que vemos nos dias atuais. Enfoques de Big Data também requerem novas ferramentas tais como Analíticas Social, ou Semântica, que permitem analisar novas quantidades de diferentes fontes de informação, por exemplo, de redes sociais, engenhos de busca, transações de pagamentos, ou todas as categorias de e-Commerce. Por fim, o sucesso de Big Data é inevitavelmente relacionado com uma gestão inteligente de seleção e uso de dados, bem como esforços conjuntos em direção a regras claras com respeito à qualidade desses dados. Uma clara política e clara governança de dados são inevitáveis para capacitar um uso de significado dos dados, com o exponencial crescimento na geração de dados pelos mais diversos dispositivos, abre-se um amplo leque de oportunidades de produção de inteligências competitiva.
  22. 22. 22 4 Referências Chen, Hsinchun, Roger H. L. Chiang, Veda C. Storey (2012). “Business Intelligence and Analytics: From Big Data to Big Impact”. MIS Quarterly, Vol. 36, No. 4, 1165-1188, December. Hyunyoung Choi and Hal Varian (2012). “Predicting the Present with Google Trends”. The Economic Record, Vol. 88, Special Issue, June, 2-9. Zikopoulos, Paul C, Cris Eaton, Dirk deRoos, Thomas Deutsch, George Lapis (2012). “Understanding Big Data; Analytics for Enterprise Class Hadoop and Streaming Data”. McGrawHill.
  23. 23. 23 5 Glossário e Acrônimos Analytics – ferramentas, técnicas e modelos para analisar Big Data Big Data – informação que não pode ser processada ou analisada por processos ou ferramentas tradicionais NRI- networked readiness index (índice de preparo em rede) TI- tecnologias de informação TICs - tecnologias de informação e comunicação

×