SlideShare uma empresa Scribd logo
1 de 79
O que é Web 3.0?
“A Web Semântica é uma extensão da Web
corrente na qual é adicionada a informação
a representação do seu significado, visando
facilitar computadores e pessoas trabalhar
de maneira cooperativa.”
[Berners-Lee et al, 2001]
Web
1
2
3
.
.
.
1
2
?
3
Qual a relação com o
Linked / Open e Big Data?
Linked Data
Linked Data is the term used to describe a method of
exposing and connecting data on the Web from different
sources. Currently, the Web uses hypertext links that
allow people to move from one document to another. The
idea behind Linked Data is that hyperdata links will let
people or machines find related data on the Web that was
not previously linked.
http://www.webopedia.com/TERM/L/Linked_Data.html
Dados ligados
“Termo usado para descrever um método de expor e
conectar dados na Web a partir de diferentes fontes. A
Web atual usa links em hipertexto que permite ir de um
documento para outro. A idéia por traz do Linked Data é
que pessoas e máquinas poderão encontrar relações
entre dados que não haviam sido explicitamente ligados
por links”
Tradução livre
Open Data
“Open data and content can be freely used, modified, and
shared by anyone for any purpose”
http://opendefinition.org/
Dados abertos
“Dados abertos podem ser livremente usados,
modificados e compartilhados por qualquer um, não
importando o propósito”
Tradução livre
Linked Data
Linked / Open Data
Linked / Open Data
Linked / Open Data
Linked / Open Data
Formas de acesso
• Download de arquivos
TXT, CSV, XML, XLS, PDF, JSON, Turtle, RDF
• APIs que retornam JSON
• Endpoint SPARQL
que podem retornar RDF, TURTLE ou JSON-LD
Sparql
SPARQL Protocol and RDF Query Language)
Sparql
# Busca os dados de Tim Berners-Lee
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name ?email
FROM <http://www.w3.org/People/Berners-Lee/card>
WHERE {
?person a foaf:Person.
?person foaf:name ?name.
?person foaf:mbox ?email.
}
Resultado
{
"head": {
"vars": [ "name" , "email" ]
} ,
"results": {
"bindings": [
{
"name": { "type": "literal" , "value": "Timothy Berners-Lee" } ,
"email": { "type": "uri" , "value": "mailto:timbl@w3.org" }
}
]
}
}
Sparql
SELECT ?label ?criterio ?peso
FROM <http://aquare.la/mec/benchmark>
WHERE {
?iniciativa rdf:type mec:Iniciativa .
OPTIONAl { ?iniciativa rdfs:label> ?label }
OPTIONAL {
?iniciativa mec:temCriterio ?criterio .
?criterio mec:temPeso ?peso .
}
}
RDF
Resource Descriptor Framework
RDF
Resource Descriptor Framework
OWL
Ontology Web Language
Sparql
# Busca os dados de Tim Berners-Lee
PREFIX foaf: <http://xmlns.com/foaf/0.1/>
SELECT ?name ?email
FROM <http://www.w3.org/People/Berners-Lee/card>
WHERE {
?person a foaf:Person.
?person foaf:name ?name.
?person foaf:mbox ?email.
}
Linked / Open, e o Big Data?
Big Data trata-se de um patrimônio informacional em
grande volume, velocidade e variedade, o qual requer
formas inovadoras e sustentáveis economicamente de
processamento de forma a se promover a descoberta
de insights, a tomada decisão e a otimização de
processos.
Tradução livre
Big Data trata-se de um patrimônio informacional em
grande volume, velocidade e variedade, o qual requer
formas inovadoras e sustentáveis economicamente de
processamento de forma a se promover a descoberta
de insights, a tomada decisão e a otimização de
processos.
Tradução livre
Big Data trata-se de um patrimônio informacional em
grande volume, velocidade e variedade, o qual requer
formas inovadoras e sustentáveis economicamente de
processamento de forma a se promover a descoberta
de insights, a tomada decisão e a otimização de
processos.
Tradução livre
Big Data trata-se de um patrimônio informacional em
grande volume, velocidade e variedade, o qual requer
formas inovadoras e sustentáveis economicamente de
processamento de forma a se promover a descoberta
de insights, a tomada decisão e a otimização de
processos.
Tradução livre
Machine Learning
Machine Learning
Abordagem supervisionada
Redes neurais
Redes Bayesianas
Raciocínio baseado em casos (RBC)
Inductive logic programming
Classificadores ( ex: k-nearest neighbors )
Árvores de decisão
Clustering (com treinamento)
Não supervisionada
Redes neurais SOM (Self-organizing map)
Clustering (sem treinamento)
Machine Learning
Abordagem supervisionada
Redes neurais
Redes Bayesianas
Raciocínio baseado em casos (RBC)
Inductive logic programming
Classificadores ( ex: k-nearest neighbors )
Árvores de decisão
Clustering (com treinamento)
Não supervisionada
Redes neurais SOM (Self-organizing map)
Clustering (sem treinamento)
Machine Learning
Abordagem supervisionada
Redes neurais
Redes Bayesianas
Raciocínio baseado em casos (RBC)
Inductive logic programming
Classificadores ( ex: k-nearest neighbors )
Árvores de decisão
Clustering (com treinamento)
Não supervisionada
Redes neurais SOM (Self-organizing map)
Clustering (sem treinamento)
Machine Learning
Abordagem supervisionada
Redes neurais
Redes Bayesianas
Raciocínio baseado em casos (RBC)
Inductive logic programming
Classificadores ( ex: k-nearest neighbors )
Árvores de decisão
Clustering (com treinamento)
Não supervisionada
Redes neurais SOM (Self-organizing map)
Clustering (sem treinamento)
Machine Learning
Abordagem supervisionada
Redes neurais
Redes Bayesianas
Raciocínio baseado em casos (RBC)
Inductive logic programming
Classificadores ( ex: k-nearest neighbors )
Árvores de decisão
Clustering (com treinamento)
Não supervisionada
Redes neurais SOM (Self-organizing map)
Clustering (sem treinamento)
Machine Learning
Abordagem supervisionada
Redes neurais
Redes Bayesianas
Raciocínio baseado em casos (RBC)
Inductive logic programming
Classificadores ( ex: k-nearest neighbors )
Árvores de decisão
Clustering (com treinamento)
Não supervisionada
Redes neurais SOM (Self-organizing map)
Clustering (sem treinamento)
Machine Learning
Abordagem supervisionada
Redes neurais
Redes Bayesianas
Raciocínio baseado em casos (RBC)
Inductive logic programming
Classificadores ( ex: k-nearest neighbors )
Árvores de decisão
Clustering (com treinamento)
Não supervisionada
Redes neurais SOM (Self-organizing map)
Clustering (sem treinamento)
Machine Learning
Abordagem supervisionada
Redes neurais
Redes Bayesianas
Raciocínio baseado em casos (RBC)
Inductive logic programming
Classificadores ( ex: k-nearest neighbors )
Árvores de decisão (ex: C4.5, Apriori)
Clustering (com treinamento)
Não supervisionada
Redes neurais SOM (Self-organizing map)
Clustering (sem treinamento)
Machine Learning
Abordagem supervisionada
Redes neurais
Redes Bayesianas
Raciocínio baseado em casos (RBC)
Inductive logic programming
Classificadores ( ex: k-nearest neighbors )
Árvores de decisão
Clustering (com treinamento)
Não supervisionada
Redes neurais SOM (Self-organizing map)
Clustering (sem treinamento)
Machine Learning
Abordagem supervisionada
Redes neurais
Redes Bayesianas
Raciocínio baseado em casos (RBC)
Inductive logic programming
Classificadores ( ex: k-nearest neighbors )
Árvores de decisão
Clustering (com treinamento)
Não supervisionada
Redes neurais SOM (Self-organizing map)
Clustering (sem treinamento)
Machine Learning
Abordagem supervisionada
Redes neurais
Redes Bayesianas
Raciocínio baseado em casos (RBC)
Inductive logic programming
Classificadores ( ex: k-nearest neighbors )
Árvores de decisão
Clustering (com treinamento)
Não supervisionada
Redes neurais SOM (Self-organizing map)
Clustering (sem treinamento)
E seu eu precisar ou quiser
criar meu próprio algoritmo
de machine learning?
Scala
Java
Scala – algumas virtudes
• Tipagem estática e inferida
• Paradigma funcional (Monads) + OO
• Aproveita toda a infraestrutura Java
• Estruturas de dados e de controle otimizadas para o
tratamento matemático
• Modelo de paralelização e distribuição descomplicados
• Akka.io + Apache Spark (até 100 x mais rápido que o Hadoop)
• Código menos verboso (cada toque de teclada conta)
Case: G-Cluster
Pequeno teste
Pequeno teste
Algoritmos
•CobWeb
•DBSCAN
•FarthestFirst
•FilteredClusterer
•HierarchicalClusterer
•MakeDensityBasedClusterer
•OPTICS
•sIB
•SimpleKMeans
•Xmeans
•EM
Os melhores resultados
Será que posso confiar a
estratégia de minha empresa
nesses resultados?
G-Cluster
Outro teste
Iris setosa Iris versicolor Iris virginica
Iris dataset
Iris dataset - Resultados
Algoritmo Resultado
•CobWeb 2 espécies
•DBSCAN Nenhuma espécie
•FarthestFirst 2 espécies
•FilteredClusterer 2 espécies
•HierarchicalClusterer 2 espécies
•MakeDensityBasedClustere
r
2 espécies
•OPTICS Nenhuma espécie
•sIB 2 espécies
•SimpleKMeans 2 espécies
•Xmeans 2 espécies
•EM 5 espécies
•G-Cluster 3 espécies
Iris dataset - Resultados
The use of this data set in cluster analysis however is
uncommon, since the data set only contains two clusters with
rather obvious separation. One of the clusters contains Iris
setosa, while the other cluster contains both Iris virginica and
Iris versicolor and is not separable without the species
information Fisher used. This makes the data set a good
example to explain the difference between supervised and
unsupervised techniques in data mining: Fisher's linear
discriminant model can only be obtained when the object
species are known: class labels and clusters are not necessarily
the same.[5]
Iris dataset - Resultados
The use of this data set in cluster analysis however is
uncommon, since the data set only contains two clusters with
rather obvious separation. One of the clusters contains Iris
setosa, while the other cluster contains both Iris virginica and
Iris versicolor and is not separable without the species
information Fisher used. This makes the data set a good
example to explain the difference between supervised and
unsupervised techniques in data mining: Fisher's linear
discriminant model can only be obtained when the object
species are known: class labels and clusters are not necessarily
the same.[5]
Iris dataset - Resultados
The use of this data set in cluster analysis however is
uncommon, since the data set only contains two clusters with
rather obvious separation. One of the clusters contains Iris
setosa, while the other cluster contains both Iris virginica and
Iris versicolor and is not separable without the species
information Fisher used. This makes the data set a good
example to explain the difference between supervised and
unsupervised techniques in data mining: Fisher's linear
discriminant model can only be obtained when the object
species are known: class labels and clusters are not necessarily
the same.[5]
Iris dataset - Resultados
The use of this data set in cluster analysis however is
uncommon, since the data set only contains two clusters with
rather obvious separation. One of the clusters contains Iris
setosa, while the other cluster contains both Iris virginica and
Iris versicolor and is not separable without the species
information Fisher used. This makes the data set a good
example to explain the difference between supervised and
unsupervised techniques in data mining: Fisher's linear
discriminant model can only be obtained when the object
species are known: class labels and clusters are not necessarily
the same.[5]
Scala - Snippets
Outros testes em andamento
Retomando
Qual a relação do Big / Open / Linked Data +
Machine Learning
com a Web 3.0?
Obrigado!
E-mail
marcos@aquare.la
Twitter
@marcos_hs
Facebook
https://www.facebook.com/aquarela.innovation
Blog
http://aquare.la/pt/artigos/
Artigos e inf. de cursos
Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)

Mais conteúdo relacionado

Semelhante a Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)

Obtendo Informação Útil em Dados Semi-Estruturados da Web
Obtendo Informação Útil em Dados Semi-Estruturados da WebObtendo Informação Útil em Dados Semi-Estruturados da Web
Obtendo Informação Útil em Dados Semi-Estruturados da WebLuiz Matos
 
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...Christiano Avila
 
PostgreSQL-Prático.pdf
PostgreSQL-Prático.pdfPostgreSQL-Prático.pdf
PostgreSQL-Prático.pdfArleiEvaristo
 
Sistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebSistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebFernando Hideo Fukuda
 
Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Avelino Ferreira Gomes Filho
 
01 banco de dados-basico
01 banco de dados-basico01 banco de dados-basico
01 banco de dados-basicoAmadeo Santos
 
Redes Complexas (2009)
Redes Complexas (2009)Redes Complexas (2009)
Redes Complexas (2009)Rafael Dahis
 
Modelos de banco de dados
Modelos de banco de dadosModelos de banco de dados
Modelos de banco de dadosEdgar Stuart
 
TDC2016POA | Trilha PHP - Desenvolvendo um buscador com PHP e Elasticsearch
TDC2016POA | Trilha PHP - Desenvolvendo um buscador com PHP e ElasticsearchTDC2016POA | Trilha PHP - Desenvolvendo um buscador com PHP e Elasticsearch
TDC2016POA | Trilha PHP - Desenvolvendo um buscador com PHP e Elasticsearchtdc-globalcode
 
Desenvolvendo um buscador com PHP e Elasticsearch - Fernando Silva - Tchelinu...
Desenvolvendo um buscador com PHP e Elasticsearch - Fernando Silva - Tchelinu...Desenvolvendo um buscador com PHP e Elasticsearch - Fernando Silva - Tchelinu...
Desenvolvendo um buscador com PHP e Elasticsearch - Fernando Silva - Tchelinu...Tchelinux
 
Nosql e BD Orientados a Documentos
Nosql e BD Orientados a DocumentosNosql e BD Orientados a Documentos
Nosql e BD Orientados a DocumentosYuri Adams
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharepccdias
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceLuca Bastos
 
PHP Conference 2017: Como melhorar seu código com Laravel Collections
PHP Conference 2017: Como melhorar seu código com Laravel CollectionsPHP Conference 2017: Como melhorar seu código com Laravel Collections
PHP Conference 2017: Como melhorar seu código com Laravel CollectionsAryel Tupinambá
 

Semelhante a Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica) (20)

Obtendo Informação Útil em Dados Semi-Estruturados da Web
Obtendo Informação Útil em Dados Semi-Estruturados da WebObtendo Informação Útil em Dados Semi-Estruturados da Web
Obtendo Informação Útil em Dados Semi-Estruturados da Web
 
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
Desenvolvimento de um Sistema de Recomendação de Artigos Científicos e Avalia...
 
MAC5855 - NoSQL
MAC5855 - NoSQLMAC5855 - NoSQL
MAC5855 - NoSQL
 
PostgreSQL-Prático.pdf
PostgreSQL-Prático.pdfPostgreSQL-Prático.pdf
PostgreSQL-Prático.pdf
 
Bigadata casese opotunidades
Bigadata casese opotunidadesBigadata casese opotunidades
Bigadata casese opotunidades
 
Sistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da WebSistemas Inteligentes para Textos da Web
Sistemas Inteligentes para Textos da Web
 
Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...Resumo sobre Recovering from a decade: a systematic mapping of information re...
Resumo sobre Recovering from a decade: a systematic mapping of information re...
 
01 banco de dados-basico
01 banco de dados-basico01 banco de dados-basico
01 banco de dados-basico
 
Artigo tecnico RNA Iris
Artigo tecnico RNA IrisArtigo tecnico RNA Iris
Artigo tecnico RNA Iris
 
ID3 Algorithm
ID3 AlgorithmID3 Algorithm
ID3 Algorithm
 
Redes Complexas (2009)
Redes Complexas (2009)Redes Complexas (2009)
Redes Complexas (2009)
 
Modelos de banco de dados
Modelos de banco de dadosModelos de banco de dados
Modelos de banco de dados
 
TDC2016POA | Trilha PHP - Desenvolvendo um buscador com PHP e Elasticsearch
TDC2016POA | Trilha PHP - Desenvolvendo um buscador com PHP e ElasticsearchTDC2016POA | Trilha PHP - Desenvolvendo um buscador com PHP e Elasticsearch
TDC2016POA | Trilha PHP - Desenvolvendo um buscador com PHP e Elasticsearch
 
Desenvolvendo um buscador com PHP e Elasticsearch - Fernando Silva - Tchelinu...
Desenvolvendo um buscador com PHP e Elasticsearch - Fernando Silva - Tchelinu...Desenvolvendo um buscador com PHP e Elasticsearch - Fernando Silva - Tchelinu...
Desenvolvendo um buscador com PHP e Elasticsearch - Fernando Silva - Tchelinu...
 
Metadados: dados a respeito de dados
Metadados: dados a respeito de dadosMetadados: dados a respeito de dados
Metadados: dados a respeito de dados
 
Nosql e BD Orientados a Documentos
Nosql e BD Orientados a DocumentosNosql e BD Orientados a Documentos
Nosql e BD Orientados a Documentos
 
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslidesharePalestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
Palestra big data_e_mineracao_dedados_5agosto13-versaoslideshare
 
Machine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ceMachine learning java ce conference 2012 - fortaleza ce
Machine learning java ce conference 2012 - fortaleza ce
 
Workshop MongoDB
Workshop MongoDBWorkshop MongoDB
Workshop MongoDB
 
PHP Conference 2017: Como melhorar seu código com Laravel Collections
PHP Conference 2017: Como melhorar seu código com Laravel CollectionsPHP Conference 2017: Como melhorar seu código com Laravel Collections
PHP Conference 2017: Como melhorar seu código com Laravel Collections
 

Big, Open e Linked Data no caminho para a Web 3.0 (Web Semântica)

  • 1.
  • 2. O que é Web 3.0?
  • 3.
  • 4. “A Web Semântica é uma extensão da Web corrente na qual é adicionada a informação a representação do seu significado, visando facilitar computadores e pessoas trabalhar de maneira cooperativa.” [Berners-Lee et al, 2001]
  • 6. 1
  • 7. 2
  • 8. ? 3
  • 9. Qual a relação com o Linked / Open e Big Data?
  • 10. Linked Data Linked Data is the term used to describe a method of exposing and connecting data on the Web from different sources. Currently, the Web uses hypertext links that allow people to move from one document to another. The idea behind Linked Data is that hyperdata links will let people or machines find related data on the Web that was not previously linked. http://www.webopedia.com/TERM/L/Linked_Data.html
  • 11. Dados ligados “Termo usado para descrever um método de expor e conectar dados na Web a partir de diferentes fontes. A Web atual usa links em hipertexto que permite ir de um documento para outro. A idéia por traz do Linked Data é que pessoas e máquinas poderão encontrar relações entre dados que não haviam sido explicitamente ligados por links” Tradução livre
  • 12. Open Data “Open data and content can be freely used, modified, and shared by anyone for any purpose” http://opendefinition.org/
  • 13. Dados abertos “Dados abertos podem ser livremente usados, modificados e compartilhados por qualquer um, não importando o propósito” Tradução livre
  • 14.
  • 20.
  • 21.
  • 22. Formas de acesso • Download de arquivos TXT, CSV, XML, XLS, PDF, JSON, Turtle, RDF • APIs que retornam JSON • Endpoint SPARQL que podem retornar RDF, TURTLE ou JSON-LD
  • 23.
  • 24.
  • 25.
  • 26. Sparql SPARQL Protocol and RDF Query Language)
  • 27. Sparql # Busca os dados de Tim Berners-Lee PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?name ?email FROM <http://www.w3.org/People/Berners-Lee/card> WHERE { ?person a foaf:Person. ?person foaf:name ?name. ?person foaf:mbox ?email. }
  • 28. Resultado { "head": { "vars": [ "name" , "email" ] } , "results": { "bindings": [ { "name": { "type": "literal" , "value": "Timothy Berners-Lee" } , "email": { "type": "uri" , "value": "mailto:timbl@w3.org" } } ] } }
  • 29. Sparql SELECT ?label ?criterio ?peso FROM <http://aquare.la/mec/benchmark> WHERE { ?iniciativa rdf:type mec:Iniciativa . OPTIONAl { ?iniciativa rdfs:label> ?label } OPTIONAL { ?iniciativa mec:temCriterio ?criterio . ?criterio mec:temPeso ?peso . } }
  • 33.
  • 34. Sparql # Busca os dados de Tim Berners-Lee PREFIX foaf: <http://xmlns.com/foaf/0.1/> SELECT ?name ?email FROM <http://www.w3.org/People/Berners-Lee/card> WHERE { ?person a foaf:Person. ?person foaf:name ?name. ?person foaf:mbox ?email. }
  • 35.
  • 36. Linked / Open, e o Big Data?
  • 37.
  • 38. Big Data trata-se de um patrimônio informacional em grande volume, velocidade e variedade, o qual requer formas inovadoras e sustentáveis economicamente de processamento de forma a se promover a descoberta de insights, a tomada decisão e a otimização de processos. Tradução livre
  • 39.
  • 40.
  • 41.
  • 42. Big Data trata-se de um patrimônio informacional em grande volume, velocidade e variedade, o qual requer formas inovadoras e sustentáveis economicamente de processamento de forma a se promover a descoberta de insights, a tomada decisão e a otimização de processos. Tradução livre
  • 43. Big Data trata-se de um patrimônio informacional em grande volume, velocidade e variedade, o qual requer formas inovadoras e sustentáveis economicamente de processamento de forma a se promover a descoberta de insights, a tomada decisão e a otimização de processos. Tradução livre
  • 44. Big Data trata-se de um patrimônio informacional em grande volume, velocidade e variedade, o qual requer formas inovadoras e sustentáveis economicamente de processamento de forma a se promover a descoberta de insights, a tomada decisão e a otimização de processos. Tradução livre
  • 46. Machine Learning Abordagem supervisionada Redes neurais Redes Bayesianas Raciocínio baseado em casos (RBC) Inductive logic programming Classificadores ( ex: k-nearest neighbors ) Árvores de decisão Clustering (com treinamento) Não supervisionada Redes neurais SOM (Self-organizing map) Clustering (sem treinamento)
  • 47. Machine Learning Abordagem supervisionada Redes neurais Redes Bayesianas Raciocínio baseado em casos (RBC) Inductive logic programming Classificadores ( ex: k-nearest neighbors ) Árvores de decisão Clustering (com treinamento) Não supervisionada Redes neurais SOM (Self-organizing map) Clustering (sem treinamento)
  • 48. Machine Learning Abordagem supervisionada Redes neurais Redes Bayesianas Raciocínio baseado em casos (RBC) Inductive logic programming Classificadores ( ex: k-nearest neighbors ) Árvores de decisão Clustering (com treinamento) Não supervisionada Redes neurais SOM (Self-organizing map) Clustering (sem treinamento)
  • 49. Machine Learning Abordagem supervisionada Redes neurais Redes Bayesianas Raciocínio baseado em casos (RBC) Inductive logic programming Classificadores ( ex: k-nearest neighbors ) Árvores de decisão Clustering (com treinamento) Não supervisionada Redes neurais SOM (Self-organizing map) Clustering (sem treinamento)
  • 50. Machine Learning Abordagem supervisionada Redes neurais Redes Bayesianas Raciocínio baseado em casos (RBC) Inductive logic programming Classificadores ( ex: k-nearest neighbors ) Árvores de decisão Clustering (com treinamento) Não supervisionada Redes neurais SOM (Self-organizing map) Clustering (sem treinamento)
  • 51. Machine Learning Abordagem supervisionada Redes neurais Redes Bayesianas Raciocínio baseado em casos (RBC) Inductive logic programming Classificadores ( ex: k-nearest neighbors ) Árvores de decisão Clustering (com treinamento) Não supervisionada Redes neurais SOM (Self-organizing map) Clustering (sem treinamento)
  • 52. Machine Learning Abordagem supervisionada Redes neurais Redes Bayesianas Raciocínio baseado em casos (RBC) Inductive logic programming Classificadores ( ex: k-nearest neighbors ) Árvores de decisão Clustering (com treinamento) Não supervisionada Redes neurais SOM (Self-organizing map) Clustering (sem treinamento)
  • 53. Machine Learning Abordagem supervisionada Redes neurais Redes Bayesianas Raciocínio baseado em casos (RBC) Inductive logic programming Classificadores ( ex: k-nearest neighbors ) Árvores de decisão (ex: C4.5, Apriori) Clustering (com treinamento) Não supervisionada Redes neurais SOM (Self-organizing map) Clustering (sem treinamento)
  • 54. Machine Learning Abordagem supervisionada Redes neurais Redes Bayesianas Raciocínio baseado em casos (RBC) Inductive logic programming Classificadores ( ex: k-nearest neighbors ) Árvores de decisão Clustering (com treinamento) Não supervisionada Redes neurais SOM (Self-organizing map) Clustering (sem treinamento)
  • 55. Machine Learning Abordagem supervisionada Redes neurais Redes Bayesianas Raciocínio baseado em casos (RBC) Inductive logic programming Classificadores ( ex: k-nearest neighbors ) Árvores de decisão Clustering (com treinamento) Não supervisionada Redes neurais SOM (Self-organizing map) Clustering (sem treinamento)
  • 56. Machine Learning Abordagem supervisionada Redes neurais Redes Bayesianas Raciocínio baseado em casos (RBC) Inductive logic programming Classificadores ( ex: k-nearest neighbors ) Árvores de decisão Clustering (com treinamento) Não supervisionada Redes neurais SOM (Self-organizing map) Clustering (sem treinamento)
  • 57.
  • 58. E seu eu precisar ou quiser criar meu próprio algoritmo de machine learning?
  • 60. Scala – algumas virtudes • Tipagem estática e inferida • Paradigma funcional (Monads) + OO • Aproveita toda a infraestrutura Java • Estruturas de dados e de controle otimizadas para o tratamento matemático • Modelo de paralelização e distribuição descomplicados • Akka.io + Apache Spark (até 100 x mais rápido que o Hadoop) • Código menos verboso (cada toque de teclada conta)
  • 65. Será que posso confiar a estratégia de minha empresa nesses resultados?
  • 67. Outro teste Iris setosa Iris versicolor Iris virginica
  • 69.
  • 70. Iris dataset - Resultados Algoritmo Resultado •CobWeb 2 espécies •DBSCAN Nenhuma espécie •FarthestFirst 2 espécies •FilteredClusterer 2 espécies •HierarchicalClusterer 2 espécies •MakeDensityBasedClustere r 2 espécies •OPTICS Nenhuma espécie •sIB 2 espécies •SimpleKMeans 2 espécies •Xmeans 2 espécies •EM 5 espécies •G-Cluster 3 espécies
  • 71. Iris dataset - Resultados The use of this data set in cluster analysis however is uncommon, since the data set only contains two clusters with rather obvious separation. One of the clusters contains Iris setosa, while the other cluster contains both Iris virginica and Iris versicolor and is not separable without the species information Fisher used. This makes the data set a good example to explain the difference between supervised and unsupervised techniques in data mining: Fisher's linear discriminant model can only be obtained when the object species are known: class labels and clusters are not necessarily the same.[5]
  • 72. Iris dataset - Resultados The use of this data set in cluster analysis however is uncommon, since the data set only contains two clusters with rather obvious separation. One of the clusters contains Iris setosa, while the other cluster contains both Iris virginica and Iris versicolor and is not separable without the species information Fisher used. This makes the data set a good example to explain the difference between supervised and unsupervised techniques in data mining: Fisher's linear discriminant model can only be obtained when the object species are known: class labels and clusters are not necessarily the same.[5]
  • 73. Iris dataset - Resultados The use of this data set in cluster analysis however is uncommon, since the data set only contains two clusters with rather obvious separation. One of the clusters contains Iris setosa, while the other cluster contains both Iris virginica and Iris versicolor and is not separable without the species information Fisher used. This makes the data set a good example to explain the difference between supervised and unsupervised techniques in data mining: Fisher's linear discriminant model can only be obtained when the object species are known: class labels and clusters are not necessarily the same.[5]
  • 74. Iris dataset - Resultados The use of this data set in cluster analysis however is uncommon, since the data set only contains two clusters with rather obvious separation. One of the clusters contains Iris setosa, while the other cluster contains both Iris virginica and Iris versicolor and is not separable without the species information Fisher used. This makes the data set a good example to explain the difference between supervised and unsupervised techniques in data mining: Fisher's linear discriminant model can only be obtained when the object species are known: class labels and clusters are not necessarily the same.[5]
  • 76. Outros testes em andamento
  • 77. Retomando Qual a relação do Big / Open / Linked Data + Machine Learning com a Web 3.0?