Your SlideShare is downloading. ×

Papo Sobre Web Semântica

5,615

Published on

A Web Semântica vem como "carro chefe" da terceira grande onda da Web, que traz também consigo novidades como Cloud Computing, Ubiquidade e RTWApps. Esta palestra mostra o esforço tecnológico que vem …

A Web Semântica vem como "carro chefe" da terceira grande onda da Web, que traz também consigo novidades como Cloud Computing, Ubiquidade e RTWApps. Esta palestra mostra o esforço tecnológico que vem sendo feito no desenvolvimento da plataforma para a mesma, as possibilidades de aplicações que se abririam, as dificuldades de sua implantação e os próximo passo em sua direção: um movimento social "open-data".

Published in: Technology, Education
1 Comment
4 Likes
Statistics
Notes
No Downloads
Views
Total Views
5,615
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
76
Comments
1
Likes
4
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Um papo sobre Web Semântica Eduardo Nicola F. Zagari zagari em abril com br NIH - Núcleo de Engenharia e Pesquisa Abril Digital São Paulo, 09/11/2009 Monday, November 9, 2009
  • 2. Sumário Apresentação do NIH Introdução Abordagens Aplicações Tecnologias para Anotação de Conteúdo: RDF, Microformatos, RDFa, OWL, SPARQL NLP e Extração de Entidades Considerações Finais Eduardo Nicola Zagari Monday, November 9, 2009
  • 3. NIH • Monitorar de forma sistemática novas técnicas, linguagens, interfaces, arcabouços e sistemas computacionais utilizados na Web que possam ser implantados em nossos produtos; • Desenvolver Novos Serviços de Inteligência Computacional, de Infraestrutura de Backend e de Interfaces Visuais para nossos produtos; • Investigar novas soluções algorítmicas, técnicas e de interfaces para problemas das novas features, proposta, prototipação e avaliação das mesmas e • Disseminar dentro da ABD os conhecimentos adquiridos na área, através de Tech Talks e/ou treinamentos. Eduardo Nicola Zagari Monday, November 9, 2009
  • 4. NIH Bibliotecas compartilhadas por serviços (Runner, HTMLParsing, Instrumentation, Stats etc) Flash Cassino, Veja Lua, Handler-Uploader de Imagens Classificador Automático Super Robot NER, Visualização de Grandes Massas de Dados Eduardo Nicola Zagari Monday, November 9, 2009
  • 5. NIH Definição na Wikipedia: a term used to describe persistent social, corporate or institutional culture that avoids using or buying already existing products, research or knowledge because of its different origins. It is normally used in a pejorative sense. a term and label developed in the computer industry referring to organizations incapable of using technology from other organizations. Eduardo Nicola Zagari Monday, November 9, 2009
  • 6. Introdução No começo, existia a Web e as pessoas gostavam de surfar por suas páginas, trocar e-mails, fazer programas para suas empresas... A vida era boa... Só que um dia, as “pessoas” começaram a gostar tanto dela, que resolveram usar seu conteúdo de novas formas... Mas a Web foi feita para compartilhar documentos e não os dados internos de suas páginas... E estas “pessoas” ficaram tristes... Aí surge a Web Semântica... e “elas” voltarão a ser felizes em breve! :-) Eduardo Nicola Zagari Monday, November 9, 2009
  • 7. Web Semântica Eduardo Nicola Zagari Monday, November 9, 2009
  • 8. Web Semântica Múltiplas faces: Eduardo Nicola Zagari Monday, November 9, 2009
  • 9. Web Semântica Múltiplas faces: uma plataforma tecnológica de metadados da Web Eduardo Nicola Zagari Monday, November 9, 2009
  • 10. (Plataforma Tecnológica) Computadores devem estar aptos a saber: o que uma determinada requisição significa; sobre o que são dados e documentos particulares; o relacionamento entre tudo isto. Eduardo Nicola Zagari Monday, November 9, 2009
  • 11. (Evolução das Aplicações) Processamento de Dados Processamento de Informação Processamento de Conhecimento Processamento Inteligente inteligência conhecimento informação dados Eduardo Nicola Zagari Monday, November 9, 2009
  • 12. Web Semântica Eduardo Nicola Zagari Monday, November 9, 2009
  • 13. Web Semântica Múltiplas faces: Eduardo Nicola Zagari Monday, November 9, 2009
  • 14. Web Semântica Múltiplas faces: uma plataforma tecnológica de metadados da Web Eduardo Nicola Zagari Monday, November 9, 2009
  • 15. Web Semântica Múltiplas faces: uma plataforma tecnológica de metadados da Web um movimento social de “abertura de dados” (open-source data) Eduardo Nicola Zagari Monday, November 9, 2009
  • 16. Web Semântica Múltiplas faces: uma plataforma tecnológica de metadados da Web um movimento social de “abertura de dados” (open-source data) uma nova encarnação da Inteligência Artificial clássica Eduardo Nicola Zagari Monday, November 9, 2009
  • 17. (Web Semântica e Inteligência Artificial) Segundo Sir Tim Beners-Lee: Habilidade da máquina de resolver problemas ‘bem definidos’, realizando operações ‘bem definidas’ em dados existentes ‘bem definidos’ mas... Eduardo Nicola Zagari Monday, November 9, 2009
  • 18. (Inteligência Artificial) Alan Turing, 1956 IA Forte e IA Fraca Sistemas Especialistas, Redes Neuronais, Lógica Fuzzy Inverno da IA - Aprendizado de Máquinas, Robótica, Visão Computacional Algoritmos Genéticos, Computação Bio- inspirada Eduardo Nicola Zagari Monday, November 9, 2009
  • 19. Web Semântica Um passo além da onda iniciada em 2004, a Web Colaborativa (Web 2.0) Web 3.0 ? Web Semântica, Cloud Computing, Ubiqüidade, WRTAp Eduardo Nicola Zagari Monday, November 9, 2009
  • 20. As 3 ondas da Web Fonte: Semantic Web de Jeffrey Pollockext Eduardo Nicola Zagari Monday, November 9, 2009
  • 21. As 3 ondas da Web Fonte: Semantic Web de Jeffrey Pollockext Eduardo Nicola Zagari Monday, November 9, 2009
  • 22. As 3 ondas da Web Fonte: Semantic Web de Jeffrey Pollockext Eduardo Nicola Zagari Monday, November 9, 2009
  • 23. As 3 ondas da Web Fonte: Semantic Web de Jeffrey Pollockext Eduardo Nicola Zagari Monday, November 9, 2009
  • 24. As 3 ondas da Web r Fonte: Semantic Web de Jeffrey Pollockext Eduardo Nicola Zagari Monday, November 9, 2009
  • 25. As 3 ondas da Web rw r Fonte: Semantic Web de Jeffrey Pollockext Eduardo Nicola Zagari Monday, November 9, 2009
  • 26. As 3 ondas da Web rwx rw r Fonte: Semantic Web de Jeffrey Pollockext Eduardo Nicola Zagari Monday, November 9, 2009
  • 27. As 3 ondas da Web rwx rw r tec. Fonte: Semantic Web de Jeffrey Pollockext Eduardo Nicola Zagari Monday, November 9, 2009
  • 28. As 3 ondas da Web rwx rw r soc. tec. Fonte: Semantic Web de Jeffrey Pollockext Eduardo Nicola Zagari Monday, November 9, 2009
  • 29. As 3 ondas da Web rwx rw r tec + soc soc. tec. Fonte: Semantic Web de Jeffrey Pollockext Eduardo Nicola Zagari Monday, November 9, 2009
  • 30. Web Semântica Com os computadores entendendo os conteúdos, eles teoricamente estarão aptos a resolver problemas que hoje estão fora de alcance Eduardo Nicola Zagari Monday, November 9, 2009
  • 31. Web Semântica Com os computadores entendendo os conteúdos, eles teoricamente estarão aptos a resolver problemas que hoje estão fora de alcance Objetivo: Interligar conteúdos publicados na Web A associação deve ser perceptível tanto pelo homem (manualmente) como pela máquina (automática) Eduardo Nicola Zagari Monday, November 9, 2009
  • 32. Web Semântica Com os computadores entendendo os conteúdos, eles teoricamente estarão aptos a resolver problemas que hoje estão fora de alcance Objetivo: Interligar conteúdos publicados na Web A associação deve ser perceptível tanto pelo homem (manualmente) como pela máquina (automática) Problema: Atribuição de significado (sentido) aos conteúdos... Eduardo Nicola Zagari Monday, November 9, 2009
  • 33. Abordagens Bottom-up (Clássica): Anotação de informação nas páginas, usando RDF, para que seja “legível” por máquinas Top-down (Conhecimento semântico vertical): Alavancagem de informações em páginas web já existentes, como estão, para extrair significado automaticamente reconhecimento de nomes e verbos cotidianos Eduardo Nicola Zagari Monday, November 9, 2009
  • 34. Aplicações Desktop Web Semântico (Browsers (Glue), Emails, Gerenciador de Janelas) Blogging Semântico (Zemanta) Wikis Semânticas Máquinas de Busca Semânticas Redes Sociais Semânticas Eduardo Nicola Zagari Monday, November 9, 2009
  • 35. Yahoo! Search Eduardo Nicola Zagari Monday, November 9, 2009
  • 36. ZoomInfo Construção de perfil através da associação de dados de diferentes fontes Eduardo Nicola Zagari Monday, November 9, 2009
  • 37. TripIt Agregad or de Viagens Eduardo Nicola Zagari Monday, November 9, 2009
  • 38. Dapper adição de anotação semântic a em páginas Eduardo Nicola Zagari Monday, November 9, 2009
  • 39. Tecnologias de Anotação RDF - Resource Description Framework RDFa e Microformatos SPARQL OWL Eduardo Nicola Zagari Monday, November 9, 2009
  • 40. RDF Eduardo Nicola Zagari Monday, November 9, 2009
  • 41. RDF Linguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados Eduardo Nicola Zagari Monday, November 9, 2009
  • 42. RDF Linguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados Formato de grafo de dados Eduardo Nicola Zagari Monday, November 9, 2009
  • 43. RDF Linguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados Formato de grafo de dados Árvore Eduardo Nicola Zagari Monday, November 9, 2009
  • 44. RDF Linguagem usada para descrever dados, metadados e até mesmo outras linguagens de dados Formato de grafo de dados Grafo Árvore Eduardo Nicola Zagari Monday, November 9, 2009
  • 45. RDF Usa triplas: {Recurso, Predicado, Objeto} Empregado em RSS e FOAF Idéia básica cada item de dado deve ter um identificador Web único (URI) atributo central do modelo: relacionamento de URIs entre itens de dados Eduardo Nicola Zagari Monday, November 9, 2009
  • 46. Um Grafo RDF Simples <?xml version="1.0"?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax- ns#" xmlns:dc="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about="http://bike.zagari.org/"> <dc:title>Viagens com a Magrela</dc:title> </rdf:Description> <rdf:Description rdf:about="http://bike.zagari.org/"> <dc:creator rdf:resource="http://zagari.org/foaf.rdf#me"/> </rdf:Description> Eduardo Nicola Zagari Monday, November 9, 2009
  • 47. Um Grafo RDF Simples Eduardo Nicola Zagari Monday, November 9, 2009
  • 48. RDFa e Microformatos Web -> HTML -> Linguagem de dados não estruturada Microformatos e RDFa Forma de codificar dados dentro de documentos HTML e XHTML Eduardo Nicola Zagari Monday, November 9, 2009
  • 49. HTML <div> <div>Nicola Zagari</div> <div>Abril Digital</div> <div>11-3818-1234</div> <a href="http:// www.abril.com.br/"> http://www.abril.com.br/</ a> </div> Eduardo Nicola Zagari Monday, November 9, 2009
  • 50. HTML <div> <div>Abril Digital</div> <div>Nicola Zagari</div> <div>11-3818-1234</div> <a href="http:// www.abril.com.br/"> http://www.abril.com.br/</ a> </div> Eduardo Nicola Zagari Monday, November 9, 2009
  • 51. Microformatos Com microformato hCard: <div class="vcard"> <div class="fn">Nicola Zagari</div> <div class="org">Abril Digital</div> <div class="tel">11-3818-1234</div> <a class="url" href="http:// www.abril.com.br/"> http://www.abril.com.br/</a> </div> Eduardo Nicola Zagari Monday, November 9, 2009
  • 52. RDFa <div xmlns:dc="http://purl.org/dc/elements/1.1/" about="http://www.example.com/books/wikinomics"> <span property="dc:title">Wikinomics</span> <span property="dc:creator">Don Tapscott</span> <span property="dc:date">2006-10-01</span> </div> Eduardo Nicola Zagari Monday, November 9, 2009
  • 53. RDFa <?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xmlns:foaf="http://xmlns.com/foaf/0.1/" xmlns:dc="http://purl.org/dc/elements/1.1/" version="XHTML+RDFa 1.0" xml:lang="en"> <head> <title>John's Home Page</title> <base href="http://example.org/john-d/" /> <meta property="dc:creator" content="Jonathan Doe" /> </head> <body> <h1>John's Home Page</h1> <p>My name is <span property="foaf:nick">John D</span> and I like <a href="http://www.neubauten.org/" rel="foaf:interest" xml:lang="de">Einstürzende Neubauten</a>. </p> <p> My <span rel="foaf:interest" resource="urn:ISBN:0752820907">favorite book</span> is the inspiring <span about="urn:ISBN:0752820907"><cite property="dc:title">Weaving the Web</cite> by <span property="dc:creator">Tim Berners-Lee</span></span> </p> </body> </html> Eduardo Nicola Zagari Monday, November 9, 2009
  • 54. RDFa x Microformato Microformato especifica: a sintaxe para embutir os dados dentro do documento HTML um vocabulário de termos específicos para cada tipo de informação (eventos, contatos, localização geográfica etc) RDFa especifica apenas a sintaxe: especificação de termos é independente Eduardo Nicola Zagari Monday, November 9, 2009
  • 55. SPARQL SPARQL (Simple) Protocol and RDF Query Language Permite realizar queries em grafos de dados RDF É determinístico Eduardo Nicola Zagari Monday, November 9, 2009
  • 56. Query SPARQL PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax- ns#> PREFIX edu:<http://www.us.edu/universities#> PREFIX surf:<http://www.surf.com/surf#> SELECT ?university WHERE { ?university rdf:type edu:University . ?university go:within_3_power_10_meters ?beach . ?beach rdf:type surf:Beach . ?beach surf:temperature ?temperature ?temperature unit:type http://imetro.com.br/temp.rdf#celsius . FILTER (?temperature > 22) } Eduardo Nicola Zagari Monday, November 9, 2009
  • 57. OWL Web Ontology Language Linguagem para definir e instanciar ontologias na Web Pode incluir descrições de classes, suas respectivas propriedades e relacionamentos É uma extensão de RDF para permitir a representação da semântica de modelos de dados mais complexos Eduardo Nicola Zagari Monday, November 9, 2009
  • 58. Desafios Monday, November 9, 2009
  • 59. Bottom-Up Desafios Técnicos Eduardo Nicola Zagari Monday, November 9, 2009
  • 60. Bottom-Up Desafios Técnicos Como criar os documentos de descrição de dados? Algoritmo de NLP? Manual? Eduardo Nicola Zagari Monday, November 9, 2009
  • 61. Bottom-Up Desafios Técnicos Como criar os documentos de descrição de dados? Algoritmo de NLP? Manual? Quem os geraria? Centralizado (Google-like) ou os próprios sites? Qual a motivação? Eduardo Nicola Zagari Monday, November 9, 2009
  • 62. Bottom-Up Desafios Técnicos Como criar os documentos de descrição de dados? Algoritmo de NLP? Manual? Quem os geraria? Centralizado (Google-like) ou os próprios sites? Qual a motivação? No caso da abordagem distribuída, como fica a questão de padronização? Eduardo Nicola Zagari Monday, November 9, 2009
  • 63. Bottom-Up Desafios Científicos Eduardo Nicola Zagari Monday, November 9, 2009
  • 64. Bottom-Up Desafios Científicos Problema NP-completo Eduardo Nicola Zagari Monday, November 9, 2009
  • 65. Bottom-Up Desafios Científicos Problema NP-completo Lidar com a Incerteza Representação precisa dos fatos Eduardo Nicola Zagari Monday, November 9, 2009
  • 66. Bottom-Up versus Top-Down Por estes aspectos, a abordagem Top-Down apresenta-se mais interessante que a Bottom-Up, mas... Eduardo Nicola Zagari Monday, November 9, 2009
  • 67. Top-Down Primeiro, é uma abordagem simplista e não a Web Semântica como ela foi pensada Um conjunto de apps e serviços web que geram valor a partir de semânticas simples Nem sempre chegam a resultados corretos, devido à ambiguidade Eduardo Nicola Zagari Monday, November 9, 2009
  • 68. Bottom-Up e Top-Down Desafios de Negócio Eduardo Nicola Zagari Monday, November 9, 2009
  • 69. Bottom-Up e Top-Down Desafios de Negócio Qual o real valor para o usuário? Redução de tempo? Eduardo Nicola Zagari Monday, November 9, 2009
  • 70. Bottom-Up e Top-Down Desafios de Negócio Qual o real valor para o usuário? Redução de tempo? Quais as aplicações que podem ser construídas no topo da Web Semântica? Eduardo Nicola Zagari Monday, November 9, 2009
  • 71. NLP e NER NLP Subárea de IA e da linguística que estuda os problemas da geração e compreensão automática de linguas humanas naturais NER: ramo do processamento de linguagem natural que procura extrair e classificar as entidades mencionadas em um texto Eduardo Nicola Zagari Monday, November 9, 2009
  • 72. Calais Eduardo Nicola Zagari Monday, November 9, 2009
  • 73. CMS Eduardo Nicola Zagari Monday, November 9, 2009
  • 74. Considerações Finais Eduardo Nicola Zagari Monday, November 9, 2009
  • 75. Considerações Finais Web Semântica: a bola da vez Eduardo Nicola Zagari Monday, November 9, 2009
  • 76. Considerações Finais Web Semântica: a bola da vez Ponto de inflexão Eduardo Nicola Zagari Monday, November 9, 2009
  • 77. Considerações Finais Web Semântica: a bola da vez Ponto de inflexão Abordagem por Segmentos Eduardo Nicola Zagari Monday, November 9, 2009
  • 78. Considerações Finais Eduardo Nicola Zagari Monday, November 9, 2009
  • 79. Considerações Finais Big Player? Eduardo Nicola Zagari Monday, November 9, 2009
  • 80. Considerações Finais Big Player? Aplicações inovadoras (killer apps) Eduardo Nicola Zagari Monday, November 9, 2009
  • 81. Considerações Finais Big Player? Aplicações inovadoras (killer apps) Agentes Inteligentes / máquinas de inferência Eduardo Nicola Zagari Monday, November 9, 2009
  • 82. Considerações Finais Big Player? Aplicações inovadoras (killer apps) Agentes Inteligentes / máquinas de inferência Conteúdo relevante e de alta qualidade: gerência de conteúdo => inteligência social Eduardo Nicola Zagari Monday, November 9, 2009
  • 83. Referências RDF. W3C, http://www.w3.org RDF, Microformats, OWL, SPARQL. Wikipedia, http://en.wikipedia.org/wiki/Main_Page The Road to the Semantic Web. Alex Iskold, http://www.readwriteweb.com/archives/semantic_web_road.php Semantic Web Patterns: A Guide to Semantic Technologies. Alex Iskold, http://www.readwriteweb.com/archives/semantic_web_patterns_a_guide_redux.php Semantic Web FOR DUMmIES. Jeff rey T. Pollock, Wiley Publishing, Inc. WEB 2.0 AND BEYOND - Understanding the New Online Business Models, Trends, and Technologies. Tom Funk, Praeger Publishers Semantic Web: Difficulties with the Classic Approach. Alex Iskold http://www.readwriteweb.com/archives/semantic_web_difficulties_with_classic_approach.php Top-Down: A New Approach to the Semantic Web. Alex Iskold, http://www.readwriteweb.com/archives/the_top-down_semantic_web.php Eduardo Nicola Zagari Monday, November 9, 2009
  • 84. Web Semântica Eduardo Nicola F. Zagari zagari em abril com br Ekke Ekke Ekke Ptang Zoo Boing - Núcleo de Engenharia e Pesquisa Abril Digital Monday, November 9, 2009

×