WEB SEMÂNTICA   Renan Oliveira
AGENDA•   Web atual: hipertexto•   Web semântica•   Ontologias•   Modelagem de dados•   Linked Open Data
WEB ATUAL•   Apresentação do conteúdos•   Formatação, não significado•   Pouca ou nenhuma estruturação
CONTEÚDO MULTIMÍDIA•   Vários elementos na página•   Fotos, vídeos e animações•   Qual a relação entre eles?•   Quem é men...
COMO ISSO AFETA    ALGO COMUM?Busca por Gols do Roberto Carlos no Maracanã
NA GLOBO.COM
E... NO GOOGLE
PROBLEMAS•   Busca feita por palavras (dados, não informações)•   Falta de contexto (como fotos e vídeos se relacionam com...
MELHORIAS•   Registrar de forma precisa•   Organizar corretamente•   Transmitir significado
WEB SEMÂNTICA“I have a dream for the web in which computers becomecapable of analyzing all the data on the web - the conte...
HOMEM + MÁQUINA•   Cada um desempenha seu melhor papel•   Homem - desambiguar, relacionar e definir regras•   Máquina - org...
REGISTRAR INFORMAÇÃO•   Produtor do conteúdo•   Sabe o que, quem, quando, onde...•   Resolve ambiguidade
GOL DO ROBERTO CARLOS
ONTOLOGIAS• “Uma  ontologia é um modelo de dados que representa um conjunto de conceitos dentro de um domínio e os relacio...
MONTAGEM•   Identificar os indivíduos•   Descrever seus atributos•   Agrupar os indivíduos em classes•   Enumerar as relaçõ...
CONTRUÇÃO DE                    ONTOLOGIAS•   Linguagens para definir ontologias    •   OWL (Web Ontology Language)    •   ...
REPRESENTAÇÃO EM TRIPLAS
VANTAGENS•   Modelagem natural    •   muito próximo da orientação a objetos•   Expressividade    •   representa qualquer r...
EXIBIR INFORMAÇÃO•   HTML e XML não são suficientes•   Estrutura, mas não significado    <document type="progressive rock"> ...
REPRESENTAÇÃO                    ESTRUTURADA•   “Tags” com estrutura semântica•   Padronização dos elementos    <music typ...
COMO PADRONIZAR?•   Vocabulários controlados•   Exemplo: Dublin Core Metadata Initiative (DCMI)    •   termos com significa...
OUTROS VOCABULÁRIOS•   FOAF (Friend of a Friend)    •   informações sobre as pessoas    •   orginalmente usado para redes ...
XML USANDO DUBLIN CORE      <music type="rock">         <dc:title>           Another Brick in the Wall          </dc:title...
HTML + RDFA<span property="foaf:name"> Roger Waters</span> nasceu em<span property="foaf:dateOfBirth" content="1943-09-06"...
SCHEMA.ORG•   Iniciativa Google, Bing e Yahoo!•   Gera Rich Snippet•   Grande melhoria em SEO.
BENEFÍCIOS•   Significado explícito•   Sem ambiguidades•   Entendido por máquinas de busca
LINKED DATA•   Referências cruzadas globais•   Embutidas em páginas HTML    •   RDFa, schema.org•   Identificadores único (...
LINKED OPEN DATA CLOUD•   Repositório de uso geral    •   DBPedia (conceitos extraídos da Wikipedia)    •   FreeBase•   Re...
BUSCAS SEMÂNTICAS•   Encontram e analisam meta-informação    •   tags com RDFa, microdata    •   repositório de triplas•  ...
como usamos?
globoesporte.com
globoesporte.com
globoesporte.com
globoesporte.com
globoesporte.com
CONHECIMENTO        ÚNICO     Menor risco de duplicidade dos dadosSimplificação do uso e da manutenção dos dados       Agil...
cita a entidade            Materia                     PessoaONTOLOGIATRIPLA                      cita a entidade         ...
CASES RELEVANTES    Modelos de uso da     Web Semântica
•   Best Buy•   BBC•   New York Times
AÇÕES REALIZADAS•   Uso da ontologia GoodRelations•   Adição de metadados: RDFa
RESULTADOS ALCANÇADOS•   Tráfego originado por motores de busca: + 30%•   Taxa de cliques no Yahoo!: + 15%•   Aumento sign...
AÇÕES REALIZADAS•   Ontologias públicas•   Interligação com repositórios de dados externos•   Criação de categorias e agre...
Domínios representados
Ontologias públicas    utilizadas
Ontologia de programas
RESULTADOS ALCANÇADOS•   Proliferação de links relevantes: potencialização de SEO•   Reuso das informações: menor desperdí...
AÇÕES REALIZADAS•   Anotação e indexação do conteúdo baseado em indivíduos•   Ontologia pública•   Interligação com reposi...
NYT Index Abstract                              ✓ Assuntos: Livestock; Goats;Jenny Brown, owner of          Amputation; Pr...
Apresentação:www.renanoliveira.netContato:renan@corp.globo.com@renan_oliveiraglobo.comRenan Oliveira
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Introdução a web semântica e o case da globo.com
Upcoming SlideShare
Loading in...5
×

Introdução a web semântica e o case da globo.com

5,906

Published on

Introdução aos conceitos de Web Semântica.

Published in: Technology
0 Comments
14 Likes
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total Views
5,906
On Slideshare
0
From Embeds
0
Number of Embeds
6
Actions
Shares
0
Downloads
0
Comments
0
Likes
14
Embeds 0
No embeds

No notes for slide
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • UM ROM&amp;#xC1;RIO ---- DADO CONSISTENTE NA NOSSA BASE\nDADO F&amp;#xC1;CIL DE USADO E MANTIDO\n\n
  • PREDICADO CONECTA DUAS CLASSES\n
  • ATORES: TIMES, T&amp;#xC9;CNICO, ETC...\nEVENTO: PARTIDA\nN&amp;#xC3;O TEM O JUIZ\n
  • \n
  • \n
  • - Grande empresa varejo de eletronicos\n- Artigo semtech\n- benef&amp;#xED;cios da web sem&amp;#xE2;ntica\n\n\n
  • good relations\n --&gt; vocabulario profissional e-commerce\n --&gt; amig&amp;#xE1;vel m&amp;#xE1;quina busca, mobile, exten&amp;#xE7;&amp;#xF5;es browser\nrdfa\n --&gt; anotar XHTML com sem&amp;#xE2;ntica\n --&gt; utilizado por m&amp;#xE1;quinas de busca, machine readable\n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • MUSIC BRAINZ - IMDB DA M&amp;#xDA;SICA\n
  • DOM&amp;#xCD;NIO QUE INTERESSA A GLOBO.COM\n
  • ESTOU PROCURANDO SOBRE NOT&amp;#xCD;CIAS DA CHINA\n
  • P&amp;#xC1;GINA DE T&amp;#xD3;PICOS SOBRE A CHINA\n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • \n
  • Transcript of "Introdução a web semântica e o case da globo.com"

    1. 1. WEB SEMÂNTICA Renan Oliveira
    2. 2. AGENDA• Web atual: hipertexto• Web semântica• Ontologias• Modelagem de dados• Linked Open Data
    3. 3. WEB ATUAL• Apresentação do conteúdos• Formatação, não significado• Pouca ou nenhuma estruturação
    4. 4. CONTEÚDO MULTIMÍDIA• Vários elementos na página• Fotos, vídeos e animações• Qual a relação entre eles?• Quem é mencionado no texto?• Quem, Quando, Onde...
    5. 5. COMO ISSO AFETA ALGO COMUM?Busca por Gols do Roberto Carlos no Maracanã
    6. 6. NA GLOBO.COM
    7. 7. E... NO GOOGLE
    8. 8. PROBLEMAS• Busca feita por palavras (dados, não informações)• Falta de contexto (como fotos e vídeos se relacionam com o texto?)• Ambiguidade (qual Roberto Carlos?)• Pouca relevância (gol???)
    9. 9. MELHORIAS• Registrar de forma precisa• Organizar corretamente• Transmitir significado
    10. 10. WEB SEMÂNTICA“I have a dream for the web in which computers becomecapable of analyzing all the data on the web - the content,links, and transactions between people and computers.”Tim Berners-Lee
    11. 11. HOMEM + MÁQUINA• Cada um desempenha seu melhor papel• Homem - desambiguar, relacionar e definir regras• Máquina - organizar, indexar e inferir
    12. 12. REGISTRAR INFORMAÇÃO• Produtor do conteúdo• Sabe o que, quem, quando, onde...• Resolve ambiguidade
    13. 13. GOL DO ROBERTO CARLOS
    14. 14. ONTOLOGIAS• “Uma ontologia é um modelo de dados que representa um conjunto de conceitos dentro de um domínio e os relacionamentos entre eles” - Wikipedia
    15. 15. MONTAGEM• Identificar os indivíduos• Descrever seus atributos• Agrupar os indivíduos em classes• Enumerar as relações entre indivíduos• Definir regras sobre atributos e relações
    16. 16. CONTRUÇÃO DE ONTOLOGIAS• Linguagens para definir ontologias • OWL (Web Ontology Language) • RDF (Resource description framework)
    17. 17. REPRESENTAÇÃO EM TRIPLAS
    18. 18. VANTAGENS• Modelagem natural • muito próximo da orientação a objetos• Expressividade • representa qualquer relacionamento possível • restrições, cardinalidade• Capacidade de inferência • regras sobre as classes e relacionamentos
    19. 19. EXIBIR INFORMAÇÃO• HTML e XML não são suficientes• Estrutura, mas não significado <document type="progressive rock"> <name>Another Brick in the Wall</name> <author>Roger Waters</author> </document>
    20. 20. REPRESENTAÇÃO ESTRUTURADA• “Tags” com estrutura semântica• Padronização dos elementos <music type="rock"> <title>Another Brick in the Wall</title> <composer>Roger Waters</composer> </music>
    21. 21. COMO PADRONIZAR?• Vocabulários controlados• Exemplo: Dublin Core Metadata Initiative (DCMI) • termos com significado bem definido: • title, creator, contributor, creator, ...
    22. 22. OUTROS VOCABULÁRIOS• FOAF (Friend of a Friend) • informações sobre as pessoas • orginalmente usado para redes sociais• Core Ontology for Multimedia (COMM) • informações sobre arquivos de mídia • dimensões, encoding, histórico de produção
    23. 23. XML USANDO DUBLIN CORE <music type="rock"> <dc:title> Another Brick in the Wall </dc:title> <dc:creator> Roger Waters </dc:creator> </music>
    24. 24. HTML + RDFA<span property="foaf:name"> Roger Waters</span> nasceu em<span property="foaf:dateOfBirth" content="1943-09-06"datatype="xsd:date"> 6 de setembro de 1943</span>
    25. 25. SCHEMA.ORG• Iniciativa Google, Bing e Yahoo!• Gera Rich Snippet• Grande melhoria em SEO.
    26. 26. BENEFÍCIOS• Significado explícito• Sem ambiguidades• Entendido por máquinas de busca
    27. 27. LINKED DATA• Referências cruzadas globais• Embutidas em páginas HTML • RDFa, schema.org• Identificadores único (URIs) para conceitos• Bases de dados de referência
    28. 28. LINKED OPEN DATA CLOUD• Repositório de uso geral • DBPedia (conceitos extraídos da Wikipedia) • FreeBase• Repositório sobre domínios específicos • GeoNames • MusicBrainz• Novos sites com autoridade sobre o domínio
    29. 29. BUSCAS SEMÂNTICAS• Encontram e analisam meta-informação • tags com RDFa, microdata • repositório de triplas• Relacionam informações em sites diferentes• Exemplo: Sindice e Google*
    30. 30. como usamos?
    31. 31. globoesporte.com
    32. 32. globoesporte.com
    33. 33. globoesporte.com
    34. 34. globoesporte.com
    35. 35. globoesporte.com
    36. 36. CONHECIMENTO ÚNICO Menor risco de duplicidade dos dadosSimplificação do uso e da manutenção dos dados Agilidade na recuperação dos dados
    37. 37. cita a entidade Materia PessoaONTOLOGIATRIPLA cita a entidade Matéria Romário
    38. 38. CASES RELEVANTES Modelos de uso da Web Semântica
    39. 39. • Best Buy• BBC• New York Times
    40. 40. AÇÕES REALIZADAS• Uso da ontologia GoodRelations• Adição de metadados: RDFa
    41. 41. RESULTADOS ALCANÇADOS• Tráfego originado por motores de busca: + 30%• Taxa de cliques no Yahoo!: + 15%• Aumento significativo do Google PageRank
    42. 42. AÇÕES REALIZADAS• Ontologias públicas• Interligação com repositórios de dados externos• Criação de categorias e agregadores úteis
    43. 43. Domínios representados
    44. 44. Ontologias públicas utilizadas
    45. 45. Ontologia de programas
    46. 46. RESULTADOS ALCANÇADOS• Proliferação de links relevantes: potencialização de SEO• Reuso das informações: menor desperdício de pessoal• Navegação interligada e escalável para toda a BBC
    47. 47. AÇÕES REALIZADAS• Anotação e indexação do conteúdo baseado em indivíduos• Ontologia pública• Interligação com repositórios de dados externos• Adição de metadados: Open Graph
    48. 48. NYT Index Abstract ✓ Assuntos: Livestock; Goats;Jenny Brown, owner of Amputation; Prosthesis; LegsWoodstock (NY) Farm AnimalSanctuary, forms special ✓ Organizações:Woodstock Farmbond with Albie, goat that Animal Sanctuaryprobably escaped from New ✓ Lugares:Woodstock (NY); NewYork City slaughterhouse; York CityAlbie injured leg in escapeand it had to be amputated; ✓ Pessoas: Santos, Fernanda; Brown,Brown had leg amputated as
    49. 49. Apresentação:www.renanoliveira.netContato:renan@corp.globo.com@renan_oliveiraglobo.comRenan Oliveira

    ×