SlideShare a Scribd company logo
1 of 72
WEB SEMÂNTICA
   Renan Oliveira
AGENDA

•   Web atual: hipertexto

•   Web semântica

•   Ontologias

•   Modelagem de dados

•   Linked Open Data
WEB ATUAL


•   Apresentação do conteúdos

•   Formatação, não significado

•   Pouca ou nenhuma estruturação
CONTEÚDO MULTIMÍDIA

•   Vários elementos na página

•   Fotos, vídeos e animações

•   Qual a relação entre eles?

•   Quem é mencionado no texto?

•   Quem, Quando, Onde...
COMO ISSO AFETA
    ALGO COMUM?
Busca por Gols do Roberto Carlos no Maracanã
NA GLOBO.COM
E... NO GOOGLE
PROBLEMAS

•   Busca feita por palavras (dados, não informações)

•   Falta de contexto (como fotos e vídeos se relacionam com o texto?)

•   Ambiguidade (qual Roberto Carlos?)

•   Pouca relevância (gol???)
MELHORIAS


•   Registrar de forma precisa

•   Organizar corretamente

•   Transmitir significado
WEB SEMÂNTICA



“I have a dream for the web in which computers become
capable of analyzing all the data on the web - the content,
links, and transactions between people and computers.”
Tim Berners-Lee
HOMEM + MÁQUINA


•   Cada um desempenha seu melhor papel

•   Homem - desambiguar, relacionar e definir regras

•   Máquina - organizar, indexar e inferir
REGISTRAR INFORMAÇÃO


•   Produtor do conteúdo

•   Sabe o que, quem, quando, onde...

•   Resolve ambiguidade
GOL DO ROBERTO CARLOS
ONTOLOGIAS



• “Uma  ontologia é um modelo de dados que representa um
 conjunto de conceitos dentro de um domínio e os
 relacionamentos entre eles” - Wikipedia
MONTAGEM

•   Identificar os indivíduos

•   Descrever seus atributos

•   Agrupar os indivíduos em classes

•   Enumerar as relações entre indivíduos

•   Definir regras sobre atributos e relações
CONTRUÇÃO DE
                    ONTOLOGIAS

•   Linguagens para definir ontologias

    •   OWL (Web Ontology Language)

    •   RDF (Resource description framework)
REPRESENTAÇÃO EM TRIPLAS
VANTAGENS
•   Modelagem natural

    •   muito próximo da orientação a objetos

•   Expressividade

    •   representa qualquer relacionamento possível

    •   restrições, cardinalidade

•   Capacidade de inferência

    •   regras sobre as classes e relacionamentos
EXIBIR INFORMAÇÃO

•   HTML e XML não são suficientes

•   Estrutura, mas não significado

    <document type="progressive rock">
    <name>Another Brick in the Wall</name>
    <author>Roger Waters</author>
    </document>
REPRESENTAÇÃO
                    ESTRUTURADA
•   “Tags” com estrutura semântica

•   Padronização dos elementos

    <music type="rock">
    <title>Another Brick in the Wall</title>
    <composer>Roger Waters</composer>
    </music>
COMO PADRONIZAR?

•   Vocabulários controlados

•   Exemplo: Dublin Core Metadata Initiative (DCMI)

    •   termos com significado bem definido:

        •   title, creator, contributor, creator, ...
OUTROS VOCABULÁRIOS
•   FOAF (Friend of a Friend)

    •   informações sobre as pessoas

    •   orginalmente usado para redes sociais

•   Core Ontology for Multimedia (COMM)

    •   informações sobre arquivos de mídia

    •   dimensões, encoding, histórico de produção
XML USANDO DUBLIN CORE

      <music type="rock">
         <dc:title>
           Another Brick in the Wall
          </dc:title>
          <dc:creator>
           Roger Waters
          </dc:creator>
      </music>
HTML + RDFA

<span property="foaf:name">
 Roger Waters
</span>
 nasceu em
<span property="foaf:dateOfBirth" content="1943-09-06"
datatype="xsd:date">
 6 de setembro de 1943
</span>
SCHEMA.ORG


•   Iniciativa Google, Bing e Yahoo!

•   Gera Rich Snippet

•   Grande melhoria em SEO.
BENEFÍCIOS


•   Significado explícito

•   Sem ambiguidades

•   Entendido por máquinas de busca
LINKED DATA

•   Referências cruzadas globais

•   Embutidas em páginas HTML

    •   RDFa, schema.org

•   Identificadores único (URIs) para conceitos

•   Bases de dados de referência
LINKED OPEN DATA CLOUD
•   Repositório de uso geral

    •   DBPedia (conceitos extraídos da Wikipedia)

    •   FreeBase

•   Repositório sobre domínios específicos

    •   GeoNames

    •   MusicBrainz

•   Novos sites com autoridade sobre o domínio
BUSCAS SEMÂNTICAS

•   Encontram e analisam meta-informação

    •   tags com RDFa, microdata

    •   repositório de triplas

•   Relacionam informações em sites diferentes

•   Exemplo: Sindice e Google*
como usamos?
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
globo
esporte
.com
CONHECIMENTO
        ÚNICO
     Menor risco de duplicidade dos dados
Simplificação do uso e da manutenção dos dados
       Agilidade na recuperação dos dados
cita a entidade
            Materia                     Pessoa
ONTOLOGIA
TRIPLA
                      cita a entidade
            Matéria                     Romário
CASES RELEVANTES
    Modelos de uso da
     Web Semântica
•   Best Buy

•   BBC

•   New York Times
AÇÕES REALIZADAS


•   Uso da ontologia GoodRelations

•   Adição de metadados: RDFa
RESULTADOS ALCANÇADOS


•   Tráfego originado por motores de busca: + 30%

•   Taxa de cliques no Yahoo!: + 15%

•   Aumento significativo do Google PageRank
AÇÕES REALIZADAS


•   Ontologias públicas

•   Interligação com repositórios de dados externos

•   Criação de categorias e agregadores úteis
Domínios representados
Ontologias públicas
    utilizadas
Ontologia de programas
RESULTADOS ALCANÇADOS


•   Proliferação de links relevantes: potencialização de SEO

•   Reuso das informações: menor desperdício de pessoal

•   Navegação interligada e escalável para toda a BBC
AÇÕES REALIZADAS


•   Anotação e indexação do conteúdo baseado em indivíduos

•   Ontologia pública

•   Interligação com repositórios de dados externos

•   Adição de metadados: Open Graph
NYT Index Abstract
                              ✓ Assuntos: Livestock; Goats;
Jenny Brown, owner of          Amputation; Prosthesis; Legs
Woodstock (NY) Farm Animal
Sanctuary, forms special      ✓ Organizações:Woodstock Farm

bond with Albie, goat that     Animal Sanctuary
probably escaped from New
                              ✓ Lugares:Woodstock (NY); New
York City slaughterhouse;
                               York City
Albie injured leg in escape
and it had to be amputated;
                              ✓ Pessoas: Santos, Fernanda; Brown,
Brown had leg amputated as
Apresentação:
www.renanoliveira.net

Contato:
renan@corp.globo.com
@renan_oliveira

globo.com
Renan Oliveira

More Related Content

What's hot

Performing real-time ETL into data lakes - ADB202 - Santa Clara AWS Summit.pdf
Performing real-time ETL into data lakes - ADB202 - Santa Clara AWS Summit.pdfPerforming real-time ETL into data lakes - ADB202 - Santa Clara AWS Summit.pdf
Performing real-time ETL into data lakes - ADB202 - Santa Clara AWS Summit.pdfAmazon Web Services
 
카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개
카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개
카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개if kakao
 
Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교
Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교
Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교Amazon Web Services Korea
 
Massive service basic
Massive service basicMassive service basic
Massive service basicDaeMyung Kang
 
Amazon Timestream 시계열 데이터 전용 DB 소개 :: 변규현 - AWS Community Day 2019
Amazon Timestream 시계열 데이터 전용 DB 소개 :: 변규현 - AWS Community Day 2019Amazon Timestream 시계열 데이터 전용 DB 소개 :: 변규현 - AWS Community Day 2019
Amazon Timestream 시계열 데이터 전용 DB 소개 :: 변규현 - AWS Community Day 2019AWSKRUG - AWS한국사용자모임
 
Monitoramento de Banco de dados SQL Server com Zabbix
Monitoramento de Banco de dados SQL Server com ZabbixMonitoramento de Banco de dados SQL Server com Zabbix
Monitoramento de Banco de dados SQL Server com ZabbixGustavo Henrique
 
re:Invent 2022 DAT326 Deep dive into Amazon Aurora and its innovations
re:Invent 2022  DAT326 Deep dive into Amazon Aurora and its innovationsre:Invent 2022  DAT326 Deep dive into Amazon Aurora and its innovations
re:Invent 2022 DAT326 Deep dive into Amazon Aurora and its innovationsGrant McAlister
 
Naver속도의, 속도에 의한, 속도를 위한 몽고DB (네이버 컨텐츠검색과 몽고DB) [Naver]
Naver속도의, 속도에 의한, 속도를 위한 몽고DB (네이버 컨텐츠검색과 몽고DB) [Naver]Naver속도의, 속도에 의한, 속도를 위한 몽고DB (네이버 컨텐츠검색과 몽고DB) [Naver]
Naver속도의, 속도에 의한, 속도를 위한 몽고DB (네이버 컨텐츠검색과 몽고DB) [Naver]MongoDB
 
RDBMS to Graph
RDBMS to GraphRDBMS to Graph
RDBMS to GraphNeo4j
 
Amazon DynamoDB Under the Hood: How We Built a Hyper-Scale Database (DAT321) ...
Amazon DynamoDB Under the Hood: How We Built a Hyper-Scale Database (DAT321) ...Amazon DynamoDB Under the Hood: How We Built a Hyper-Scale Database (DAT321) ...
Amazon DynamoDB Under the Hood: How We Built a Hyper-Scale Database (DAT321) ...Amazon Web Services
 
Base de Dados - Introdução
Base de Dados - IntroduçãoBase de Dados - Introdução
Base de Dados - IntroduçãoMariana Hiyori
 
롯데이커머스의 마이크로 서비스 아키텍처 진화와 비용 관점의 운영 노하우-나현길, 롯데이커머스 클라우드플랫폼 팀장::AWS 마이그레이션 A ...
롯데이커머스의 마이크로 서비스 아키텍처 진화와 비용 관점의 운영 노하우-나현길, 롯데이커머스 클라우드플랫폼 팀장::AWS 마이그레이션 A ...롯데이커머스의 마이크로 서비스 아키텍처 진화와 비용 관점의 운영 노하우-나현길, 롯데이커머스 클라우드플랫폼 팀장::AWS 마이그레이션 A ...
롯데이커머스의 마이크로 서비스 아키텍처 진화와 비용 관점의 운영 노하우-나현길, 롯데이커머스 클라우드플랫폼 팀장::AWS 마이그레이션 A ...Amazon Web Services Korea
 
Manhã com Dados 2a edição - Data Mesh.pdf
Manhã com Dados 2a edição - Data Mesh.pdfManhã com Dados 2a edição - Data Mesh.pdf
Manhã com Dados 2a edição - Data Mesh.pdfBLRDATA
 
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...Neo4j
 
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...Amazon Web Services Korea
 
Building Data Pipelines with Spark and StreamSets
Building Data Pipelines with Spark and StreamSetsBuilding Data Pipelines with Spark and StreamSets
Building Data Pipelines with Spark and StreamSetsPat Patterson
 
Introducing Azure SQL Database
Introducing Azure SQL DatabaseIntroducing Azure SQL Database
Introducing Azure SQL DatabaseJames Serra
 
2017 AWS DB Day | 개발자가 알아야 할 Amazon DynamoDB 활용법
2017 AWS DB Day | 개발자가 알아야 할 Amazon DynamoDB 활용법 2017 AWS DB Day | 개발자가 알아야 할 Amazon DynamoDB 활용법
2017 AWS DB Day | 개발자가 알아야 할 Amazon DynamoDB 활용법 Amazon Web Services Korea
 
AWS CDK를 활용한 게임 데이터 파이프라인 구축 방안 [레벨 200] - 발표자: Douglas Lima, 데브옵스 컨설턴트, AWS ...
AWS CDK를 활용한 게임 데이터 파이프라인 구축 방안 [레벨 200] - 발표자: Douglas Lima, 데브옵스 컨설턴트, AWS ...AWS CDK를 활용한 게임 데이터 파이프라인 구축 방안 [레벨 200] - 발표자: Douglas Lima, 데브옵스 컨설턴트, AWS ...
AWS CDK를 활용한 게임 데이터 파이프라인 구축 방안 [레벨 200] - 발표자: Douglas Lima, 데브옵스 컨설턴트, AWS ...Amazon Web Services Korea
 

What's hot (20)

Performing real-time ETL into data lakes - ADB202 - Santa Clara AWS Summit.pdf
Performing real-time ETL into data lakes - ADB202 - Santa Clara AWS Summit.pdfPerforming real-time ETL into data lakes - ADB202 - Santa Clara AWS Summit.pdf
Performing real-time ETL into data lakes - ADB202 - Santa Clara AWS Summit.pdf
 
카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개
카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개
카카오 광고 플랫폼 MSA 적용 사례 및 API Gateway와 인증 구현에 대한 소개
 
Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교
Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교
Amazon DocumentDB vs MongoDB 의 내부 아키텍쳐 와 장단점 비교
 
Massive service basic
Massive service basicMassive service basic
Massive service basic
 
Amazon Timestream 시계열 데이터 전용 DB 소개 :: 변규현 - AWS Community Day 2019
Amazon Timestream 시계열 데이터 전용 DB 소개 :: 변규현 - AWS Community Day 2019Amazon Timestream 시계열 데이터 전용 DB 소개 :: 변규현 - AWS Community Day 2019
Amazon Timestream 시계열 데이터 전용 DB 소개 :: 변규현 - AWS Community Day 2019
 
Monitoramento de Banco de dados SQL Server com Zabbix
Monitoramento de Banco de dados SQL Server com ZabbixMonitoramento de Banco de dados SQL Server com Zabbix
Monitoramento de Banco de dados SQL Server com Zabbix
 
re:Invent 2022 DAT326 Deep dive into Amazon Aurora and its innovations
re:Invent 2022  DAT326 Deep dive into Amazon Aurora and its innovationsre:Invent 2022  DAT326 Deep dive into Amazon Aurora and its innovations
re:Invent 2022 DAT326 Deep dive into Amazon Aurora and its innovations
 
Naver속도의, 속도에 의한, 속도를 위한 몽고DB (네이버 컨텐츠검색과 몽고DB) [Naver]
Naver속도의, 속도에 의한, 속도를 위한 몽고DB (네이버 컨텐츠검색과 몽고DB) [Naver]Naver속도의, 속도에 의한, 속도를 위한 몽고DB (네이버 컨텐츠검색과 몽고DB) [Naver]
Naver속도의, 속도에 의한, 속도를 위한 몽고DB (네이버 컨텐츠검색과 몽고DB) [Naver]
 
RDBMS to Graph
RDBMS to GraphRDBMS to Graph
RDBMS to Graph
 
Amazon DynamoDB Under the Hood: How We Built a Hyper-Scale Database (DAT321) ...
Amazon DynamoDB Under the Hood: How We Built a Hyper-Scale Database (DAT321) ...Amazon DynamoDB Under the Hood: How We Built a Hyper-Scale Database (DAT321) ...
Amazon DynamoDB Under the Hood: How We Built a Hyper-Scale Database (DAT321) ...
 
Base de Dados - Introdução
Base de Dados - IntroduçãoBase de Dados - Introdução
Base de Dados - Introdução
 
롯데이커머스의 마이크로 서비스 아키텍처 진화와 비용 관점의 운영 노하우-나현길, 롯데이커머스 클라우드플랫폼 팀장::AWS 마이그레이션 A ...
롯데이커머스의 마이크로 서비스 아키텍처 진화와 비용 관점의 운영 노하우-나현길, 롯데이커머스 클라우드플랫폼 팀장::AWS 마이그레이션 A ...롯데이커머스의 마이크로 서비스 아키텍처 진화와 비용 관점의 운영 노하우-나현길, 롯데이커머스 클라우드플랫폼 팀장::AWS 마이그레이션 A ...
롯데이커머스의 마이크로 서비스 아키텍처 진화와 비용 관점의 운영 노하우-나현길, 롯데이커머스 클라우드플랫폼 팀장::AWS 마이그레이션 A ...
 
Manhã com Dados 2a edição - Data Mesh.pdf
Manhã com Dados 2a edição - Data Mesh.pdfManhã com Dados 2a edição - Data Mesh.pdf
Manhã com Dados 2a edição - Data Mesh.pdf
 
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...
Knowledge Graphs for Transformation: Dynamic Context for the Intelligent Ente...
 
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
사례로 알아보는 Database Migration Service : 데이터베이스 및 데이터 이관, 통합, 분리, 분석의 도구 - 발표자: ...
 
Building Data Pipelines with Spark and StreamSets
Building Data Pipelines with Spark and StreamSetsBuilding Data Pipelines with Spark and StreamSets
Building Data Pipelines with Spark and StreamSets
 
Deep Dive on Amazon DynamoDB
Deep Dive on Amazon DynamoDBDeep Dive on Amazon DynamoDB
Deep Dive on Amazon DynamoDB
 
Introducing Azure SQL Database
Introducing Azure SQL DatabaseIntroducing Azure SQL Database
Introducing Azure SQL Database
 
2017 AWS DB Day | 개발자가 알아야 할 Amazon DynamoDB 활용법
2017 AWS DB Day | 개발자가 알아야 할 Amazon DynamoDB 활용법 2017 AWS DB Day | 개발자가 알아야 할 Amazon DynamoDB 활용법
2017 AWS DB Day | 개발자가 알아야 할 Amazon DynamoDB 활용법
 
AWS CDK를 활용한 게임 데이터 파이프라인 구축 방안 [레벨 200] - 발표자: Douglas Lima, 데브옵스 컨설턴트, AWS ...
AWS CDK를 활용한 게임 데이터 파이프라인 구축 방안 [레벨 200] - 발표자: Douglas Lima, 데브옵스 컨설턴트, AWS ...AWS CDK를 활용한 게임 데이터 파이프라인 구축 방안 [레벨 200] - 발표자: Douglas Lima, 데브옵스 컨설턴트, AWS ...
AWS CDK를 활용한 게임 데이터 파이프라인 구축 방안 [레벨 200] - 발표자: Douglas Lima, 데브옵스 컨설턴트, AWS ...
 

Similar to Introdução a web semântica e o case da globo.com

Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Regis Magalhães
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Regis Magalhães
 
Padroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisPadroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisRosana Lanzelotte
 
Perspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaPerspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaNaira Michelle Alves Pereira
 
Web Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLWeb Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLOtávio Calaça Xavier
 
Web 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeWeb 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeElvis Fusco
 
Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Luiz Adolfo de Andrade
 
No sql Orientado a documento
No sql Orientado a documentoNo sql Orientado a documento
No sql Orientado a documentoAlex Martins
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Thiago de Azeredo
 
Metadados para difusão de partituras
Metadados para difusão de partiturasMetadados para difusão de partituras
Metadados para difusão de partiturasRosana Lanzelotte
 
Estratégia de Conteúdo
Estratégia de ConteúdoEstratégia de Conteúdo
Estratégia de ConteúdoPatricia De Cia
 
NoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaNoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaLuciano Ramalho
 
Internet - Avaliar informação
Internet - Avaliar informaçãoInternet - Avaliar informação
Internet - Avaliar informaçãoHenrique Fonseca
 
Estudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasEstudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasHelio Henrique L. C. Monte-Alto
 
Disciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasDisciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasSociedade da Informação
 

Similar to Introdução a web semântica e o case da globo.com (20)

Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011Linked Data Tutorial - Conferencia W3C Brasil 2011
Linked Data Tutorial - Conferencia W3C Brasil 2011
 
Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011Linked Data - Minicurso - SBBD 2011
Linked Data - Minicurso - SBBD 2011
 
Padroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicaisPadroes descricao boas_praticas_recursos_musicais
Padroes descricao boas_praticas_recursos_musicais
 
Perspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomiaPerspectivas da web semântica para a biblioteconomia
Perspectivas da web semântica para a biblioteconomia
 
Web Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQLWeb Semântica e bancos de dados NoSQL
Web Semântica e bancos de dados NoSQL
 
Web 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na RedeWeb 3.0 - A Semântica na Rede
Web 3.0 - A Semântica na Rede
 
Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2Gestão em Ambientes Digitais - aula 2
Gestão em Ambientes Digitais - aula 2
 
No sql Orientado a documento
No sql Orientado a documentoNo sql Orientado a documento
No sql Orientado a documento
 
Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)Introdução ao MongoDB (NoSQL)
Introdução ao MongoDB (NoSQL)
 
7 AULA_SRI.ppt
7 AULA_SRI.ppt7 AULA_SRI.ppt
7 AULA_SRI.ppt
 
Metadados para difusão de partituras
Metadados para difusão de partiturasMetadados para difusão de partituras
Metadados para difusão de partituras
 
Saber avaliar a informação
Saber avaliar a informaçãoSaber avaliar a informação
Saber avaliar a informação
 
Estratégia de Conteúdo
Estratégia de ConteúdoEstratégia de Conteúdo
Estratégia de Conteúdo
 
NoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiênciaNoSQL na BIREME: 20 anos de experiência
NoSQL na BIREME: 20 anos de experiência
 
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
Sistemas abertos aplicados à gestão da informação científica: o desenvolvimen...
 
Internet - Avaliar informação
Internet - Avaliar informaçãoInternet - Avaliar informação
Internet - Avaliar informação
 
Aula_1._Introducao_ao_curso.ppt
Aula_1._Introducao_ao_curso.pptAula_1._Introducao_ao_curso.ppt
Aula_1._Introducao_ao_curso.ppt
 
Estudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologiasEstudo de técnicas de persistência e acesso concorrente a ontologias
Estudo de técnicas de persistência e acesso concorrente a ontologias
 
Disciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e OntologiasDisciplina Sociedade da Informação Semântica e Ontologias
Disciplina Sociedade da Informação Semântica e Ontologias
 
Palestra Introdução a Linked Data
Palestra Introdução a Linked DataPalestra Introdução a Linked Data
Palestra Introdução a Linked Data
 

More from Renan Moreira de Oliveira

PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServicePicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServiceRenan Moreira de Oliveira
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCRenan Moreira de Oliveira
 
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Renan Moreira de Oliveira
 
Big data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosBig data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosRenan Moreira de Oliveira
 
Excelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaExcelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaRenan Moreira de Oliveira
 
Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveRenan Moreira de Oliveira
 

More from Renan Moreira de Oliveira (18)

PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer ServicePicPay - GenAI Finance Assistant - ChatGPT for Customer Service
PicPay - GenAI Finance Assistant - ChatGPT for Customer Service
 
AI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDCAI & Big Data - Personalização da Jornada - PicPay - TDC
AI & Big Data - Personalização da Jornada - PicPay - TDC
 
AI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerceAI na jornada do usuário de ecommerce
AI na jornada do usuário de ecommerce
 
RecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendationRecSys 2020 - iFood recommendation
RecSys 2020 - iFood recommendation
 
Data science Framework
Data science FrameworkData science Framework
Data science Framework
 
iFood Recommendations
iFood RecommendationsiFood Recommendations
iFood Recommendations
 
Sistemas de Recomendação
Sistemas de RecomendaçãoSistemas de Recomendação
Sistemas de Recomendação
 
What is AB, MVT and MAB?
What is AB, MVT and MAB?What is AB, MVT and MAB?
What is AB, MVT and MAB?
 
Dados importam, seja data-driven!
Dados importam, seja data-driven!Dados importam, seja data-driven!
Dados importam, seja data-driven!
 
Big Data to Machine Learning
Big Data to Machine LearningBig Data to Machine Learning
Big Data to Machine Learning
 
Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)Dev para Engenheiro de Dados (From Dev to Data Engineer)
Dev para Engenheiro de Dados (From Dev to Data Engineer)
 
Big data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dadosBig data e globo.com - Uma visão sobre a cultura de dados
Big data e globo.com - Uma visão sobre a cultura de dados
 
Big data e a globo.com - 2017
Big data e a globo.com - 2017Big data e a globo.com - 2017
Big data e a globo.com - 2017
 
Big Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro SparkBig Data e seu fiel companheiro Spark
Big Data e seu fiel companheiro Spark
 
Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016Big Data na Globo.com - Dev Version - 2016
Big Data na Globo.com - Dev Version - 2016
 
Big Data na globo.com
Big Data na globo.comBig Data na globo.com
Big Data na globo.com
 
Excelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web SemânticaExcelsior - Perfil usando Big Data e Web Semântica
Excelsior - Perfil usando Big Data e Web Semântica
 
Transição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suaveTransição do desenvolvimento web para apps - o caminho suave
Transição do desenvolvimento web para apps - o caminho suave
 

Introdução a web semântica e o case da globo.com

  • 1. WEB SEMÂNTICA Renan Oliveira
  • 2. AGENDA • Web atual: hipertexto • Web semântica • Ontologias • Modelagem de dados • Linked Open Data
  • 3. WEB ATUAL • Apresentação do conteúdos • Formatação, não significado • Pouca ou nenhuma estruturação
  • 4. CONTEÚDO MULTIMÍDIA • Vários elementos na página • Fotos, vídeos e animações • Qual a relação entre eles? • Quem é mencionado no texto? • Quem, Quando, Onde...
  • 5. COMO ISSO AFETA ALGO COMUM? Busca por Gols do Roberto Carlos no Maracanã
  • 8. PROBLEMAS • Busca feita por palavras (dados, não informações) • Falta de contexto (como fotos e vídeos se relacionam com o texto?) • Ambiguidade (qual Roberto Carlos?) • Pouca relevância (gol???)
  • 9. MELHORIAS • Registrar de forma precisa • Organizar corretamente • Transmitir significado
  • 10. WEB SEMÂNTICA “I have a dream for the web in which computers become capable of analyzing all the data on the web - the content, links, and transactions between people and computers.” Tim Berners-Lee
  • 11. HOMEM + MÁQUINA • Cada um desempenha seu melhor papel • Homem - desambiguar, relacionar e definir regras • Máquina - organizar, indexar e inferir
  • 12. REGISTRAR INFORMAÇÃO • Produtor do conteúdo • Sabe o que, quem, quando, onde... • Resolve ambiguidade
  • 13. GOL DO ROBERTO CARLOS
  • 14. ONTOLOGIAS • “Uma ontologia é um modelo de dados que representa um conjunto de conceitos dentro de um domínio e os relacionamentos entre eles” - Wikipedia
  • 15. MONTAGEM • Identificar os indivíduos • Descrever seus atributos • Agrupar os indivíduos em classes • Enumerar as relações entre indivíduos • Definir regras sobre atributos e relações
  • 16. CONTRUÇÃO DE ONTOLOGIAS • Linguagens para definir ontologias • OWL (Web Ontology Language) • RDF (Resource description framework)
  • 18.
  • 19. VANTAGENS • Modelagem natural • muito próximo da orientação a objetos • Expressividade • representa qualquer relacionamento possível • restrições, cardinalidade • Capacidade de inferência • regras sobre as classes e relacionamentos
  • 20. EXIBIR INFORMAÇÃO • HTML e XML não são suficientes • Estrutura, mas não significado <document type="progressive rock"> <name>Another Brick in the Wall</name> <author>Roger Waters</author> </document>
  • 21. REPRESENTAÇÃO ESTRUTURADA • “Tags” com estrutura semântica • Padronização dos elementos <music type="rock"> <title>Another Brick in the Wall</title> <composer>Roger Waters</composer> </music>
  • 22. COMO PADRONIZAR? • Vocabulários controlados • Exemplo: Dublin Core Metadata Initiative (DCMI) • termos com significado bem definido: • title, creator, contributor, creator, ...
  • 23. OUTROS VOCABULÁRIOS • FOAF (Friend of a Friend) • informações sobre as pessoas • orginalmente usado para redes sociais • Core Ontology for Multimedia (COMM) • informações sobre arquivos de mídia • dimensões, encoding, histórico de produção
  • 24. XML USANDO DUBLIN CORE <music type="rock"> <dc:title> Another Brick in the Wall </dc:title> <dc:creator> Roger Waters </dc:creator> </music>
  • 25. HTML + RDFA <span property="foaf:name"> Roger Waters </span> nasceu em <span property="foaf:dateOfBirth" content="1943-09-06" datatype="xsd:date"> 6 de setembro de 1943 </span>
  • 26. SCHEMA.ORG • Iniciativa Google, Bing e Yahoo! • Gera Rich Snippet • Grande melhoria em SEO.
  • 27. BENEFÍCIOS • Significado explícito • Sem ambiguidades • Entendido por máquinas de busca
  • 28. LINKED DATA • Referências cruzadas globais • Embutidas em páginas HTML • RDFa, schema.org • Identificadores único (URIs) para conceitos • Bases de dados de referência
  • 29.
  • 30. LINKED OPEN DATA CLOUD • Repositório de uso geral • DBPedia (conceitos extraídos da Wikipedia) • FreeBase • Repositório sobre domínios específicos • GeoNames • MusicBrainz • Novos sites com autoridade sobre o domínio
  • 31. BUSCAS SEMÂNTICAS • Encontram e analisam meta-informação • tags com RDFa, microdata • repositório de triplas • Relacionam informações em sites diferentes • Exemplo: Sindice e Google*
  • 33.
  • 34.
  • 35.
  • 36.
  • 37.
  • 38.
  • 44.
  • 45.
  • 46.
  • 47.
  • 48. CONHECIMENTO ÚNICO Menor risco de duplicidade dos dados Simplificação do uso e da manutenção dos dados Agilidade na recuperação dos dados
  • 49. cita a entidade Materia Pessoa ONTOLOGIA TRIPLA cita a entidade Matéria Romário
  • 50.
  • 51. CASES RELEVANTES Modelos de uso da Web Semântica
  • 52. Best Buy • BBC • New York Times
  • 53.
  • 54. AÇÕES REALIZADAS • Uso da ontologia GoodRelations • Adição de metadados: RDFa
  • 55.
  • 56.
  • 57. RESULTADOS ALCANÇADOS • Tráfego originado por motores de busca: + 30% • Taxa de cliques no Yahoo!: + 15% • Aumento significativo do Google PageRank
  • 58.
  • 59. AÇÕES REALIZADAS • Ontologias públicas • Interligação com repositórios de dados externos • Criação de categorias e agregadores úteis
  • 61. Ontologias públicas utilizadas
  • 63.
  • 64.
  • 65. RESULTADOS ALCANÇADOS • Proliferação de links relevantes: potencialização de SEO • Reuso das informações: menor desperdício de pessoal • Navegação interligada e escalável para toda a BBC
  • 66.
  • 67. AÇÕES REALIZADAS • Anotação e indexação do conteúdo baseado em indivíduos • Ontologia pública • Interligação com repositórios de dados externos • Adição de metadados: Open Graph
  • 68. NYT Index Abstract ✓ Assuntos: Livestock; Goats; Jenny Brown, owner of Amputation; Prosthesis; Legs Woodstock (NY) Farm Animal Sanctuary, forms special ✓ Organizações:Woodstock Farm bond with Albie, goat that Animal Sanctuary probably escaped from New ✓ Lugares:Woodstock (NY); New York City slaughterhouse; York City Albie injured leg in escape and it had to be amputated; ✓ Pessoas: Santos, Fernanda; Brown, Brown had leg amputated as
  • 69.
  • 70.
  • 71.

Editor's Notes

  1. \n
  2. \n
  3. \n
  4. \n
  5. \n
  6. \n
  7. \n
  8. \n
  9. \n
  10. \n
  11. \n
  12. \n
  13. \n
  14. \n
  15. \n
  16. \n
  17. \n
  18. \n
  19. \n
  20. \n
  21. \n
  22. \n
  23. \n
  24. \n
  25. \n
  26. \n
  27. \n
  28. \n
  29. \n
  30. \n
  31. \n
  32. \n
  33. \n
  34. \n
  35. \n
  36. \n
  37. \n
  38. \n
  39. \n
  40. \n
  41. \n
  42. \n
  43. \n
  44. \n
  45. \n
  46. \n
  47. \n
  48. \n
  49. \n
  50. \n
  51. \n
  52. \n
  53. \n
  54. \n
  55. \n
  56. \n
  57. UM ROM&amp;#xC1;RIO ---- DADO CONSISTENTE NA NOSSA BASE\nDADO F&amp;#xC1;CIL DE USADO E MANTIDO\n\n
  58. PREDICADO CONECTA DUAS CLASSES\n
  59. ATORES: TIMES, T&amp;#xC9;CNICO, ETC...\nEVENTO: PARTIDA\nN&amp;#xC3;O TEM O JUIZ\n
  60. \n
  61. \n
  62. - Grande empresa varejo de eletronicos\n- Artigo semtech\n- benef&amp;#xED;cios da web sem&amp;#xE2;ntica\n\n\n
  63. good relations\n --&gt; vocabulario profissional e-commerce\n --&gt; amig&amp;#xE1;vel m&amp;#xE1;quina busca, mobile, exten&amp;#xE7;&amp;#xF5;es browser\nrdfa\n --&gt; anotar XHTML com sem&amp;#xE2;ntica\n --&gt; utilizado por m&amp;#xE1;quinas de busca, machine readable\n
  64. \n
  65. \n
  66. \n
  67. \n
  68. \n
  69. \n
  70. MUSIC BRAINZ - IMDB DA M&amp;#xDA;SICA\n
  71. DOM&amp;#xCD;NIO QUE INTERESSA A GLOBO.COM\n
  72. ESTOU PROCURANDO SOBRE NOT&amp;#xCD;CIAS DA CHINA\n
  73. P&amp;#xC1;GINA DE T&amp;#xD3;PICOS SOBRE A CHINA\n
  74. \n
  75. \n
  76. \n
  77. \n
  78. \n
  79. \n
  80. \n
  81. \n