Disciplina Sociedade da Informação Semântica e Ontologias

EGC9101 - 2009.3 Sociedade da Informação Professores • Aires Jose Rover ( [email_address] ) • Hugo Cesar Hoeschl ( [email_address] ) Alunos • Cássio F.M. Druziani ( [email_address] ) • César R. K. Stradiotto ( [email_address] ) • Danilo José dos Santos ( [email_address] ) • Thais Garcia ( [email_address] ) • Thiago Araújo ( [email_address] )

Sociedade da Informação Web Semântica Ontologia Buscadores na Web

WEB SEMÂNTICA Sociedade da Informação

HISTÓRICO 2001: Tim Berners-Lee, James Hendler, Ora Lassila: Scientific American: "Web Semântica: Um novo formato de conteúdo para a Web." Permitir cooperação e compreensão por máquinas e humanos. Interliga significado de palavras nos conteúdos publicados na internet. Intenção de desenvolver tecnologias e linguagem que tornem a informação legível para as máquinas. Integração de linguagens ou tecnologias (XML), (RDF), arquitetura de metadados, ontologias,etc.

PROPRIEDADES A Web semântica é uma biblioteca estruturada por critérios de escolha dos organizadores de conteúdo. Cada página tem vinculadas a si informações extras que dizem respeito ao seu conteúdo, são as metas informações. Elas estão estruturadas segundo um padrão formal e bem definido. Duas abordagem para Web Sem.: Bottom Up e Top Down B.U: Necessita tags nos textos e dados. T.D: Necessita processar os dados já existentes e criar novas conexões.

Exemplos de ferramentas de pesquisa: Freebase: Base de dados aberta. Pessoas criam dados e conectam-se entre si. Powerset: Adquirida pela Microsoft, é um engenho de busca, pode processar perguntas, ainda em estado inicial e funciona somente para o inglês. Twine: Aprende sobre seus interesses a partir do conteúdo compartilhado e faz um grafo desse conteúdo. Hakia: Apontado com um dos mais promissores engenho de busca, faz a análise de sentenças na hora de fazer uma busca. Talis, TrueKnowledge, Triplt, Cleaforest, Spock, PubMed, Mediline

ONTOLOGIA Sociedade da Informação

Uma concepção parcial de um domínio de conhecimento, compartilhado por uma comunidade de usuários, definido em uma linguagem formal processável por máquina com explícito intuito de compartilhar informação semântica através de sistema automatizado (JACOB, 2003, p. 20).

Para a ciência da computação e inteligência artificial, a ontologia é a linguagem formal utilizada para codificação de um determinado domínio com certas regras que suportem o processamento ou tornem legível pelo computador o conhecimento humano. De um modo simplista, é uma rede de relacionamentos onde os nós são conceitos, e as arestas são relações de significado.

LINGUAGENS DE MARCAÇÃO ONTOLÓGICAS Para representação do conteúdo no ambiente virtual utilizando-se de ontologias é necessário o uso de linguagens de marcação que possibilitem expressar o conhecimento, para tornar o conhecimento legível pela máquina e por outros usuários.

METADADOS DEFINIÇÃO ELEMENTOS DUBLIN CORE Padrão de metadados para representação do domínio de objetos na web, com 15 elementos essenciais. 1. Título; 2. Criador; 3. Assunto; 4. Descrição; 5. Publicador; 6. Contribuidor; 7. Data; 8. Tipo; 9. Formato; 10. Identificador; 11.Origem; 12. Idioma; 13. Relação; 14. Abrangência; 15. Direitos. FOAF Relação pessoas e objetos na Web, com três elementos essenciais: Básico Informações pessoais Projetos e Grupos

LINGUAGEM DE MARCAÇÃO SOBRE... XOL XML com marcações semânticas, taxonômicas, com relações binárias; OML Lógica descritiva e conceitual, utilizando classes, relacionamentos, objetos e facetas; SKOS Expressa conteúdo com lógica básica, por meio de thesauri, classificação, folksonomia, taxonomia e vocabulários controlados.

EDITORES DE ONTOLOGIAS EDITOR URL SOBRE Ontokem: http://ontokem.egc.ufsc.br Concebido e desenvolvido no Laboratório de Engenharia do Conhecimento (LEC) do EGC da UFSC, mediante cadastro é liberado acesso. Camptools Ontology Editor http://coe.ihmc.us/groups/coe/ Software gratuito de construção de ontologias em linguagem JAVA. DERI Ontology Management Environment http://dome.sourceforge.net/ Software open source de construção de ontologias Hozo http://www.hozo.jp/ Software em Java para criação de ontologias complexas. Kaon http://kaon.semanticweb.org/ Software livre de construção de ontologias KMGen http://www.algo.be/ref-projects.htm#KMgen Software livre Knoodl http://www.knoodl.com/ui/home.html Software virtual para criação de ontologias colaborativamente.

EDITOR URL SOBRE NeOn Toolkit http://neon-toolkit.org/wiki/Main_Page Software livre, em linguagem OWL para criação, suporte e reuso de ontologias. Protégé http://protege.stanford.edu/ Software livre de ontologia e construção de modelagem do conhecimento. Semantic Turkey http://semanticturkey.uniroma2.it/ Plataforma para bookmarking semântico e construção de ontologia. Swoop http://www.mindswap.org/2004/SWOOP/ Software livre em Java para edição e criação de ontologia. WebODE http://webode.dia.fi.upm.es/ Software ara construção de ontologia da Universidade de Madri. Model Futures OWL Editor http://www.modelfutures.com/owl/ Software livre para construção de ontologias em linguagem OWL. Open Calais http://www.opencalais.com/ Ferramenta que permite incorporar o estado da arte de funcionalidade semântica dentro do blog, site ou aplicação.

BUSCADORES NA WEB Sociedade da Informação

Os buscadores surgiram com o objetivo de ajudar a organizar o imenso universo que se tornou a internet. O primeiro buscador na história foi o Archie, criado em 1990 pelo estudante Alan Emtage. O Archie baixava listas de diretorios de todos os arquivos localizados em sites públicos de FTP. Enquanto o Archie indexava arquivos de computadores, outro buscador chamado Gopher indexava documento de texto. Com o lançamento da WWW, surgia em 1993 o primeiro buscador web chamado Wandex. Mecanismos de Busca: Como tudo começou

Linha de Tempo - Mecanismos de Busca O AliWeb é um dos primeiros buscadores lançados que existe até os dias de hoje. Primeiro sucesso comercial foi o Lycos surgido em 1994. Na época também surgiram o Excite, Infoseek e o AltaVista, todos competindo com o famoso buscador de diretórios do Yahoo! No Brasil temos o exemplo do Cadê? e Aonde. Logo depois surgiram os buscadores globais como o Google, Yahoo e MSN.

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Breve histórico do Google Foi na universidade de Standorf em 1995 que os estudantes Sergey Brin e Larry Page se conheceram. Os dois tinham a ambição de criar um algoritimo capaz de percorrer a web e trazer, em forma de links, os resultados encontrados. Com isso, em 1995 surgiu o BlackRub, uma ferramenta baseada em Java e Phyton que rodava em máquinas Intel e Sun. A partir dessa ferramenta, surgiria o famoso Google, nome adotado em 1997. O significado de Google é um termo forjado que vem de googol, inventado pelo Dr. Edward Kasner, da Universidade de Columbia. Kasner pretendia batizar com um nome sonoro e fácil de recordar a centésima potência do número 10.

Mecanismos de busca na WWW ,[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Diretório de pesquisa na Web É uma árvore de assuntos ou um diretório de assuntos, isto é, lista de assuntos organizada em categorias. Existem 2 tipos básicos: acadêmicos e comerciais, onde os interesses podem variar desde o uso intensificado, monitorado, selecionado. Portanto, o diretório de assuntos é um serviço que oferece uma coleção de links dos recursos Internet submetidos pelo site, criadores ou avaliadores e organizados em categorias de assuntos (áreas específicas). Os diretórios utilizam critérios de seleção para os links a serem incluídos.

Diferentes abordagens na criação de web semântica Fonte: http://www.readwriteweb.com/archives/10_semantic_apps_to_watch.php

Diretórios de pesquisa Argus Clearinghouse http://www.clearinghouse.net Pesquisa orientada (escolar); cobertura muito seletiva devido critérios específicos; recursos estão em ranking e avaliados; compilado por bibliotecários que são especialistas em assuntos; relativamente uma base de dados pequena. Enclyclopedia Britannica's Internet Guide http://www.eblast.com Arrola assuntos do interesse geral/tópicos educacionais; seletividade média alta - sites são revisados e reordenados no ranking; compilado pelo pessoal da Encyclopedia Brittanica (especialistas por assuntos); arrola acima de 125 000 sites. Infomine: Scholarly Internet Resource Collections http://lib-www.ucr.edu/ Pesquisa tópicos a nível universitário; alta seletividade; compilado por bibliotecários; arrola cerca de 14.000 sites

Diferenças entre Diretórios e Mecanismo de busca A diferença básica é que os diretórios são compilados por pessoas, enquanto os mecanismos de busca são automatizados.

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

Otimização de Sites É o conjunto de estratégias com o objetivo de potencializar e melhorar o posicionamento de um site nas páginas de resultados naturais (orgânicos) nos sites de busca. O termo SEO (Search Engine Optimization) também se refere a indústria de consultoria, que trabalha na otimização de projetos e websites de seus clientes. Os métodos são categorizados em: a) "SEO de White Hat" (geralmente utilizam métodos aprovados pelos sistemas de busca, como a prática de construção de conteúdo relevante e melhoria da qualidade do site); b) "SEO de Black Hat" (utilizam truques como "cloaking", que é a camuflagem do conteúdo real da página, e spamdexing). O termo "spamdexing" (originado da fusão de spam e indexing) refere-se a pratica de Spam direcionada aos motores de busca

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object]

Qualidade e Ranking de Páginas Diretrizes publicadas pelos mecanismos de busca e de codificação pelo W3C. Conteúdo atualizado, útil, original, significativo, links de acesso úteis pode alcançar uma grande quantidade de tráfego e posicionamento nos mecanismos de busca. Aumento do PageRank e visitação Como resultado, práticas de SEO que aumentam a qualidade do site mais provavelmente superarão táticas de manipulação do mecanismo de busca. Os melhores SEO recomendam focar-se em algo que sites de busca procuram: conteúdo relevante e útil para seus usuários.

USO DE SEARCH ENGINES TRADICIONAIS Fonte: http://www.seoconsultants.com/search-engines/ Buscadores 2009 Google Yahoo! Bing Ask Total 2009 09 70.46% 16.73% 9.28% 2.50% 98.97% 2009 08 70.24% 16.96% 9.44% 2.37% 99.01% 2009 07 72.07% 17.00% 7.31% 2.58% 98.96%

Inovações disruptivas em Search engines: Query Pre-processing; Information Sources; Algorithm Improvement; Results Visualization and Post-processing. Fonte: http://www.readwriteweb.com/archives/top_17_search_innovations.php Incluiríamos ainda como categoria a parte: Web ontology Buscadores

1. Query Pre-processing; hakia collarity Powerset (adquirido pela Microsoft, BING) Buscadores

2. Personal relevance ( Buscas personalizadas por usuário ) Interesses e requerimentos diferenciados para cada usuário resulta em um grau de relevância maior nos resultados fornecidos 2.1. Location Based Personalization 2.2. Interface Based Personalization 2.3. Query History Based Personalization 2.4. Input/Output Mode Based 2.5. Time Based Personalization 2.6. Individual User Behaviour Based Personalization 2.7. Group Based Behaviour Based Personalization 2.8. Social Search Based Personalization 2.9. Virtual Personas/Assistants Based Personalization

3. Canned, specialized searches (canned = enlatado, conversas..) Pesquisa especializada, vertical e pré-configurada: Empregos ( http://www.simplyhired.com.br/ )

4. New content types Buscadores verticalizados (especializados) por conteúdo. Video ( Youtube , truveo ), TV ( Blinkx ), Images ( Picsearch , Netvue ) Blogs ( Technorati ), News ( Topix ), Classifieds ( oodle ) Buscadores

5. Restricted Data Sources Rollyo  Create search engines using the sources you trust ( http://www.rollyo.com/ ) Google pesquisa personalizada (www.google.com/cse) Buscadores

7. Parametric search A busca paramétrica está mais para uma database query do que para uma busca. Foco na solução de problemas ao inves de textos e documentos. GlobalSpec Permite especificar uma variedade de parametros enquanto se procura por produtos da área de engenharia. Buscadores

8. Social Input Ferramentas web 2.0 del.icio.us Google PageRank é implicitamente construído colaborativamente Yahoo answers Etc. Buscadores

[object Object],[object Object],[object Object],[object Object],[object Object],Buscas por ontologia Buscadores ,[object Object],[object Object],[object Object]

[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object],[object Object]

REFERÊNCIAS ,[object Object],[object Object],[object Object],[object Object],[object Object]

REFERÊNCIAS ,[object Object],[object Object],[object Object]

Disciplina Sociedade da Informação Semântica e Ontologias

Recomendados

Recomendados

Mais conteúdo relacionado

Mais procurados

Mais procurados (11)

Destaque

Destaque (20)

Semelhante a Disciplina Sociedade da Informação Semântica e Ontologias

Semelhante a Disciplina Sociedade da Informação Semântica e Ontologias (20)

Mais de Sociedade da Informação

Mais de Sociedade da Informação (13)

Último

Último (20)

Disciplina Sociedade da Informação Semântica e Ontologias