EGC9101 - 2009.3  Sociedade da Informação Professores   • Aires Jose Rover ( [email_address] ) • Hugo Cesar Hoeschl ( [ema...
Sociedade da Informação     Web Semântica Ontologia Buscadores na Web
WEB SEMÂNTICA Sociedade da Informação
HISTÓRICO 2001: Tim Berners-Lee, James Hendler, Ora Lassila: Scientific American: "Web Semântica: Um novo formato de ...
PROPRIEDADES   A Web semântica é uma biblioteca estruturada por  critérios de escolha dos organizadores de conteúdo.    Ca...
Exemplos de ferramentas de pesquisa:   Freebase: Base de dados aberta. Pessoas criam dados e conectam-se entre si. Powerse...
ONTOLOGIA Sociedade da Informação
Uma concepção parcial de um domínio de conhecimento, compartilhado por uma comunidade de usuários, definido em uma linguag...
Para a ciência da computação e inteligência artificial, a ontologia é a linguagem formal utilizada para codificação de um ...
LINGUAGENS DE MARCAÇÃO ONTOLÓGICAS Para representação do conteúdo no ambiente virtual utilizando-se de ontologias é necess...
METADADOS  DEFINIÇÃO  ELEMENTOS  DUBLIN CORE Padrão de metadados para representação do domínio de objetos na web, com 15 e...
 
LINGUAGEM DE MARCAÇÃO  SOBRE... XOL  XML com marcações semânticas, taxonômicas, com relações binárias; OML Lógica descriti...
EDITORES DE ONTOLOGIAS EDITOR URL SOBRE Ontokem: http://ontokem.egc.ufsc.br  Concebido e desenvolvido no  Laboratório de E...
EDITOR URL SOBRE NeOn Toolkit http://neon-toolkit.org/wiki/Main_Page Software livre, em linguagem OWL para criação, suport...
BUSCADORES NA WEB Sociedade da Informação
Os buscadores surgiram com o objetivo de ajudar a organizar o imenso universo que se tornou a internet. O primeiro buscado...
Linha de Tempo - Mecanismos de Busca    O AliWeb é um dos primeiros buscadores lançados que existe até os dias de hoje.   ...
<ul><li>Mecanismo de busca </li></ul><ul><li>  </li></ul><ul><li>É uma base de dados de arquivos da Internet coletados por...
 
 
Breve histórico do Google    Foi na universidade de Standorf em 1995 que os estudantes Sergey Brin e Larry Page se conhece...
 
Mecanismos de busca na WWW   <ul><ul><li>AltaVista  http://altavista.com   </li></ul></ul><ul><ul><li>Excite  http://www.e...
Diretório de pesquisa na Web   É uma árvore de assuntos ou um diretório de assuntos, isto é, lista de assuntos organizada ...
Diferentes abordagens na criação de web semântica Fonte:  http://www.readwriteweb.com/archives/10_semantic_apps_to_watch.php
Diretórios de pesquisa    Argus Clearinghouse  http://www.clearinghouse.net  Pesquisa orientada (escolar); cobertura muito...
Diferenças entre Diretórios e Mecanismo de busca     A diferença básica é que os diretórios são  compilados por pessoas, e...
<ul><li>Ferramentas de Metabusca </li></ul><ul><li>Os meta mecanismos de busca realizam pesquisas simultaneamente em difer...
<ul><li>Lista de Meta Mecanismos de busca   </li></ul><ul><li>  </li></ul><ul><ul><li>All4one  http://all4one.com  Índice ...
<ul><li>Lista de Meta Mecanismos de busca   </li></ul><ul><li>  </li></ul><ul><ul><li>Northern Light  http://www.northernl...
<ul><li>Lista de Meta Mecanismos de busca   </li></ul><ul><li>  </li></ul><ul><ul><li>Online Language Dictionaries and  Tr...
Otimização de Sites   É o conjunto de estratégias com o objetivo de potencializar e melhorar o posicionamento de um site n...
<ul><li>Tipos de Listagens nas páginas de resultado </li></ul><ul><li>  </li></ul><ul><li>   </li></ul><ul><li>Os Mecanism...
<ul><li>Critérios de classificação de um website  </li></ul><ul><li>  </li></ul><ul><li>Para classificar os sites, os meca...
<ul><ul><li>Originalidade do conteúdo </li></ul></ul><ul><ul><li>Termos relevantes utilizados no conteúdo (os termos que o...
<ul><ul><li>Texto próximos aos links que apontam para fora e os links de chegada. Um link acompanhado das palavras &quot;l...
<ul><ul><li>Uso de sub-domínios, uso de palavras-chave em sub-domínios e volume de conteúdo nos sub-domínios, com pontuaçã...
<ul><ul><li>Qualidade da codificação HTML, presença de erros no código </li></ul></ul><ul><ul><li>Taxa real de cliques obs...
Qualidade e Ranking de Páginas     Diretrizes publicadas pelos mecanismos de busca e de codificação pelo W3C.   Conteúdo a...
USO DE SEARCH ENGINES TRADICIONAIS  Fonte:  http://www.seoconsultants.com/search-engines/ Buscadores 2009 Google Yahoo! Bi...
Inovações disruptivas em Search engines:  Query Pre-processing;  Information Sources;  Algorithm Improvement;  Results Vis...
1. Query Pre-processing;  hakia  collarity Powerset (adquirido pela Microsoft, BING) Buscadores
2. Personal relevance ( Buscas personalizadas por usuário ) Interesses e requerimentos diferenciados para cada usuário res...
3. Canned, specialized searches (canned = enlatado, conversas..) Pesquisa especializada, vertical e pré-configurada:  Empr...
4. New content types Buscadores verticalizados (especializados) por conteúdo. Video ( Youtube ,  truveo  ), TV ( Blinkx  )...
5.  Restricted Data Sources   Rollyo  Create search engines using the sources you trust ( http://www.rollyo.com/ ) Google...
7.  Parametric search   A busca paramétrica está mais para uma database query do que para uma busca. Foco na solução de pr...
8. Social Input   Ferramentas web 2.0 del.icio.us   Google PageRank  é implicitamente construído colaborativamente Yahoo a...
<ul><ul><li>http://umbel.org/ </li></ul></ul><ul><ul><li>UMBEL  </li></ul></ul><ul><ul><li>UMBEL Ontology Documentation </...
<ul><li>Buscador Semântico   </li></ul><ul><li>  </li></ul><ul><ul><li>Wolfram Alpha Computational Knowlegdge Engine </li>...
REFERÊNCIAS <ul><ul><li>BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The Semantic Web: a new form of Web content that is mean...
REFERÊNCIAS <ul><ul><li>ONTOLOGY INFERENCE LAYER OIL. Disponível em: <http://www.few.vu.nl/~ontoknow/oil/>. </li></ul></ul...
REFERÊNCIAS <ul><ul><li>_____. _____.  SKOS Simple Knowledge Organization System Primer . Massachusetts, 18 ago. 2009. Dis...
Upcoming SlideShare
Loading in …5
×

Disciplina Sociedade da Informação Semântica e Ontologias

5,554 views
5,453 views

Published on

O documento apresenta brevemente a definição de semantica, e alguns de seus tipos, visões da web. Também são apresentadas títulos e links de páginas da web que trabalham com busca semantica.

Também apresenta brevemente os tipos de ontologias, sua utilidade, e alguns exemplos de ferramentas de construção e utilização de ontologias.

Published in: Education
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
5,554
On SlideShare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
36
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Disciplina Sociedade da Informação Semântica e Ontologias

  1. 1. EGC9101 - 2009.3 Sociedade da Informação Professores • Aires Jose Rover ( [email_address] ) • Hugo Cesar Hoeschl ( [email_address] )   Alunos • Cássio F.M. Druziani ( [email_address] ) • César R. K. Stradiotto ( [email_address] ) • Danilo José dos Santos ( [email_address] )  • Thais Garcia ( [email_address] ) • Thiago Araújo ( [email_address] )
  2. 2. Sociedade da Informação     Web Semântica Ontologia Buscadores na Web
  3. 3. WEB SEMÂNTICA Sociedade da Informação
  4. 4. HISTÓRICO 2001: Tim Berners-Lee, James Hendler, Ora Lassila: Scientific American: &quot;Web Semântica: Um novo formato de conteúdo para a Web.&quot;   Permitir cooperação e compreensão por máquinas e humanos. Interliga significado de palavras nos conteúdos publicados na internet. Intenção de desenvolver tecnologias e linguagem que tornem  a informação legível para as máquinas.    Integração de linguagens ou tecnologias (XML),  (RDF), arquitetura de metadados, ontologias,etc.
  5. 5. PROPRIEDADES   A Web semântica é uma biblioteca estruturada por  critérios de escolha dos organizadores de conteúdo.    Cada página tem vinculadas a si  informações extras  que dizem respeito ao seu conteúdo, são as metas informações. Elas estão estruturadas  segundo um padrão formal e bem definido.    Duas abordagem para Web Sem.: Bottom Up e Top Down   B.U: Necessita tags nos textos e dados. T.D: Necessita processar os dados já existentes e criar novas conexões.
  6. 6. Exemplos de ferramentas de pesquisa:   Freebase: Base de dados aberta. Pessoas criam dados e conectam-se entre si. Powerset:  Adquirida pela Microsoft, é um engenho de busca, pode processar perguntas, ainda em estado inicial e funciona somente para o inglês. Twine: Aprende sobre seus interesses a partir do conteúdo compartilhado e faz um grafo desse conteúdo. Hakia:  Apontado  com um dos mais promissores engenho de busca, faz a análise de sentenças na hora de fazer uma busca. Talis, TrueKnowledge, Triplt, Cleaforest, Spock, PubMed, Mediline
  7. 7. ONTOLOGIA Sociedade da Informação
  8. 8. Uma concepção parcial de um domínio de conhecimento, compartilhado por uma comunidade de usuários, definido em uma linguagem formal processável por máquina com explícito intuito de compartilhar informação semântica através de sistema automatizado (JACOB, 2003, p. 20).
  9. 9. Para a ciência da computação e inteligência artificial, a ontologia é a linguagem formal utilizada para codificação de um determinado domínio com certas regras que suportem o processamento ou tornem legível pelo computador o conhecimento humano.   De um modo simplista, é uma rede de relacionamentos onde os nós são conceitos, e as arestas são relações de significado.
  10. 10. LINGUAGENS DE MARCAÇÃO ONTOLÓGICAS Para representação do conteúdo no ambiente virtual utilizando-se de ontologias é necessário o uso de linguagens de marcação que possibilitem expressar o conhecimento, para tornar o conhecimento legível pela máquina e por outros usuários.
  11. 11. METADADOS DEFINIÇÃO ELEMENTOS DUBLIN CORE Padrão de metadados para representação do domínio de objetos na web, com 15 elementos essenciais.  1. Título; 2. Criador; 3. Assunto;  4. Descrição; 5. Publicador; 6. Contribuidor; 7. Data; 8. Tipo; 9. Formato; 10. Identificador; 11.Origem; 12. Idioma; 13. Relação; 14. Abrangência; 15. Direitos.  FOAF Relação pessoas e objetos na Web, com três elementos essenciais: Básico Informações pessoais Projetos e Grupos
  12. 13. LINGUAGEM DE MARCAÇÃO SOBRE... XOL XML com marcações semânticas, taxonômicas, com relações binárias; OML Lógica descritiva e conceitual, utilizando classes, relacionamentos, objetos e facetas; SKOS Expressa conteúdo com lógica básica, por meio de thesauri, classificação, folksonomia, taxonomia e vocabulários controlados.
  13. 14. EDITORES DE ONTOLOGIAS EDITOR URL SOBRE Ontokem: http://ontokem.egc.ufsc.br Concebido e desenvolvido no  Laboratório de Engenharia do Conhecimento (LEC) do EGC da UFSC, mediante cadastro é liberado acesso. Camptools Ontology Editor http://coe.ihmc.us/groups/coe/ Software gratuito de construção de ontologias em linguagem JAVA. DERI Ontology Management Environment http://dome.sourceforge.net/ Software open source de construção de ontologias Hozo http://www.hozo.jp/ Software em Java para criação de ontologias complexas. Kaon http://kaon.semanticweb.org/ Software livre de construção de ontologias KMGen http://www.algo.be/ref-projects.htm#KMgen Software livre Knoodl http://www.knoodl.com/ui/home.html Software virtual para criação de ontologias colaborativamente.
  14. 15. EDITOR URL SOBRE NeOn Toolkit http://neon-toolkit.org/wiki/Main_Page Software livre, em linguagem OWL para criação, suporte e reuso de ontologias. Protégé http://protege.stanford.edu/ Software livre de ontologia e construção de modelagem do conhecimento. Semantic Turkey http://semanticturkey.uniroma2.it/ Plataforma para bookmarking semântico e construção de ontologia. Swoop http://www.mindswap.org/2004/SWOOP/ Software livre em Java para edição e criação de ontologia. WebODE http://webode.dia.fi.upm.es/ Software ara construção de ontologia da Universidade de Madri. Model Futures OWL Editor http://www.modelfutures.com/owl/ Software livre para construção de ontologias em linguagem OWL. Open Calais http://www.opencalais.com/ Ferramenta que permite incorporar o estado da arte de funcionalidade semântica dentro do blog, site ou aplicação.
  15. 16. BUSCADORES NA WEB Sociedade da Informação
  16. 17. Os buscadores surgiram com o objetivo de ajudar a organizar o imenso universo que se tornou a internet. O primeiro buscador na história foi o Archie, criado em 1990 pelo estudante Alan Emtage. O Archie baixava listas de diretorios de todos os arquivos localizados em sites públicos de FTP. Enquanto o Archie indexava arquivos de computadores, outro buscador chamado Gopher indexava documento de texto.    Com o lançamento da WWW, surgia em 1993 o primeiro buscador web chamado Wandex. Mecanismos de Busca: Como tudo começou
  17. 18. Linha de Tempo - Mecanismos de Busca    O AliWeb é um dos primeiros buscadores lançados que existe até os dias de hoje.   Primeiro sucesso comercial foi o Lycos surgido em 1994.    Na época também surgiram o Excite, Infoseek e o AltaVista, todos competindo com o famoso buscador de diretórios do Yahoo!   No Brasil temos o exemplo do Cadê? e Aonde.   Logo depois surgiram os buscadores globais como o Google, Yahoo e MSN.
  18. 19. <ul><li>Mecanismo de busca </li></ul><ul><li>  </li></ul><ul><li>É uma base de dados de arquivos da Internet coletados por um programa de computador (conhecidos como wanderer, crawler, robot, worm, spider). A indexação é realizada nos arquivos coletados, por exemplo, pelo título, texto íntegral, tamanho, URL, entre outros. </li></ul><ul><li>Os mecanismos de busca são também conhecidos como serviços de busca ou serviços de mecanismos de busca. Isto consiste conforme seus componentes: </li></ul><ul><ul><li>  Spider : Programa que vasculha a Web de link para link, identificando e lendo as páginas. </li></ul></ul><ul><ul><li>  Index : base de dados contendo de cada página obtida pelo spider </li></ul></ul><ul><ul><li>  Mecanismo de busca : Software que possibilita aos usuários consultarem o índice e o qual devolve resultados da busca pela relação numa ordem de relevância. </li></ul></ul>
  19. 22. Breve histórico do Google   Foi na universidade de Standorf em 1995 que os estudantes Sergey Brin e Larry Page se conheceram. Os dois tinham a ambição de criar um algoritimo capaz de percorrer a web e trazer, em forma de links, os resultados encontrados.    Com isso, em 1995 surgiu o BlackRub, uma ferramenta baseada em Java e Phyton que rodava em máquinas Intel e Sun. A partir dessa ferramenta, surgiria o famoso Google, nome adotado em 1997. O significado de Google é um termo forjado que vem de googol, inventado pelo Dr. Edward Kasner, da Universidade de Columbia. Kasner pretendia batizar com um nome sonoro e fácil de recordar a centésima potência do número 10.
  20. 24. Mecanismos de busca na WWW <ul><ul><li>AltaVista http://altavista.com   </li></ul></ul><ul><ul><li>Excite http://www.excite.com    </li></ul></ul><ul><ul><li>HotBot http://www.hotbot.com/   </li></ul></ul><ul><ul><li>Infoseek http://infoseek.go.com/   </li></ul></ul><ul><ul><li>Northern Light Search http://www.northernlight.com/   </li></ul></ul><ul><ul><li>Yahoo! http://www.yahoo.com/   </li></ul></ul><ul><ul><li>MSN http://www.msn.com </li></ul></ul><ul><ul><li>Google http://www.google.com   </li></ul></ul>
  21. 25. Diretório de pesquisa na Web   É uma árvore de assuntos ou um diretório de assuntos, isto é, lista de assuntos organizada em categorias.   Existem 2 tipos básicos: acadêmicos e comerciais, onde os interesses podem variar desde o uso intensificado, monitorado, selecionado.    Portanto, o diretório de assuntos é um serviço que oferece uma coleção de links dos recursos Internet submetidos pelo site, criadores ou avaliadores e organizados em categorias de assuntos (áreas específicas).   Os diretórios utilizam critérios de seleção para os links a serem incluídos.
  22. 26. Diferentes abordagens na criação de web semântica Fonte: http://www.readwriteweb.com/archives/10_semantic_apps_to_watch.php
  23. 27. Diretórios de pesquisa   Argus Clearinghouse http://www.clearinghouse.net Pesquisa orientada (escolar); cobertura muito seletiva devido critérios específicos; recursos estão em ranking e avaliados; compilado por bibliotecários que são especialistas em assuntos; relativamente uma base de dados pequena.  Enclyclopedia Britannica's Internet Guide http://www.eblast.com Arrola assuntos do interesse geral/tópicos educacionais; seletividade média alta - sites são revisados e reordenados no ranking;  compilado pelo pessoal da Encyclopedia Brittanica (especialistas por assuntos);  arrola acima de 125 000 sites.    Infomine: Scholarly Internet Resource Collections http://lib-www.ucr.edu/ Pesquisa tópicos a nível universitário; alta seletividade; compilado por bibliotecários; arrola cerca de 14.000 sites
  24. 28. Diferenças entre Diretórios e Mecanismo de busca     A diferença básica é que os diretórios são  compilados por pessoas, enquanto os mecanismos de busca são automatizados.
  25. 29. <ul><li>Ferramentas de Metabusca </li></ul><ul><li>Os meta mecanismos de busca realizam pesquisas simultaneamente em diferentes mecanismos de busca. Estes mecanismos não possuem nenhum tipo de bases de dados, ou seja, baseiam-se nos dados de outros mecanismos de busca. </li></ul><ul><li>  </li></ul><ul><li>Estas ferramentas de pesquisa são utilizados quando se procurar por: </li></ul><ul><ul><li>  um tópico obscuro; </li></ul></ul><ul><ul><li>  não obter resultados em buscas; </li></ul></ul><ul><ul><li>  a pesquisa não é complexa; </li></ul></ul><ul><ul><li>  recuperar o maior número de documentos possíveis com uma estrutura de sintaxe, assuntos especiais que possam limitar resultados da busca. </li></ul></ul>
  26. 30. <ul><li>Lista de Meta Mecanismos de busca   </li></ul><ul><li>  </li></ul><ul><ul><li>All4one http://all4one.com Índice de meta-mecanismos de busca, compila mecanismos de busca. </li></ul></ul><ul><ul><li>All-in-One Search Page http://www.albany.net/allinone/   Este site reúne inúmeros localizadores de informação da Net. Além disso, permite que sejam realizadas buscas de arquivos usando as ferramentas Archie e Veronica.  </li></ul></ul><ul><ul><li>Cyber 411 http://www.cyber411.com Busca simultânea em 16 mecanismos de busca. </li></ul></ul><ul><ul><li>The Internet Sleuth http://www.isleuth.com Indexa mais de 3.000 bases de dados (muitas destas não são indexadas pelos grandes mecanismos de busca) cobrindo uma variedade imensa de tópicos. </li></ul></ul><ul><ul><li>Mamma http://www.mamma.com Utiliza 7 mecanismos de busca. Relaciona cerca de 2200 revistas (por categoria) e 900 jornais (por local). </li></ul></ul>
  27. 31. <ul><li>Lista de Meta Mecanismos de busca   </li></ul><ul><li>  </li></ul><ul><ul><li>Northern Light http://www.northernlight.com A Northern Light é uma nova forma de organizar o resultado da busca: qualquer procura resulta em duas colunas: &quot;Best Documents&quot; (melhores documentos) do lado direito, e &quot;Custom Search Folders&quot; (Pastas de Procura Refinada) do lado esquerdo.  </li></ul></ul><ul><ul><li>MetaCrawler http://www.metacrawler.com Em vez de manter uma base de dados própria, ele remete sua pesquisa para outras ferramentas incluindo Lycos, WebCrawlwer, Excite, AltaVista, Yahoo, HotBot e Galaxy. </li></ul></ul><ul><ul><li>Multimeta http://www.multimeta.com Procura em 10 mecanismos de busca internacionais. </li></ul></ul><ul><ul><li>1Blink.com - OneBlink.com http://www.1blink.com Realiza a busca em: Infoseek, AltaVista, HotBot, Alcanseek, Yahoo!, Northern Light, Excite, Lycos, Thunderstone, EuroSeek e Planet Search. </li></ul></ul><ul><li>  </li></ul>
  28. 32. <ul><li>Lista de Meta Mecanismos de busca   </li></ul><ul><li>  </li></ul><ul><ul><li>Online Language Dictionaries and  Translators http://rivendel.com/~ric/resources/dictionary.html </li></ul></ul><ul><ul><li>Oferece links para mais de 80 dicionários para tradução de idiomas.  </li></ul></ul><ul><ul><li>ProFusion http://profusion.ittc.ukans.edu Busca simultaneamente em 9 mecanismos. Premiado como meta-mecanismo de busca pela revista PC Professionell, n. 12, 1998. </li></ul></ul><ul><ul><li>Search Spaniel http://www.searchspaniel.com Realiza busca em 12 mecanismos. </li></ul></ul>
  29. 33. Otimização de Sites   É o conjunto de estratégias com o objetivo de potencializar e melhorar o posicionamento de um site nas páginas de resultados naturais (orgânicos) nos sites de busca. O termo SEO (Search Engine Optimization) também se refere a indústria de consultoria, que trabalha na otimização de projetos e websites de seus clientes.    Os métodos são categorizados em: a) &quot;SEO de White Hat&quot; (geralmente utilizam métodos aprovados pelos sistemas de busca, como a prática de construção de conteúdo relevante e melhoria da qualidade do site); b) &quot;SEO de Black Hat&quot; (utilizam truques como &quot;cloaking&quot;, que é a camuflagem do conteúdo real da página, e spamdexing). O termo &quot;spamdexing&quot; (originado da fusão de spam e indexing) refere-se a pratica de Spam direcionada aos motores de busca
  30. 34. <ul><li>Tipos de Listagens nas páginas de resultado </li></ul><ul><li>  </li></ul><ul><li>  </li></ul><ul><li>Os Mecanismos de Busca indicam diferentes tipos de listagens nas páginas de resultados, incluindo: </li></ul><ul><ul><li>publicidade paga nas páginas de resultados (SERPs - Search Engine Result Pages); </li></ul></ul><ul><ul><li>conteúdo de publicidade paga por clique pay-per-click; </li></ul></ul><ul><ul><li>anúncios; </li></ul></ul><ul><ul><li>pagamento para inclusões em sistemas de busca; </li></ul></ul><ul><ul><li>resultados de busca orgânica. </li></ul></ul>
  31. 35. <ul><li>Critérios de classificação de um website </li></ul><ul><li>  </li></ul><ul><li>Para classificar os sites, os mecanismos de busca levam em consideração os seguintes aspectos: </li></ul><ul><ul><li>Tempo de registro do domínio (Idade do domínio) </li></ul></ul><ul><ul><li>Idade do conteúdo </li></ul></ul><ul><ul><li>Freqüência do conteúdo: regularidade com a qual novo conteúdo é adicionado </li></ul></ul><ul><ul><li>Tamanho do texto: número de palavras acima de 200-250 (não afetava o Google em 2005) </li></ul></ul><ul><ul><li>Idade do link e reputação do site que o aponta </li></ul></ul><ul><ul><li>Características padrão da página </li></ul></ul><ul><ul><li>Pontuação negativa sobre as características da página (por exemplo, redução para sítios web com utilização extensiva de meta-tags de palavra chave, indicativos de terem sido artificialmente otimizadas)a   </li></ul></ul><ul><li>(continua) </li></ul>
  32. 36. <ul><ul><li>Originalidade do conteúdo </li></ul></ul><ul><ul><li>Termos relevantes utilizados no conteúdo (os termos que os buscadores associam como sendo relacionados ao tema principal da página) </li></ul></ul><ul><ul><li>Google Pagerank (usado apenas no algoritmo do Google) </li></ul></ul><ul><ul><li>Quantidade de links externos </li></ul></ul><ul><ul><li>O texto âncora contido nos links externos </li></ul></ul><ul><ul><li>Relevância do site que linka para o seu website </li></ul></ul><ul><ul><li>Citações e fontes de pesquisa (indica que o conteúdo é de qualidade para pesquisa) </li></ul></ul><ul><ul><li>Termos relacionados na base de dados do mecanismo de busca (financiar/financiamento) </li></ul></ul><ul><ul><li>Pontuação negativa para links de chegada (provavelmente advindos de páginas de baixo valor, links de chegada recíprocos, etc.) </li></ul></ul><ul><ul><li>Ritmo de aquisição dos links de chegada: muitos ou incremento muito rápido pode indicar atividade comercial de compra de links                                                   (continua) </li></ul></ul>
  33. 37. <ul><ul><li>Texto próximos aos links que apontam para fora e os links de chegada. Um link acompanhado das palavras &quot;links patrocinados&quot; pode ser ignorado </li></ul></ul><ul><ul><li>Profundidade do documento no site </li></ul></ul><ul><ul><li>Métricas coletadas de outras fontes, tais como monitoramento da frequência com a qual usuários retornam clicando em voltar quando as SERPs (Search Engine Results Page) as enviam para uma página em particula </li></ul></ul><ul><ul><li>Métricas coletadas de fontes como Google Toolbar, Google AdWords/Adsense, etc. </li></ul></ul><ul><ul><li>Métricas coletadas de compartilhamento de dados com terceiros (como provedores de dados estatísticos de programas utilizados para monitorar tráfego de sítios (sites)) </li></ul></ul><ul><ul><li>Ritmo de remoção dos links que apontam para o site </li></ul></ul><ul><li>  </li></ul><ul><li>(continua) </li></ul>
  34. 38. <ul><ul><li>Uso de sub-domínios, uso de palavras-chave em sub-domínios e volume de conteúdo nos sub-domínios, com pontuação negativa para esta atividade </li></ul></ul><ul><ul><li>Conexões semânticas dos documentos servidos </li></ul></ul><ul><ul><li>IP do serviço de hospedagem e o número/qualidade dos demais sites hospedados no local </li></ul></ul><ul><ul><li>Uso de redirecionamentos 301 ao invés de redirecionamentos 302 (temporário) </li></ul></ul><ul><ul><li>Mostrar um cabeçalho de erro 404 em vez de 200 para páginas que não existem </li></ul></ul><ul><ul><li>Uso adequado do arquivo robots.txt </li></ul></ul><ul><ul><li>Frequência de tempo em que servidor se encontra ativo (Confiabilidade) </li></ul></ul><ul><ul><li>Se o site mostra conteúdo diferente para diferente tipos de usuários ou crawlers </li></ul></ul><ul><ul><li>Links &quot;quebrados&quot; </li></ul></ul><ul><ul><li>Conteúdo inseguro ou ilegal                                       (continua) </li></ul></ul>
  35. 39. <ul><ul><li>Qualidade da codificação HTML, presença de erros no código </li></ul></ul><ul><ul><li>Taxa real de cliques observados pelo mecanismo de busca para as listas exibidas na SERPs </li></ul></ul><ul><ul><li>Classificação de importância feita por humanos nas páginas com acessos mais frequentes </li></ul></ul>
  36. 40. Qualidade e Ranking de Páginas   Diretrizes publicadas pelos mecanismos de busca e de codificação pelo W3C.   Conteúdo atualizado, útil, original, significativo, links de acesso úteis pode alcançar uma grande quantidade de tráfego e posicionamento nos mecanismos de busca.   Aumento do PageRank e visitação   Como resultado, práticas de SEO que aumentam a qualidade do site mais provavelmente superarão táticas de manipulação do mecanismo de busca. Os melhores SEO recomendam focar-se em algo que sites de busca procuram: conteúdo relevante e útil para seus usuários.
  37. 41. USO DE SEARCH ENGINES TRADICIONAIS Fonte: http://www.seoconsultants.com/search-engines/ Buscadores 2009 Google Yahoo! Bing Ask Total 2009 09 70.46% 16.73% 9.28% 2.50% 98.97% 2009 08 70.24% 16.96% 9.44% 2.37% 99.01% 2009 07 72.07% 17.00% 7.31% 2.58% 98.96%
  38. 42. Inovações disruptivas em Search engines: Query Pre-processing; Information Sources; Algorithm Improvement; Results Visualization and Post-processing. Fonte: http://www.readwriteweb.com/archives/top_17_search_innovations.php Incluiríamos ainda como categoria a parte: Web ontology Buscadores
  39. 43. 1. Query Pre-processing; hakia collarity Powerset (adquirido pela Microsoft, BING) Buscadores
  40. 44. 2. Personal relevance ( Buscas personalizadas por usuário ) Interesses e requerimentos diferenciados para cada usuário resulta em um grau de relevância maior nos resultados fornecidos 2.1. Location Based Personalization 2.2. Interface Based Personalization 2.3. Query History Based Personalization 2.4. Input/Output Mode Based 2.5. Time Based Personalization 2.6. Individual User Behaviour Based Personalization 2.7. Group Based Behaviour Based Personalization 2.8. Social Search Based Personalization 2.9. Virtual Personas/Assistants Based Personalization
  41. 45. 3. Canned, specialized searches (canned = enlatado, conversas..) Pesquisa especializada, vertical e pré-configurada: Empregos ( http://www.simplyhired.com.br/ )
  42. 46. 4. New content types Buscadores verticalizados (especializados) por conteúdo. Video ( Youtube , truveo ), TV ( Blinkx ), Images ( Picsearch , Netvue ) Blogs ( Technorati ), News ( Topix ), Classifieds ( oodle ) Buscadores
  43. 47. 5. Restricted Data Sources Rollyo  Create search engines using the sources you trust ( http://www.rollyo.com/ ) Google pesquisa personalizada (www.google.com/cse) Buscadores
  44. 48. 7. Parametric search A busca paramétrica está mais para uma database query do que para uma busca. Foco na solução de problemas ao inves de textos e documentos. GlobalSpec Permite especificar uma variedade de parametros enquanto se procura por produtos da área de engenharia. Buscadores
  45. 49. 8. Social Input Ferramentas web 2.0 del.icio.us Google PageRank é implicitamente construído colaborativamente Yahoo answers Etc. Buscadores
  46. 50. <ul><ul><li>http://umbel.org/ </li></ul></ul><ul><ul><li>UMBEL </li></ul></ul><ul><ul><li>UMBEL Ontology Documentation </li></ul></ul><ul><ul><li>UMBEL Vocabulary </li></ul></ul><ul><ul><li>Other UMBEL Documentation and Files </li></ul></ul>Buscas por ontologia Buscadores <ul><ul><li>Ontojuris http://www.ontojuris.com.br:8060/ontojuris/analise/Analise.do </li></ul></ul><ul><ul><li>MONGEE http://apps.ciram.com.br/mongee/analise/Analise.do </li></ul></ul><ul><ul><li>Ontoweb http://www.ontoweb.com.br/ </li></ul></ul>
  47. 51. <ul><li>Buscador Semântico   </li></ul><ul><li>  </li></ul><ul><ul><li>Wolfram Alpha Computational Knowlegdge Engine </li></ul></ul><ul><ul><li>Swootti: opiniões sobre produtos </li></ul></ul><ul><ul><li>Ideas Afines: palavras e conceitos relacionados </li></ul></ul><ul><ul><li>AskWiki y Powerset: usa a base Wikipedia em inglês </li></ul></ul><ul><ul><li>Hakia: responde a perguntas escritas en inglês </li></ul></ul><ul><ul><li>Kartoo: destaca as buscas em forma gráfica conforme importância. </li></ul></ul><ul><ul><li>Retrievr: imagens no Flickr </li></ul></ul><ul><ul><li>Mnemomap: diferentes locais como Digg, youtube, del.icio.us e imagens </li></ul></ul><ul><ul><li>WebBrain: exibe grupos relacionadas as palavras utilizadas nas buscas </li></ul></ul><ul><ul><li>SWoogle: busca documentos nos formatos OWL, RDF, DAML </li></ul></ul>
  48. 52. REFERÊNCIAS <ul><ul><li>BERNERS-LEE, T.; HENDLER, J.; LASSILA, O. The Semantic Web: a new form of Web content that is meaningful to computers will unleash a revolution of new possibilities. Scientific American Magazine , Nova York, maio, 2001. Disponível em: <http://www.scientificamerican.com/article.cfm?id=the-semantic-web>. Acesso em: 30 out. 2009. </li></ul></ul><ul><ul><li>BLATTMANN, Ursula; FACHIN, Gleisy R. B. F; RADOS, Gregório J. Varvakis . Recuperar a Informação Eletrônica pela Internet. Departamento de Ciência da Informação. Revista da ACB: Biblioteconomia em Santa Catarina, v. 4, n. 4, p. 9-27, 1999. </li></ul></ul><ul><ul><li>CORAZZON, R. Theory and history of ontology: a resource guide for philosophers . Disponível em: <http://www.formalontology.it/>. </li></ul></ul><ul><ul><li>DING, Y.; FOO, S. Ontology research and development part 1: a review of ontology generation. Journal of Information Science , v.28, n. 4, p. 375-388, 2002. </li></ul></ul><ul><ul><li>JACOB, E. K. Ontologies and the Semantic Web. Bulletin of the American Society forInformation Science and Technology , v. 29, n. 4, p. 19-22, abr. /maio, 2003. </li></ul></ul>
  49. 53. REFERÊNCIAS <ul><ul><li>ONTOLOGY INFERENCE LAYER OIL. Disponível em: <http://www.few.vu.nl/~ontoknow/oil/>. </li></ul></ul><ul><ul><li>OTIMIZAÇÃO para motores de busca. 4 de outubro de 2009. In: Wikipédia, a enciclopédia livre. Disponível em: <http://pt.wikipedia.org/wiki/Wikipedia:Projetos>. Acesso em: nov. 2009. </li></ul></ul><ul><ul><li>SHOE SIMPLE HTML ONTOLOGY EXTENSION. Disponível em: <http://www.cs.umd.edu/projects/plus/SHOE/>. </li></ul></ul><ul><ul><li>THE FRIEND OF A FRIEND (FOAF) PROJECT. Disponível em: <http://www.foaf-project.org/>. </li></ul></ul><ul><ul><li>WORLD WIDE WEB CONSORTIUM (W3C). W3C WORKING GROUP NOTE. Resource Description Framework (RDF). Massachusetts, 15 jan. 2004. Disponível em: <http://www.w3.org/RDF/>. </li></ul></ul>
  50. 54. REFERÊNCIAS <ul><ul><li>_____. _____. SKOS Simple Knowledge Organization System Primer . Massachusetts, 18 ago. 2009. Disponível em: <http://www.w3.org/TR/2009/NOTE-skos-primer-20090818/>. </li></ul></ul><ul><ul><li>DARPA'S INFORMATION EXPLOITATION OFFICE. The DARPA Agent Markup Language . Arlington, 13 jan. 2006. Disponível em: <http://www.daml.org/>. </li></ul></ul><ul><ul><li>XOL - XML BASED ONTOLOGY EXCHANGE LANGUAGE. Disponível em: <http://xml.coverpages.org/xol.html>. </li></ul></ul>

×