Your SlideShare is downloading. ×
Pesquisa avançada na internet 2010
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×

Introducing the official SlideShare app

Stunning, full-screen experience for iPhone and Android

Text the download link to your phone

Standard text messaging rates apply

Pesquisa avançada na internet 2010

2,251
views

Published on

Slides de apoio ao curso do INA

Slides de apoio ao curso do INA

Published in: Education, Technology

1 Comment
2 Likes
Statistics
Notes
No Downloads
Views
Total Views
2,251
On Slideshare
0
From Embeds
0
Number of Embeds
1
Actions
Shares
0
Downloads
62
Comments
1
Likes
2
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Pesquisa Avançada na Internet http://internetina.no.sapo.pt Luís Vidigal 2010 Luís Vidigal - Pesquisa Avançada na Internet 1
  • 2. Porquê o nome Internet? Interconnected Networks ou Internetwork System Começou a ser falada em 1973 A rede das redes Luís Vidigal - Pesquisa Avançada na Internet 2
  • 3. Computadores a falar a mesma língua 1,8 mil milhões de utilizadores – 27% da população Luís Vidigal - Pesquisa Avançada na Internet 3
  • 4. Rede de Pacotes Packed-switched networks Origem 9 11 Nó da Internet 10 12 3 6 2 1 8 5 4 Destino 7 O TCP não é orientado à ligação Os recursos são alocados numa base de best effort Luís Vidigal - Pesquisa Avançada na Internet 4
  • 5. 1993 WWW!!!!!!! A Internet comercial Mosaic o primeiro browser depois veio o Netscape e mais tarde o MS Explorer Em 1993 o tráfego cresceu mais de 300.000% na NSFNet Luís Vidigal - Pesquisa Avançada na Internet 5
  • 6. A Internet mais fácil de usar WWW - World Wide Web Cliente - HTTP - servidor HyperText Transfer Protocol HTML HyperText Markup Language URL Uniform Resource Locator Luís Vidigal - Pesquisa Avançada na Internet 6
  • 7. Utilização da Internet e População Mundial 31 de Dezembro de 2009 Utilizadores Utilizadores % de Regiões do População % População Crescimento Internet Internet 2000-2009 Utiliza- Mundo ( 2009 Est.) (Penetração) 31 Dez 2000 31 Dez 2009 dores África 991,002,342 4,514,400 86,217,900 8.7 % 1,809.8 % 4.8 % Ásia 3,808,070,503 114,304,000 764,435,900 20.1 % 568.8 % 42.4 % Europa 803,850,858 105,096,093 425,773,571 53.0 % 305.1 % 23.6 % Médio Oriente 202,687,005 3,284,800 58,309,546 28.8 % 1,675.1 % 3.2 % América do 340,831,831 108,096,800 259,561,000 76.2 % 140.1 % 14.4 % Norte América Latina e Caraíbas 586,662,468 18,068,919 186,922,050 31.9 % 934.5 % 10.4 % Oceania / 34,700,201 7,620,480 21,110,490 60.8 % 177.0 % 1.2 % Austrália TOTAL 6,767,805,208 360,985,492 1,802,330,457 26.6 % 399.3 % 100.0 % Luís Vidigal - Pesquisa Avançada na Internet 7
  • 8. Utilizadores da Internet no Mundo 31 de Dezembro de 2009 Luís Vidigal - Pesquisa Avançada na Internet 8
  • 9. Tempo de penetração tecnológica 100 Televisão Electricidade Telefone Rádio Automóvel % Penetração Vídeo 50 PC el m óv Tele et ern Int 0 25 50 75 100 125 150 Anos Luís Vidigal - Pesquisa Avançada na Internet 9
  • 10. As TIC estão a invadir o mundo real “Pervasive computing” Luís Vidigal - Pesquisa Avançada na Internet 10
  • 11. Domínios Gerais ou de mais alto nível Tipo de Organização com - Organização Comercial edu - Instituição de Ensino gov - Entidade Governamental mil - Instituição Militar net - Hosts Administrativos org - Organização não lucrativa int - Organização internacional A Área Geográfica pt - Portugal ISO 3166-1 Luís Vidigal - Pesquisa Avançada na Internet 11
  • 12. Tuvalu Ilha localizada no Oceano Pacífico, entre o Hawai e a Austrália Luís Vidigal - Pesquisa Avançada na Internet 12
  • 13. Registo de domínios http://www.whois.net/ http://www.idotz.net/ http://www.register.com/ Luís Vidigal - Pesquisa Avançada na Internet 13
  • 14. Definições • Pesquisar: – Efectuar um exame completo de – Olhar com cuidado para encontrar algo • Resultados de Pesquisa: – Apresentação do conteúdo que corresponde aos critérios de pesquisa Luís Vidigal - Pesquisa Avançada na Internet 14
  • 15. O que pesquisamos • Para apoiar o negócio (Compras electrónicas, etc.) • Para fins científicos (livros, jornais e artigos, etc.) • Para a nossa vida quotidiana (mapas, guias, etc.) • Para entretenimento (assunto específico do nosso interesse) Luís Vidigal - Pesquisa Avançada na Internet 15
  • 16. Porque pesquisamos • Para ter resultados • Para poupar tempo • Para explorar recursos relacionados • Para facilitar a navegação na Internet Luís Vidigal - Pesquisa Avançada na Internet 16
  • 17. História da Pesquisa na Web • 1990 - Alan Emtage criou o Archie, uma das primeiras tentativas de organizar a informação na Internet. • 1991-92 - Matthew Gray criou o primeiro robot na web. Chamou-se World Wide Web wanderer. • 1993 - Início de três motores de pesquisa baseados em robots: JumpStation, World Wide Worm e Engineering Spider. O Excite apreceu com o nome original de Architext. • 1994 - Galaxy, directório pesquisável na web através de um ídice • Abr. 1994 - Aparecimento do Yahoo. • Out. 1994 - Aparecimento do WebCrawler logo seguido do Lycos. • 1995 - Aparecimento do Infoseek, do AltaVista e do SAPO • 1996 - HotBot, MetaCrawler, SaavySearch e Ask Jeeves • 1998 - Google • 1999 - All The Wueb • 2004 - MSN Search • 2008 - Cuil • 2009 - Bing Luís Vidigal - Pesquisa Avançada na Internet 17
  • 18. A Web oculta http://www.completeplanet.com Luís Vidigal - Pesquisa Avançada na Internet 18
  • 19. Os recursos da Web profunda podem ser classificados nas seguintes categorias • Conteúdo dinâmico. • Conteúdos não linkados • Web privada • Web contextualizada • Conteúdo de acesso limitado. • Conteúdo acedido por scripts • Conteúdo de texto não HTML Luís Vidigal - Pesquisa Avançada na Internet 19
  • 20. Fontes de Informação na Web • Académicos • Periódicos on-line • Sítios governamentais • Sítios de instituições especializadas • Sítios de contribuição individual • Sítios relacionados à indústria • Sítios comerciais Luís Vidigal - Pesquisa Avançada na Internet 20
  • 21. Qualidade dos sítios Web Autoridade Informação especializada on-line deve ser oferecida por profissionais qualificados ou existe o esclarecimento que a informação foi fornecida por uma pessoa ou grupo não qualificado na área Complementaridade A informação on-line deve ser complementar, e não substituir o aconselhamento especializado Sigilo O sítio web assegura o sigilo de dados sobre pessoas e utilizadores, inclusive a sua identidade. Crédito O sítio web apresenta as referências das fontes que suportam as informações disponíveis (com respectivos links), e também as datas das últimas actualizações. Justificativa Apresenta os benefícios e o desempenho dos produtos e serviços baseados em evidências Autoria Oferece endereços de contanto para utilizadores que queiram mais informações; oferece e-mail do webmaster Patrocínio Apoios de organizações comerciais e não-comerciais são claramente identificadas Publicidade Anúncios publicitários são claramente identificados. Luís Vidigal - Pesquisa Avançada na Internet Health on the Net – HON 21
  • 22. Qualidade dos sítios Web Credibilidade Qual a reputação da fonte? A informação está actualizada? A informação é útil? É usado algum processo de revisão editorial? Conteúdo O conteúdo é preciso e completo? Existem termos de responsabilidade no sítio? Transparência O propósito do sítio web é apresentado? Links O sítio web oferece links para informações relevantes, actualizadas, precisas e de confiança? Os links são de fácil navegação? Design O design é acessível? A navegação e buscas no site são fáceis de serem feitas? Interactividade Estão incluídos mecanismos de feedback ao utilizador? Limitações Está claro se o propósito é a divulgação e venda de produtos e serviços ou a divulgação de informação? Luís Vidigal - Pesquisa Avançada na Internet Health Information Technology Institute 22
  • 23. Qualidade dos sítios Web Conteúdo O conteúdo é preciso e completo? O sítio web informa a autoria e as datas de publicação inicial e de actualização? Publicidade e Anúncios não devem influenciar na decisão sobre o Patrocínio conteúdo. Anúncios comerciais são proibidos? Privacidade e O sítio web deve solicitar a permissão do utilizador para Sigilo colectar dados pessoais. O sigilo deve ser respeitado. E-commerce Utilizadores e compradores de informações, produtos e serviços devem ter translações seguras e eficientes. Deve haver um link para o serviço de atendimento ao consumidor. Luís Vidigal - Pesquisa Avançada na Internet American Medical Association 23
  • 24. Dado, Informação e Conhecimento Davenport (1998) Dado Informação Conhecimento Definição Simples Dado dotado de Informação valiosa da observação relevância e propósito mente humana, sobre o estado incluindo reflexão, do mundo síntese e contexto Caracte- •Facilmente •Requer unidade de •Difícil estruturação rísticas estruturado análise •Difícil captura em •Facilmente •Exige consenso em máquinas obtido por relação ao significado •Frequentemente máquinas •Exige necessa- tácito •Frequente- riamente a mediação •Difícil transferência mente humana quantificado •Facilmente transferível Luís Vidigal - Pesquisa Avançada na Internet 24
  • 25. A Pirâmide da Sabedoria Transformações Sabedoria Experiências Conhecimento Serviços Informação Produtos Dados Matérias Primas Ruído Luís Vidigal - Pesquisa Avançada na Internet 25
  • 26. Pesquisadores Directórios Pessoas Índice de links organizados por temas (Yahoo, AOL, Netscape's open directory, DMOZ open directory project, MSN , etc.) Motores de Pesquisa Máquinas Indexação automática através de robots (spiders ou searchbots) (Google, Teoma, Inktomi, AllTheWeb.com (FAST), Alta Vista, Excite, Magellan, Webcrawler, Hotbot, Thunderstone, What U Seek, Lycos, etc.) Luís Vidigal - Pesquisa Avançada na Internet 26
  • 27. Como Entrar pesquisamos? Sim Quer Não paginar? Toque numa Caixa de secção pesquisa Toque numa Interrogação subsecção Não Sim Procure Resultados Não Está algo credíveis? na secção Sim Melhorar certa? interrogação Encontrou? Listar Não relevâncias Não Sim Ainda Frustrado? Quase Não Verificar Sim Não Será Sim Sim Encontrou? suficiente? Luís Vidigal - Pesquisa Avançada na Internet Luís Vidigal 27
  • 28. Estratégias de Pesquisa Directórios por categorias Pesquisa básica • Any words (Quaisquer palavras) • All words (Todas as palavras) • Exact phrase (Frase exacta) ou “....” Pesquisa avançada • Pesquisa booleana (AND, OR, NOT) • Palavras excluídas -xxx • Palavras incluídas +xxx Perguntas em linguagem natural Personalização Luís Vidigal - Pesquisa Avançada na Internet 28
  • 29. Operadores booleanos a b c a AND b a AND b AND c a OR b a AND b NOT c Luís Vidigal - Pesquisa Avançada na Internet 29
  • 30. Operadores booleanos (Exercícios) Vinho Tinto 1 2 3 5 4 6 7 Luís Vidigal - Pesquisa Avançada na Internet Alentejo 30
  • 31. Tipos de Motores de Pesquisa • Generalistas híbridos –Google, FAST, Altavista, Hotbot • Especializados • Metamotores • Metamotores inteligentes Luís Vidigal - Pesquisa Avançada na Internet 31
  • 32. Operadores booleanos nos principais Motores de Pesquisa (avançada) AND AND OR OR NOT NOT AND AND NOT NOT OR OR AND Luís Vidigal - Pesquisa Avançada na Internet NOT 32
  • 33. Pesquisa por defeito (simples) • AND: HotBot, Google, MSN Search, Teoma, WiseNut • OR: GigaBlast • Frase: AltaVista (só para frases comuns) Luís Vidigal - Pesquisa Avançada na Internet 33
  • 34. Sensível às maiúsculas • Sim: AltaVista Avançado, AltaVista Simples (entre aspas) • Só maiúsculas juntas: HotBot, MSN Search • Não: AltaVista Simples, Gigablast, Google, Lycos, Teoma, WiseNut Luís Vidigal - Pesquisa Avançada na Internet 34
  • 35. Indexação de campos • title: AltaVista, Gigablast, HotBot, Lycos, MSN Search • intitle: Google, Teoma • allintitle: Google • url: AltaVista, Gigablast, Lycos Advanced • inurl: Google, Teoma • allinurl: Google • link: AltaVista, Google, Gigablast, Lycos Advanced, MSN Search • host: AltaVista (same as site: at others) • ip: Gigablast • domain: HotBot, MSN Search • site: Gigablast, Google, Teoma, (use host: at AltaVista) • anchor: AltaVista • image: AltaVista • related: Google • others: AltaVista, Gigablast, Google, HotBot, MSN Search Luís Vidigal - Pesquisa Avançada na Internet 35
  • 36. Tipos de Documentos • PDFs: AltaVista, Gigablast, Google, MSN Search, HotBot • MS Word (.doc): Gigablast, Google, MSN Search, HotBot • PowerPoint (.ppt): Gigablast, Google, MSN Search, HotBot • Excel (.xls): Gigablast, Google, MSN Search, HotBot • PostScript (.ps): Gigablast, Google • WordPerfect (.wpd): Google Luís Vidigal - Pesquisa Avançada na Internet 36
  • 37. Conceitos associados à pesquisa na Web • Adequação (Match) • Pesquisa booleana (Boolean Search) • Parêntesis (Parentheses) • Pesquisa combinada (Faceted Search) • Pesquisa vectorial (Vector Search) • Pergunta (Query) • Linguagem Natural (Natural Language Processing - NLP) • Adequação difusa (Fuzzy Matching) • Lista de resultados (Results List) • Peso (Weighting) • Precisão (Recall and Precision) Luís Vidigal - Pesquisa Avançada na Internet 37
  • 38. Quem? • Quem necessita da informação? • Uma única pessoa? Um grupo específico? • Qual o nível de conhecimento sobre o assunto? • Qual o nível de formação? Qual o nível de estudos? • A que título? • Qual o estatuto? Qual a função? Qual o nível de responsabilidade? Luís Vidigal - Pesquisa Avançada na Internet 38
  • 39. O quê? • Que tipo de informação? • Um endereço? Estatísticas? Uma definição? Esclarecimentos sobre um conceito? Artigos de imprensa? Estudos? Pontos de vista de peritos? Instrumentos práticos? Exemplos de experiências? • Qual a língua desejada? • Em português? Noutra língua? Em várias línguas em simultâneo? Luís Vidigal - Pesquisa Avançada na Internet 39
  • 40. Onde? • Quais os limites geográficos? • Em que continente? Em que país? • A que nível? • Nacional? Académico? União Europeia? Lusofonia? • Que lugares-recurso? • Na internet? Sem ser na internet? Luís Vidigal - Pesquisa Avançada na Internet 40
  • 41. Velocidade Precisão Resultado Encontrar sempre imediato documentos Âmbito relevantes Procurar todos os documentos da Web Um Motor de Localização Conhecer o local Pesquisa perfeito do utilizador Actualidade Toda a informação é actualizada Personalização Prioridade Os documentos Conhecer as mais relevantes necessidades do em primeiro utilizador lugar Luís Vidigal - Pesquisa Avançada na Internet 41
  • 42. Componentes de um Motor de Pesquisa • Batedores: descobrem e recolhem automáticamente conteúdos da web; • Repositório: armazena as páginas recolhidas; • Indexador: extrai as palavras das páginas armazenadas e cria índices para acelerar as pesquisas; • Ordenador: ordena as páginas que contenham os termos pesquisados por um utilizador de modo a que as mais relevantes sejam apresentadas nos primeiros lugares; • Apresentador: gere a interface de utilização do motor de busca. Luís Vidigal - Pesquisa Avançada na Internet 42
  • 43. Indexação e ordenação • Frequência de termos: as páginas mais importantes para uma palavra são as que a repetem mais vezes no texto; • PageRank: é um algoritmo matemático em que as páginas mais importantes são as que recebem o maior número de links ou links das páginas mais importantes; • Número de links: as páginas mais importantes são as que recebem o maior número de links; • tf-idf: calcula a importância da página combinando a frequência de um termo com a importância desse termo no conjunto de todas as páginas armazenadas; • Estrutura da página: a importância de uma página é dada pela localização de um termo na sua estrutura. Por exemplo, as páginas mais importantes são as que contêm o termo no titulo; • Análise de URLs: as páginas mais importantes são as que contêm os termos no URL que as refere. Luís Vidigal - Pesquisa Avançada na Internet 43
  • 44. Motor de Pesquisa • Indexação do Texto - extraindo o conteúdo relevante de cada página, descartando: Lista de palavras vazias (SWL – Stop Word List) – Artigos, preposições, conjunções e pronomes – Verbos comuns (saber, ver, fazer, ser, etc.) – Adjectivos comuns (grande, alto, atrasado, etc.) – Qualquer palavra que apareça em todos os documentos – Qualquer palavra que apareça apenas em um documento • Indexação META – Indexando preferencialmente as palavras chave colocadas pelo autor na meta- informação de cada página Luís Vidigal - Pesquisa Avançada na Internet 44
  • 45. Quando? • Quais os limites temporais? • Uma data precisa? Qual o grau de anterioridade? • Com que frequência? • Trata-se de uma questão pontual ou frequente? • Qual o prazo? • Quanto tempo disponho para a pesquisa? Luís Vidigal - Pesquisa Avançada na Internet 45
  • 46. Porquê? • Para que serve a informação? • Qual o objectivo principal? • Quais os objectivos adicionais? • Satisfazer uma curiosidade pessoal? Tomar uma decisão? Se sim, qual? Preparar uma aula, uma apresentação, uma intervenção? Se sim, em que contexto? Luís Vidigal - Pesquisa Avançada na Internet 46
  • 47. Como? • Com que meios? • De que meios disponho? • Com que ferramenta(s)? • Uma ou várias ferramenta(s)? Uma ferramenta geral ou especializada? Um directório, um indexante ou um metapesquisador? • Com que método? • Com que palavras-chave? Com que sintaxe? Qual o modo de pesquisa: simples ou avançada? Luís Vidigal - Pesquisa Avançada na Internet 47
  • 48. Palavras suficientemente precisas • Evitar os termos excessivamente gerais susceptíveis de originar demasiado "ruído" nas respostas. • De preferência, escolher termos específicos que podem ser generalizados na sequência da pesquisa. Luís Vidigal - Pesquisa Avançada na Internet 48
  • 49. Palavras suficientemente genéricas retiradas dos motores • Para encontrar mais facilmente as categorias e para identificar os sítios que agrupam matérias relacionadas com o tema (sobretudo nos directórios). • Filtrar, com termos mais precisos, na sequência da pesquisa. • A pesquisa torna-se mais produtiva se for efectuada na língua do motor de busca. Luís Vidigal - Pesquisa Avançada na Internet 49
  • 50. O tipo de palavras • De preferência, escolher nomes. • Utilizar as outras palavras (verbos, adjectivos, advérbios, pronomes) sobretudo nas expressões entre aspas. Luís Vidigal - Pesquisa Avançada na Internet 50
  • 51. O número de palavras • Quanto maior for o número de palavras, mais se restringe a pesquisa. • Uma única palavra pode ser suficiente. • Tentar nunca incluir na equação de pesquisa inicial mais do que três palavras. Luís Vidigal - Pesquisa Avançada na Internet 51
  • 52. A ordem das palavras • Quais as palavras-chave prioritárias? • Começar pelas palavras mais importantes (verificar sempre em cada motor a sintaxe aceite para pesquisa). Luís Vidigal - Pesquisa Avançada na Internet 52
  • 53. Para uma avaliação mais rigorosa Quem? Autor, organismo... O quê? Qualidade da informação, do documento, do sítio Onde? Origem da informação, limites geográficos Quando? Período tratado, data do documento Porquê? Objectivo(s) do documento, do sítio Como? Estrutura do documento, navegação no sítio Luís Vidigal - Pesquisa Avançada na Internet 53
  • 54. Motor de Pesquisa Pertinência da Página • Densidade das palavras • Frequência das palavras • Proximidade das palavras • Links externos para a página • META tags Luís Vidigal - Pesquisa Avançada na Internet 54
  • 55. Exemplo de um Problema Impressionismo francês Impressionismo francês Claude Monet Claude Monet Exposições Exposições Renoir Renoir Museu de Giverny Museu de Giverny Livros Livros Luís Vidigal - Pesquisa Avançada na Internet 55
  • 56. A solução O destinatário A semântica Personalização Personalização Taxinomia Taxinomia Localização Localização Sinónimos Sinónimos Traduções Traduções Luís Vidigal - Pesquisa Avançada na Internet 56
  • 57. Comparação entre Motores de Pesquisa Luís Vidigal - Pesquisa Avançada na Internet http://www.searchengineshowdown.com/features/ 57
  • 58. Estatísticas dos Motores de Pesquisa Search Provider Searches Month-on-Month Growth (%) Share of Searches (%) (000) Total 10,812,734 2.9 100 Google 6,986,580 2.6 64.6 Yahoo 1,726,060 -4.2 16 MSN/WindowsLive/Bing 1,156,415 22.1 10.7 AOL 333,231 1.8 3.1 Ask.com 186,270 2.9 1.7 My Web 128,432 0.5 1.2 Comcast 50,328 -21.6 0.5 Yellow Pages 37,923 2.7 0.4 NexTag 31,830 0.4 0.3 Local.com 16,314 2.9 0.2 Fonte: Nielsen MegaView Search – Agosto 2009 Luís Vidigal - Pesquisa Avançada na Internet 58
  • 59. Fidelidade aos Motores de Pesquisa Luís Vidigal - Pesquisa Avançada na Internet 59
  • 60. Directórios • The Invisible Web Directory - http://www.invisible- web.net/ • Re-Quest dot Net - http://www.re-quest.net/ • Blakkat Station - http://blakkat.com/ • ThisIsOurYear - http://www.thisisouryear.com/ • 1st Spot - http://1st-spot.net/ • Common Content - http://www.commoncontent.org/ • Hoppa - http://hoppa.com/ • Nations Online - • Fetch Dog - http://www.fetchdog.com/ http://www.nationsonline.org/oneworld/ • Forum Zilla - http://www.forumzilla.com/ • Chiff - http://www.chiff.com/ • The Library Channel - • VisioBrand - http://www.visiobrand.com/ http://www.thelibrarychannel.com/ • GoGuides Directory - http://www.goguides.org • Wealth24.com - http://www.wealth24.com/ • Gimpsy - http://www.gimpsy.com/ • intelSeek! - http://www.intelseek.com/ • Starting Page - http://www.startingpage.com/ • Got That Online - http://www.gotthatonline.com/ • DateDex - http://www.datedex.com/ • E-lynks - http://www.e-lynks.com/ • Surfpoint - http://www.surfpoint.com/ • GirlHoo - http://www.girlhoo.com/ • 123World - http://www.123world.com/ • Leon's Web Brain - • Web World Directory - http://www.leonatkinson.com/brain/ http://www.webworldindex.com/ • iMarvel - http://www.imarvel.com/ • Sight Quest - http://www.sightquest.com/ • Smart Links - http://www.smartlinks.org/ • SearchMonster - http://www.searchmonster.org/ • Smart Internet Guide - http://www.smartinternetguide.com/ • La Toile des Toiles - http://www.la-toile.com/ • A Perfect Search - http://aperfectsearch.com/ • Somuch - http://www.somuch.com/ • Consumer2.com - • Andilinks - http://www.andilinks.com/ http://www.consumer2.com/ • Linkopedia - http://www.linkopedia.com/ • MVRU.com - http://www.mvru.com • Josh's Sanctum - http://josh.nu/ • Ranks - http://ranks.com/ • Yakeo - http://www.yakeo.com/ • Aeiwi - http://www.aeiwi.com/ • All.info - http://all.info/ • Rex - http://rex.skyline.net/ • Earth Station Nine - http://www.earthstation9.com/ Luís Vidigal - Pesquisa Avançada na Internet 60
  • 61. Directório do Yahoo Luís Vidigal - Pesquisa Avançada na Internet 61
  • 62. A família Yahoo • Yahoo! - http://www.yahoo.com/ Directório principal • AllTheWeb - http://www.alltheweb.com/ Motor de pesquisa do Yahoo • Yahooligans! - http://yahooligans.yahoo.com/ Para crianças • Ujiko - http://www.ujiko.com/ Pesquisa personalizada do Yahoo Luís Vidigal - Pesquisa Avançada na Internet 62
  • 63. Páginas personalizadas Luís Vidigal - Pesquisa Avançada na Internet http://my.yahoo.com 63
  • 64. Forças e Fraquezas do Yahoo 21 de Maio de 2008 Forças: • Uma grande e única base de dados de motores de pesquisa • Inclui cópias de páginas em cache • Inclui links para o Directório do Yahoo • Suporta Pesquisa Booleana • Utilização de Wild Card em frases Fraquezas: • Falta de algumas possibilidades de pesquisa como a truncatura • Só indexa os primeiros 500 KB de uma página Web • A pesquisa de links exige a prsença de http:// • A pesquisa de tipos de ficheiros usa a extexção original do url em vez do filetype: • Prevê o pagamento para a pesquiza de alguns sites Luís Vidigal - Pesquisa Avançada na Internet 64
  • 65. A família Google A garagem onde começou o Google em 1998 Co-Fundadores do Google Larry Page e Sergey Brin Luís Vidigal - Pesquisa Avançada na Internet O campus Google em 2008 65
  • 66. Motor de Pesquisa do Google Luís Vidigal - Pesquisa Avançada na Internet 66
  • 67. Directório do Google http://www.google.com/dirhp Luís Vidigal - Pesquisa Avançada na Internet 67
  • 68. A família Google Luís Vidigal - Pesquisa Avançada na Internet 68
  • 69. http://www.google.com/reader/ Feeds Luís Vidigal - Pesquisa Avançada na Internet 69 69
  • 70. Operadores booleanos no Google Para esta operação, no Google é assim x AND y xy x OR y x OR y x AND (y OR z) x y OR z (x AND y) OR (z AND q) Ainda não possível (x OR y) AND (z OR q) x OR y z OR q x AND (y OR z OR q) x y OR z OR q x AND (y OR z) AND q x y OR z q Luís Vidigal - Pesquisa Avançada na Internet 70
  • 71. Forças e fraquezas do Google (Junho 2006) • Strengths: – Size and scope: It is now the largest, and includes PDF, DOC, PS, and many other file types – Relevance based on sites' linkages and authority – Cached archive of Web pages as the looked were indexed – Additional databases: Google Groups, News, Directory, etc. • Weaknesses: – Limited search features: no nesting, no truncation, does not support full Boolean – Link searches must be exact and are incomplete – Only indexes first 101 KB of a Web page and about 120 KB of PDFs – May search for plural/singular, synonyms, and grammatical variants without telling you Luís Vidigal - Pesquisa Avançada na Internet http://www.searchengineshowdown.com/features/google/review.html 71
  • 72. O novo Cuil desafia o Google http://www.cuil.com/ • Múltiplos significados • Ambiguidades http://www.cpedia.com/ Luís Vidigal - Pesquisa Avançada na Internet 72
  • 73. Sites sobre recursos de pesquisa http://www.searchengineshowdown.com/ http://searchenginewatch.com/ http://www.webmasterworld.com/ Luís Vidigal - Pesquisa Avançada na Internet 73
  • 74. Notícias http://news.google.com/ http://www.altavista.com/news/ http://www.alltheweb.com/?cat=news http://www.totalnews.com/ http://www.newsindex.com/ http://news.yahoo.com/ Luís Vidigal - Pesquisa Avançada na Internet 74
  • 75. Multi-Search Engines • Copernic http://www.copernic.com/ AltaVista, AOL Search, CompuServe, Espotting, All The Web (Fast Search), FindWhat, HotBot, LookSmart, Lycos, Mamma.com, MSN Web Search, Netscape Netcenter, Open Directory, Teoma, WiseNut, Yahoo. • Search http://www.search.com/ AltaVista, All The Web (Fast Search), Google, Lycos, WebCrawler, Thunderstone, Infoseek, Direct Hit, HotBot, Excite, Galaxy e NationalDirectory. • MetaCrawler http://www.metacrawler.com/ Lycos, WebCrawler, Infoseek, Excite, Thunderstone, AltaVista, GoTo e Yahoo. • C4 http://www.c4.com/ AltaVista, Yahoo!, InfoSeek. Excite, Lycos, NBCi.com, Magellan, WebCrawler e HotBot. • DogPile http://www.dogpile.com/ LookSmart, GoTo.com, Thunderstone, Yahoo!, Open Directory, About.com, Direct Hit, Lycos e AltaVista. • InfoSpace http://www.infospace.com/ Excite, AltaVista, Infoseek e WebCrawler. Luís Vidigal - Pesquisa Avançada na Internet 75
  • 76. Grandes Arquivos Históricos da WEB • http://web.archive.org • http://www.gigablast.com Luís Vidigal - Pesquisa Avançada na Internet 76
  • 77. Comparação entre Directórios Luís Vidigal - Pesquisa Avançada na Internet http://www.searchengineshowdown.com/dir/ 77
  • 78. Directórios • http://www.yahoo.com • http://www.looksmart.com • http://www.dmoz.com Luís Vidigal - Pesquisa Avançada na Internet 78
  • 79. Pesquisa de Imagens, Audio e Vídeo • AllTheWeb http://www.alltheweb.com/ • AltaVista http://www.altavista.com/ • Ditto (só imagens) http://www.ditto.com/ • Google Images (só imagens) http://images.google.com • Kazaa Media Desktop (só MP3) http://www.kazaa.com/ • Lycos Pictures and Sounds http://multimedia.lycos.com/ • MIDI Explorer (Só MIDI) http://www.musicrobot.com/ • Picsearch (só imagens) http://www.picsearch.com/ • Singingfish (Só som e video) http://www.singingfish.com/ Luís Vidigal - Pesquisa Avançada na Internet 79
  • 80. Listas Telefónicas • Switchboard - http://www.switchboard.com/ • InfoSpace - http://www.infospace.com/ • AnyWho - http://www.anywho.com/ • SuperPages.com - http://www.superpages.com/ • SmartPages.com - http://www.smartpages.com/ • WhoWhere - http://www.whowhere.lycos.com/ • Infobel - http://www.infobel.com/ • InfoUSA - http://www.infousa.com/ • All Nations Telephone Search Engine - http://www.escapeartist.com/global/telephone.htm • Phonenumber.com - http://www.phonenumber.com/ • International Numbering Plans - http://www.numberingplans.com/ • 411 Information - http://www.411.info • GeoPortals.com, Inc. - http://finder.geoportals.com/ • 140Online - http://www.140online.com/ • Search Detective Reverse Phone Lookup - http://www.searchdetective.net/ • McPayphone - http://www.geocities.com/bootzilla00/ • Apni Directory - http://www.apnidirectory.com/ • Jay Computer Services - http://nt.jcsm.com/ • Zip and Area Code Directory - http://www.horizon-realty.us/whrzipar.htm • Email Address Finder - http://www.allemailaddresses.com/ Luís Vidigal - Pesquisa Avançada na Internet 80
  • 81. Enciclopédias http://www.wikipedia.org/ http://www.britannica.com/ • Living Encyclopedia in Cyberspace - http://www.encyberpedia.com/ency.htm • The Virtual Encyclopedia - http://www.abp1.com/knowledgeispower/inde x.html • Search-22 - Reference Search Engines - http://www.search-22.com/reference.html • Access Place Library - http://www.accessplace.com/library.htm Luís Vidigal - Pesquisa Avançada na Internet 81
  • 82. Gestão do Conhecimento • KTweb - http://www.ktweb.org • The Knowledge Management Connection - http://www.KMconnection.com • Knowledge Management Resource Center - http://www.kmresource.com • Knowledge Management Resource Center - http://www.bio- itworld.com/resources/km/ • Netacademy on Knowledge Media - http://www.knowledgemedia.org • ICASIT's Knowledge Management Central - http://www.icasit.org/km/ • Knowledge Management Server - http://www.mccombs.utexas.edu/kman/ • Meta Knowledge Management - http://www.metakm.com • Knowledge Management Center Info - http://www.kmcenter.info/ • KMTool - http://www.kmtool.net • Gotcha - http://www.sims.berkeley.edu/courses/is213/s99/Projects/P9/web_site/index. html • Knowledge-Portal.com - http://www.knowledge-portal.com/ • Knowledge Management Links - http://www.lepak.com/kmlinks.html • Knowledge Portal on Document and Data Organization - http://members.lycos.co.uk/UFitsME/knowledge.html Luís Vidigal - Pesquisa Avançada na Internet 82
  • 83. Bibliotecas • LibDex - http://www.libdex.com/ • School Libraries on the Web - http://www.sldirectory.com/ • Lib Web Cats - http://www.librarytechnology.org/libwebcats/ • Libweb - http://lists.webjunction.org/libweb/ • Lii.org: Librarianship - http://lii.org/search/file/libraries • National Library Catalogues Worldwide - http://www.library.uq.edu.au/ssah/jeast/ • Library and Information Science - http://www.ifla.org/II/natlibs.htm • ALiNUS - http://www.snhu.edu/Southern_New_Hampshire_University/Library/Electronic_Resources/ALiNUS_Ho me.html • The WWW Library Directory - http://www.webpan.com/msauers/libdir/ • NLS/BPH: Reference Directories Index Page - http://www.loc.gov/nls/reference/directories/ • Canadian Directory of Special Collections - http://www.collectionscanada.ca/collectionsp/index-e.html • Philadelphia Area Consortium of Special Collections Libraries - http://www.pacscl.org/ • Veterinary Medicine Libraries - http://duke.usask.ca/~ladd/vet_libraries.html • UNESCO Libraries Portal - http://www.unesco.org/webworld/portal_bib/Libraries/ • LibraryBug - http://www.librarybug.org • Library and Related Resources - http://www.ex.ac.uk/library/wwwlibs.html • ISBNDB - http://isbndb.com/ • Internet Quick Reference Shelf: Library Resources - http://www.indiana.edu/~librcsd/internet/Library_Resources/ • Libraries of the World and their Catalogues - http://www.sylviamilne.btinternet.co.uk/plucked/libcats.htm • Libraries and Archives - http://www.uky.edu/Subject/libraries.html • List of Judaica Library Websites - http://www.angelfire.com/on2/smbergson/jlibraries.htm • Law Libraries Worldwide - http://www.chanrobles.com/lawlib1.htm • Global Reach - https://cs.ala.org/global/ • Bookwire - http://www.bookwire.com/bookwire/libraries/libraries.html • Libraries & Archives - http://book-smith.tripod.com/bml-libraries.html • US State Library Links - http://www.angelfire.com/ks/windshipgenhelp/statelib.html • Bishop Library Index - http://members.lycos.co.uk/kbishoplib/ Luís Vidigal - Pesquisa Avançada na Internet 83
  • 84. Mapas • Maps on Other Web Sites - http://www.lib.utexas.edu/maps/map_sites/map_sites.html • All the World's Maps - http://www.embassyworld.com/maps/maps.html • Oddens' Bookmarks - http://oddens.geog.uu.nl/index.php • About.com: Maps - http://geography.about.com/cs/maps/ • Bodleian Library Map Room - http://www.bodley.ox.ac.uk/guides/maps/maplinks.htm • StreetLookup.Com - http://www.streetlookup.com/ • Alexandria Digital Library - http://www.alexandria.ucsb.edu/other-sites/subj_page.html • Maps from start4all - http://maps.start4all.com/ • Links 4 Maps - http://www.links4maps.com/ Luís Vidigal - Pesquisa Avançada na Internet 84
  • 85. Pesquisar publicações científicas http://scholar.google.pt/ Directórios http://infomine.ucr.edu/ http://lii.org/ Luís Vidigal - Pesquisa Avançada na Internet 85
  • 86. Sítios para Crianças Yahoo! Kids http://www.yahooligans.com Kids Click! http://www.kidsclick.org ThinkQuest Entries http://www.thinkquest.org/library Kids Search Tool http://www.rcls.org/ksearch.htm Ask Jeeves for Kids http://www.askforkids.com/ Luís Vidigal - Pesquisa Avançada na Internet 86
  • 87. Pesquisadores para encaminhamento em Portugal http://www.iupi.pt/ http://www.busca.pt/ http://www.aeiou.pt/ http://www.sapo.pt/ http://www.cusco.pt Luís Vidigal - Pesquisa Avançada na Internet 87
  • 88. Portais e Jornais portugueses http://www.lusomundo.net http://www.iol.pt/ http://dn.sapo.pt/ http://jn.sapo.pt/ http://www.publico.pt/ Luís Vidigal - Pesquisa Avançada na Internet 88
  • 89. Televisões portuguesas http://www.rtp.pt http://www.sic.pt http://www.tvi.iol.pt http://www.sporttv.pt http://www.telecine.pt Luís Vidigal - Pesquisa Avançada na Internet 89
  • 90. Rádios portuguesas http://www.radiocomercial.pt http://www.tsf.pt http://www.rdp.pt/antena1 http://www.rdp.pt/antena2 http://www.rdp.pt/antena3 http://www.radiocidade.iol.pt http://www.rr.pt/ Luís Vidigal - Pesquisa Avançada na Internet 90
  • 91. Legislação http://www.dr.incm.pt http://www.digesto.gov.pt/ Luís Vidigal - Pesquisa Avançada na Internet 91
  • 92. Governo, Parlamento e Administração Pública http://www.portaldocidadao.pt http://www.lojadocidadao.pt http://www.portugal.gov.pt http://www.parlamento.pt http://www.dgo.pt http://www.dgap.gov.pt Luís Vidigal - Pesquisa Avançada na Internet 92
  • 93. http://www.zdnet.com http://www.hotfiles.com http://www.shareware.com http://www.tucows.com http://www.jumbo.com Luís Vidigal - Pesquisa Avançada na Internet 93
  • 94. Notícias para os profissionais de Informação • ResourceShelf http://www.resourceshelf.com/ • LLRX (Legislação) http://www.llrx.com/ • Librarians' Index to the Internet http://lii.org/ • INFOMINE http://infomine.ucr.edu/ • The Internet Scout Project http://scout.wisc.edu/ Luís Vidigal - Pesquisa Avançada na Internet 94
  • 95. http://lii.org Sítios confiáveis Luís Vidigal - Pesquisa Avançada na Internet 95
  • 96. Tipos de som na Internet MP3 MPEG (Moving Picture Experts Group) Audio Layer 3, é um standard para a codificação e compressão de sinais áudio. Faz diminuir o tamanho dos ficheiros áudio sem perder muita qualidade. A "codificação perceptual de áudio" e "compressão psico-acústica" removem partes do sinal que pouca diferença fazem à forma como de facto ouvimos os sons. WAV (Waveform Audio) é um formato "nativo" do Windows, utilizado por exemplo para os pequenos ruídos que um computador emite para indicar que o Windows foi iniciado ou a reciclagem foi limpa. Streaming Streaming audio ou streaming media é uma técnica que permite ouvir parte do ficheiro antes do download estar concluído. Funciona através do download e armazenamento de uma secção suficiente do ficheiro para actuar como buffer, permitindo a reprodução da música mesmo que a transmissão seja brevemente interrompida. Pode tirar uma amostra do áudio e decidir se pretende continuar a download ou simplesmente cancelar. Se por qualquer motivo a transmissão ficar demasiado lenta, o buffer pode ficar cheio e a reprodução pode soar menos bem. Luís Vidigal - Pesquisa Avançada na Internet 96
  • 97. Vídeo na Internet AVI Audio Video Interleaved.AVI. um formato multimédia da Microsoft , utilizado pelo Video for Windows. Os elementos áudio e vídeo são armazenados em segmentos alternados no ficheiro (.avi). MPEG Moving Pictures Experts Group standard para compressão e armazenamento de vídeos (.mpg) Windows Media e Microsoft's Windows Media Player (.asf) Real RealNetwork's RealVideo (.ram) Quicktime extensão do ficheiro Windows: .mov Luís Vidigal - Pesquisa Avançada na Internet 97
  • 98. Requisitos de Segurança • Integridade –Complecta e não alterada • Confidencialidade –Acesso condicionado • Autenticidade –Identidade da pessoa • Não repúdio –Transacção garantida Luís Vidigal - Pesquisa Avançada na Internet 98
  • 99. Assinaturas digitais Entidade a a lic Certificadora lic úb P A úb P B AE a da a da riv P A riv P B A B Luís Vidigal - Pesquisa Avançada na Internet 99
  • 100. CAPTCHA "Completely Automated Public Turing test to tell Computers and Humans Apart“ Carnegie Mellon University Garantir que a resposta não é gerada por computadores, mas por humanos Turing Test (1950) Luís Vidigal - Pesquisa Avançada na Internet 100
  • 101. Fishing Luís Vidigal - Pesquisa Avançada na Internet 101