Pesquisa AvançAda Na Internet 2009

2,308 views

Published on

Slides de apoio ao curso de Pesquisa Avançada da Internet no INA

Published in: Education, Technology, Business
0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
2,308
On SlideShare
0
From Embeds
0
Number of Embeds
79
Actions
Shares
0
Downloads
79
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Pesquisa AvançAda Na Internet 2009

  1. 1. Pesquisa Avançada na Internet Luís Vidigal 2009
  2. 2. Porquê o nome Internet? Interconnected Networks ou Internetwork System Começou a ser falada em 1973 A rede das redes
  3. 3. Computadores a falar a mesma língua 1,6 biliões de utilizadores – 24% da população
  4. 4. Utilização da Internet e População Mundial 31 de Março de 2009 Internet Cresci- População População % População Utilização Regiões do Mundo Utilização mento ( 2008 Est.) % do Mundo (Penetração) % do Mundo 2000-2008 Últimos dados África 975,330,899 4,514,400 54,171,500 5.6 % 1,100.0 % 3.4 % Ásia 3,780,819,792 114,304,000 657,170,816 17.4 % 474.9 % 41.2 % Europa 803,903,540 105,096,093 393,373,398 48.9 % 274.3 % 24.6 % Médio Oriente 196,767,614 3,284,800 45,861,346 23.3 % 1,296.2 % 2.9 % América do Norte 337,572,949 108,096,800 251,290,489 74.4 % 132.5 % 15.7 % América Latina e Caraíbas 581,249,892 18,068,919 173,619,140 29.9 % 860.9 % 10.9 % Oceania / Austrália 34,384,384 7,620,480 20,783,419 60.4 % 172.7 % 1.3 % TOTAL 6,710,029,070 360,985,492 1,596,270,108 23.8 % 342.2 % 100.0 %
  5. 5. Utilizadores da Internet no Mundo Março 2009
  6. 6. % de Penetração dos Utilizadores da Internet no Mundo Março 2009
  7. 7. Tempo de penetração tecnológica 100 Televisão Electricidade Telefone Rádio Automóvel % Penetração Vídeo 50 PC el m óv Tele et ern Int 0 25 50 75 100 125 150 Anos
  8. 8. As TIC estão a invadir o mundo real “Pervasive computing”
  9. 9. Definições • Pesquisar: – Efectuar um exame completo de – Olhar com cuidado para encontrar algo • Resultados de Pesquisa: – Apresentação do conteúdo que corresponde aos critérios de pesquisa
  10. 10. O que pesquisamos • Para apoiar o negócio (Compras electrónicas, etc.) • Para fins científicos (livros, jornais e artigos, etc.) • Para a nossa vida quotidiana (mapas, guias, etc.) • Para entretenimento (assunto específico do nosso interesse)
  11. 11. Porque pesquisamos • Para ter resultados • Para poupar tempo • Para explorar recursos relacionados • Para facilitar a navegação na Internet
  12. 12. História da Pesquisa na Web • 1990, Alan Emtage criou o Archie, uma das primeiras tentativas de organizar a informação na Internet. • 1991-92, Matthew Gray criou o primeiro robot na web. Chamou-se World Wide Web wanderer. • 1993, Início de três motores de pesquisa baseados em robots: JumpStation, World Wide Worm e Repository Based Software Engineering Spider. O Excite apreceu com o nome original de Architext. • 1994, Galaxy, dirctório pesquisável na web através de um ídice
  13. 13. História da Pesquisa na Web • Abr. 1994, Aparecimento do Yahoo. • Out. 1994, Aparecimento do WebCrawler logo seguido do Lycos. • 1995, Aparecimento do Infoseek e do AltaVista • 1996, HotBot, MetaCrawler e SaavySearch. • Desde 1996, Outros motores de pesquisa
  14. 14. Domínios Gerais ou de mais alto nível Tipo de Organização com - Organização Comercial edu - Instituição de Ensino gov - Entidade Governamental mil - Instituição Militar net - Hosts Administrativos org - Organização não lucrativa int - Organização internacional A Área Geográfica ISO 3166-1 pt - Portugal
  15. 15. Registo de domínios http://www.whois.net/ http://www.idotz.net/ http://www.register.com/
  16. 16. Tuvalu Ilha localizada no Oceano Pacífico, entre o Hawai e a Austrália
  17. 17. A Web oculta http://www.completeplanet.com
  18. 18. Os recursos da Web profunda podem ser classificados nas seguintes categorias • Conteúdo dinâmico. • Conteúdos não linkados • Web privada • Web contextualizada • Conteúdo de acesso limitado. • Conteúdo acedido por scripts • Conteúdo de texto não HTML
  19. 19. Fontes de Informação na Web • Académicos • Periódicos on-line • Sítios governamentais • Sítios de instituições especializadas • Sítios de contribuição individual • Sítios relacionados à indústria • Sítios comerciais
  20. 20. Qualidade dos sítios Web Autoridade Informação especializada on-line deve ser oferecida por profissionais qualificados ou existe o esclarecimento que a informação foi fornecida por uma pessoa ou grupo não qualificado na área Complementaridade A informação on-line deve ser complementar, e não substituir o aconselhamento especializado Sigilo O sítio web assegura o sigilo de dados sobre pessoas e utilizadores, inclusive a sua identidade. Crédito O sítio web apresenta as referências das fontes que suportam as informações disponíveis (com respectivos links), e também as datas das últimas actualizações. Justificativa Apresenta os benefícios e o desempenho dos produtos e serviços baseados em evidências Autoria Oferece endereços de contanto para utilizadores que queiram mais informações; oferece e-mail do webmaster Patrocínio Apoios de organizações comerciais e não-comerciais são claramente identificadas Publicidade Anúncios publicitários são claramente identificados. Health on the Net – HON
  21. 21. Qualidade dos sítios Web Credibilidade Qual a reputação da fonte? A informação está actualizada? A informação é útil? É usado algum processo de revisão editorial? Conteúdo O conteúdo é preciso e completo? Existem termos de responsabilidade no sítio? Transparência O propósito do sítio web é apresentado? Links O sítio web oferece links para informações relevantes, actualizadas, precisas e de confiança? Os links são de fácil navegação? Design O design é acessível? A navegação e buscas no site são fáceis de serem feitas? Interactividade Estão incluídos mecanismos de feedback ao utilizador? Limitações Está claro se o propósito é a divulgação e venda de produtos e serviços ou a divulgação de informação? Health Information Technology Institute
  22. 22. Qualidade dos sítios Web Conteúdo O conteúdo é preciso e completo? O sítio web informa a autoria e as datas de publicação inicial e de actualização? Publicidade e Anúncios não devem influenciar na decisão sobre o conteúdo. Patrocínio Anúncios comerciais são proibidos? Privacidade e O sítio web deve solicitar a permissão do utilizador para Sigilo colectar dados pessoais. O sigilo deve ser respeitado. E-commerce Utilizadores e compradores de informações, produtos e serviços devem ter translações seguras e eficientes. Deve haver um link para o serviço de atendimento ao consumidor. American Medical Association
  23. 23. Dado, Informação e Conhecimento Davenport (1998) Dado Informação Conhecimento Definição Simples Dado dotado de Informação valiosa da observação sobre o relevância e propósito mente humana, estado do mundo incluindo reflexão, síntese e contexto Caracte- •Facilmente •Requer unidade de •Difícil estruturação rísticas estruturado análise •Difícil captura em •Facilmente obtido •Exige consenso em máquinas por máquinas relação ao significado •Frequentemente tácito •Frequente- •Exige necessa- •Difícil transferência mente quantificado riamente a mediação •Facilmente humana transferível
  24. 24. Pesquisadores Directórios Pessoas Índice de links organizados por temas (Yahoo, AOL, Netscape's open directory, DMOZ open directory project, MSN , etc.) Motores de Pesquisa Máquinas Indexação automática através de robots (spiders ou searchbots) (Google, Teoma, Inktomi, AllTheWeb.com (FAST), Alta Vista, Excite, Magellan, Webcrawler, Hotbot, Thunderstone, What U Seek, Lycos, etc.)
  25. 25. Como Entrar pesquisamos? Sim Quer Não paginar? Toque numa Caixa de secção pesquisa Toque numa Interrogação subsecção Não Sim Procure Resultados Não Está algo credíveis? na secção Sim Melhorar certa? interrogação Encontrou? Listar Não relevâncias Não Sim Ainda Frustrado? Quase Não Verificar Sim Não Será Sim Sim Encontrou? suficiente? Luís Vidigal
  26. 26. Estratégias de Pesquisa Directórios por categorias Pesquisa básica • Any words (Quaisquer palavras) • All words (Todas as palavras) • Exact phrase (Frase exacta) ou “....” Pesquisa avançada • Pesquisa booleana (AND, OR, NOT) • Palavras excluídas -xxx • Palavras incluídas +xxx Perguntas em linguagem natural Personalização
  27. 27. Operadores booleanos a b c a AND b a AND b AND c a OR b a AND b NOT c
  28. 28. Operadores booleanos (Exercícios) Vinho Tinto 1 2 3 5 4 6 7 Alentejo
  29. 29. Tipos de Motores de Pesquisa • Generalistas híbridos –Google, FAST, Altavista, Hotbot • Especializados • Metamotores • Metamotores inteligentes
  30. 30. Estratégias de Pesquisa Directórios por categorias Pesquisa básica • Any words (Quaisquer palavras) • All words (Todas as palavras) • Exact phrase (Frase exacta) ou “....” Pesquisa avançada • Pesquisa booleana (AND, OR, NOT) • Palavras excluídas -xxx • Palavras incluídas +xxx Perguntas em linguagem natural Personalização
  31. 31. Operadores booleanos nos principais Motores de Pesquisa (avançada) AND AND OR OR NOT NOT AND AND NOT NOT OR OR AND NOT
  32. 32. Pesquisa por defeito (simples) • AND: HotBot, Google, MSN Search, Teoma, WiseNut • OR: GigaBlast • Frase: AltaVista (só para frases comuns)
  33. 33. Sensível às maiúsculas • Sim: AltaVista Avançado, AltaVista Simples (entre aspas) • Só maiúsculas juntas: HotBot, MSN Search • Não: AltaVista Simples, Gigablast, Google, Lycos, Teoma, WiseNut
  34. 34. Indexação de campos • title: AltaVista, Gigablast, HotBot, Lycos, MSN Search • intitle: Google, Teoma • allintitle: Google • url: AltaVista, Gigablast, Lycos Advanced • inurl: Google, Teoma • allinurl: Google • link: AltaVista, Google, Gigablast, Lycos Advanced, MSN Search • host: AltaVista (same as site: at others) • ip: Gigablast • domain: HotBot, MSN Search • site: Gigablast, Google, Teoma, (use host: at AltaVista) • anchor: AltaVista • image: AltaVista • related: Google • others: AltaVista, Gigablast, Google, HotBot, MSN Search
  35. 35. Tipos de Documentos • PDFs: AltaVista, Gigablast, Google, MSN Search, HotBot • MS Word (.doc): Gigablast, Google, MSN Search, HotBot • PowerPoint (.ppt): Gigablast, Google, MSN Search, HotBot • Excel (.xls): Gigablast, Google, MSN Search, HotBot • PostScript (.ps): Gigablast, Google • WordPerfect (.wpd): Google
  36. 36. Conceitos associados à pesquisa na Web • Adequação (Match) • Pesquisa booleana (Boolean Search) • Parêntesis (Parentheses) • Pesquisa combinada (Faceted Search) • Pesquisa vectorial (Vector Search) • Pergunta (Query) • Linguagem Natural (Natural Language Processing - NLP) • Adequação difusa (Fuzzy Matching) • Lista de resultados (Results List) • Peso (Weighting) • Precisão (Recall and Precision)
  37. 37. Velocidade Precisão Resultado Encontrar sempre imediato documentos Âmbito relevantes Procurar todos os documentos da Web Um Motor de Localização Conhecer o local Pesquisa perfeito do utilizador Actualidade Toda a informação é actualizada Personalização Prioridade Os documentos Conhecer as mais relevantes necessidades do em primeiro utilizador lugar
  38. 38. Componentes de um Motor de Pesquisa • Batedores: descobrem e recolhem automáticamente conteúdos da web; • Repositório: armazena as páginas recolhidas; • Indexador: extrai as palavras das páginas armazenadas e cria índices para acelerar as pesquisas; • Ordenador: ordena as páginas que contenham os termos pesquisados por um utilizador de modo a que as mais relevantes sejam apresentadas nos primeiros lugares; • Apresentador: gere a interface de utilização do motor de busca.
  39. 39. Indexação e ordenação • Frequência de termos: as páginas mais importantes para uma palavra são as que a repetem mais vezes no texto; • PageRank: é um algoritmo matemático em que as páginas mais importantes são as que recebem o maior número de links ou links das páginas mais importantes; • Número de links: as páginas mais importantes são as que recebem o maior número de links; • tf-idf: calcula a importância da página combinando a frequência de um termo com a importância desse termo no conjunto de todas as páginas armazenadas; • Estrutura da página: a importância de uma página é dada pela localização de um termo na sua estrutura. Por exemplo, as páginas mais importantes são as que contêm o termo no titulo; • Análise de URLs: as páginas mais importantes são as que contêm os termos no URL que as refere.
  40. 40. Motor de Pesquisa • Indexação do Texto - extraindo o conteúdo relevante de cada página, descartando: Lista de palavras vazias (SWL – Stop Word List) – Artigos, preposições, conjunções e pronomes – Verbos comuns (saber, ver, fazer, ser, etc.) – Adjectivos comuns (grande, alto, atrasado, etc.) – Qualquer palavra que apareça em todos os documentos – Qualquer palavra que apareça apenas em um documento • Indexação META – Indexando preferencialmente as palavras chave colocadas pelo autor na meta-informação de cada página
  41. 41. Motor de Pesquisa Pertinência da Página • Densidade das palavras • Frequência das palavras • Proximidade das palavras • Links externos para a página • META tags
  42. 42. Exemplo de um Problema Impressionismo francês Impressionismo francês Claude Monet Claude Monet Exposições Exposições Renoir Renoir Museu de Giverny Museu de Giverny Livros Livros
  43. 43. A solução O destinatário A semântica Personalização Personalização Taxinomia Taxinomia Localização Localização Sinónimos Sinónimos Traduções Traduções
  44. 44. Comparação entre Motores de Pesquisa http://www.searchengineshowdown.com/features/
  45. 45. Estatísticas dos Motores de Pesquisa
  46. 46. Fidelidade aos Motores de Pesquisa
  47. 47. Forças e fraquezas do Google (Junho 2004) • Strengths: * Size and scope: It is now the largest, and includes PDF, DOC, PS, and many other file types * Relevance based on sites' linkages and authority * Cached archive of Web pages as the looked were indexed * Additional databases: Google Groups, News, Directory, etc. • Weaknesses: See also the Google Inconsistencies Page * Limited search features: no nesting, no truncation, does not support full Boolean * Link searches must be exact and are incomplete * Only indexes first 101 KB of a Web page and about 120 KB of PDFs * May search for plural/singular, synonyms, and grammatical variants without telling you http://www.searchengineshowdown.com/features/google/review.html
  48. 48. Operadores booleanos no Google Para esta operação, no Google é assim x AND y xy x OR y x OR y x AND (y OR z) x y OR z (x AND y) OR (z AND q) Ainda não possível (x OR y) AND (z OR q) x OR y z OR q x AND (y OR z OR q) x y OR z OR q x AND (y OR z) AND q x y OR z q
  49. 49. Sites sobre recursos de pesquisa http://www.searchengineshowdown.com/ http://searchenginewatch.com/ http://www.webmasterworld.com/
  50. 50. Notícias http://news.google.com/ http://www.altavista.com/news/ http://www.alltheweb.com/?cat=news http://www.totalnews.com/ http://www.newsindex.com/ http://news.yahoo.com/
  51. 51. Multi-Search Engines • Copernic http://www.copernic.com/ AltaVista, AOL Search, CompuServe, Espotting, All The Web (Fast Search), FindWhat, HotBot, LookSmart, Lycos, Mamma.com, MSN Web Search, Netscape Netcenter, Open Directory, Teoma, WiseNut, Yahoo. • Search http://www.search.com/ AltaVista, All The Web (Fast Search), Google, Lycos, WebCrawler, Thunderstone, Infoseek, Direct Hit, HotBot, Excite, Galaxy e NationalDirectory. • MetaCrawler http://www.metacrawler.com/ Lycos, WebCrawler, Infoseek, Excite, Thunderstone, AltaVista, GoTo e Yahoo. • C4 http://www.c4.com/ AltaVista, Yahoo!, InfoSeek. Excite, Lycos, NBCi.com, Magellan, WebCrawler e HotBot. • DogPile http://www.dogpile.com/ LookSmart, GoTo.com, Thunderstone, Yahoo!, Open Directory, About.com, Direct Hit, Lycos e AltaVista. • InfoSpace http://www.infospace.com/ Excite, AltaVista, Infoseek e WebCrawler.
  52. 52. Grandes Arquivos Históricos da WEB • http://web.archive.org • http://www.gigablast.com
  53. 53. Comparação entre Directórios http://www.searchengineshowdown.com/dir/
  54. 54. Directórios • http://www.yahoo.com • http://www.looksmart.com • http://www.dmoz.com
  55. 55. Pesquisa de Imagens, Audio e Vídeo • AllTheWeb http://www.alltheweb.com/ • AltaVista http://www.altavista.com/ • Ditto (só imagens) http://www.ditto.com/ • Google Images (só imagens) http://images.google.com • Kazaa Media Desktop (só MP3) http://www.kazaa.com/ • Lycos Pictures and Sounds http://multimedia.lycos.com/ • MIDI Explorer (Só MIDI) http://www.musicrobot.com/ • Picsearch (só imagens) http://www.picsearch.com/ • Singingfish (Só som e video) http://www.singingfish.com/
  56. 56. Listas Telefónicas • Switchboard - http://www.switchboard.com/ • InfoSpace - http://www.infospace.com/ • AnyWho - http://www.anywho.com/ • SuperPages.com - http://www.superpages.com/ • SmartPages.com - http://www.smartpages.com/ • WhoWhere - http://www.whowhere.lycos.com/ • Infobel - http://www.infobel.com/ • InfoUSA - http://www.infousa.com/ • All Nations Telephone Search Engine - http://www.escapeartist.com/global/telephone.htm • Phonenumber.com - http://www.phonenumber.com/ • International Numbering Plans - http://www.numberingplans.com/ • 411 Information - http://www.411.info • GeoPortals.com, Inc. - http://finder.geoportals.com/ • 140Online - http://www.140online.com/ • Search Detective Reverse Phone Lookup - http://www.searchdetective.net/ • McPayphone - http://www.geocities.com/bootzilla00/ • Apni Directory - http://www.apnidirectory.com/ • Jay Computer Services - http://nt.jcsm.com/ • Zip and Area Code Directory - http://www.horizon-realty.us/whrzipar.htm • Email Address Finder - http://www.allemailaddresses.com/
  57. 57. Enciclopédias http://www.wikipedia.org/ http://www.britannica.com/ • Living Encyclopedia in Cyberspace - http://www.encyberpedia.com/ency.htm • The Virtual Encyclopedia - http://www.abp1.com/knowledgeispower/index.ht ml • Search-22 - Reference Search Engines - http://www.search-22.com/reference.html • Access Place Library - http://www.accessplace.com/library.htm
  58. 58. Gestão do Conhecimento • KTweb - http://www.ktweb.org • The Knowledge Management Connection - http://www.KMconnection.com • Knowledge Management Resource Center - http://www.kmresource.com • Knowledge Management Resource Center - http://www.bio- itworld.com/resources/km/ • Netacademy on Knowledge Media - http://www.knowledgemedia.org • ICASIT's Knowledge Management Central - http://www.icasit.org/km/ • Knowledge Management Server - http://www.mccombs.utexas.edu/kman/ • Meta Knowledge Management - http://www.metakm.com • Knowledge Management Center Info - http://www.kmcenter.info/ • KMTool - http://www.kmtool.net • Gotcha - http://www.sims.berkeley.edu/courses/is213/s99/Projects/P9/web_site/index.html • Knowledge-Portal.com - http://www.knowledge-portal.com/ • Knowledge Management Links - http://www.lepak.com/kmlinks.html • Knowledge Portal on Document and Data Organization - http://members.lycos.co.uk/UFitsME/knowledge.html
  59. 59. Bibliotecas • LibDex - http://www.libdex.com/ • School Libraries on the Web - http://www.sldirectory.com/ • Lib Web Cats - http://www.librarytechnology.org/libwebcats/ • Libweb - http://lists.webjunction.org/libweb/ • Lii.org: Librarianship - http://lii.org/search/file/libraries • National Library Catalogues Worldwide - http://www.library.uq.edu.au/ssah/jeast/ • Library and Information Science - http://www.ifla.org/II/natlibs.htm • ALiNUS - http://www.snhu.edu/Southern_New_Hampshire_University/Library/Electronic_Resources/ALiNUS_Home.html • The WWW Library Directory - http://www.webpan.com/msauers/libdir/ • NLS/BPH: Reference Directories Index Page - http://www.loc.gov/nls/reference/directories/ • Canadian Directory of Special Collections - http://www.collectionscanada.ca/collectionsp/index-e.html • Philadelphia Area Consortium of Special Collections Libraries - http://www.pacscl.org/ • Veterinary Medicine Libraries - http://duke.usask.ca/~ladd/vet_libraries.html • UNESCO Libraries Portal - http://www.unesco.org/webworld/portal_bib/Libraries/ • LibraryBug - http://www.librarybug.org • Library and Related Resources - http://www.ex.ac.uk/library/wwwlibs.html • ISBNDB - http://isbndb.com/ • Internet Quick Reference Shelf: Library Resources - http://www.indiana.edu/~librcsd/internet/Library_Resources/ • Libraries of the World and their Catalogues - http://www.sylviamilne.btinternet.co.uk/plucked/libcats.htm • Libraries and Archives - http://www.uky.edu/Subject/libraries.html • List of Judaica Library Websites - http://www.angelfire.com/on2/smbergson/jlibraries.htm • Law Libraries Worldwide - http://www.chanrobles.com/lawlib1.htm • Global Reach - https://cs.ala.org/global/ • Bookwire - http://www.bookwire.com/bookwire/libraries/libraries.html • Libraries & Archives - http://book-smith.tripod.com/bml-libraries.html • US State Library Links - http://www.angelfire.com/ks/windshipgenhelp/statelib.html • Bishop Library Index - http://members.lycos.co.uk/kbishoplib/
  60. 60. Mapas • Maps on Other Web Sites - http://www.lib.utexas.edu/maps/map_sites/map_sites.html • All the World's Maps - http://www.embassyworld.com/maps/maps.html • Oddens' Bookmarks - http://oddens.geog.uu.nl/index.php • About.com: Maps - http://geography.about.com/cs/maps/ • Bodleian Library Map Room - http://www.bodley.ox.ac.uk/guides/maps/maplinks.htm • StreetLookup.Com - http://www.streetlookup.com/ • Alexandria Digital Library - http://www.alexandria.ucsb.edu/other-sites/subj_page.html • Maps from start4all - http://maps.start4all.com/ • Links 4 Maps - http://www.links4maps.com/
  61. 61. Directórios http://www.google.com/dirhp http://dir.yahoo.com/
  62. 62. Directórios • The Invisible Web Directory - http://www.invisible- • Re-Quest dot Net - http://www.re-quest.net/ web.net/ • Blakkat Station - http://blakkat.com/ • ThisIsOurYear - http://www.thisisouryear.com/ • 1st Spot - http://1st-spot.net/ • Common Content - http://www.commoncontent.org/ • Hoppa - http://hoppa.com/ • Nations Online - • Fetch Dog - http://www.fetchdog.com/ http://www.nationsonline.org/oneworld/ • Forum Zilla - http://www.forumzilla.com/ • Chiff - http://www.chiff.com/ • The Library Channel - • VisioBrand - http://www.visiobrand.com/ http://www.thelibrarychannel.com/ • GoGuides Directory - http://www.goguides.org • Wealth24.com - http://www.wealth24.com/ • Gimpsy - http://www.gimpsy.com/ • intelSeek! - http://www.intelseek.com/ • Starting Page - http://www.startingpage.com/ • Got That Online - http://www.gotthatonline.com/ • DateDex - http://www.datedex.com/ • E-lynks - http://www.e-lynks.com/ • Surfpoint - http://www.surfpoint.com/ • GirlHoo - http://www.girlhoo.com/ • 123World - http://www.123world.com/ • Leon's Web Brain - • Web World Directory - http://www.leonatkinson.com/brain/ http://www.webworldindex.com/ • iMarvel - http://www.imarvel.com/ • Sight Quest - http://www.sightquest.com/ • Smart Links - http://www.smartlinks.org/ • SearchMonster - http://www.searchmonster.org/ • Smart Internet Guide - • La Toile des Toiles - http://www.la-toile.com/ http://www.smartinternetguide.com/ • Somuch - http://www.somuch.com/ • A Perfect Search - http://aperfectsearch.com/ • Andilinks - http://www.andilinks.com/ • Consumer2.com - http://www.consumer2.com/ • Linkopedia - http://www.linkopedia.com/ • MVRU.com - http://www.mvru.com • Josh's Sanctum - http://josh.nu/ • Ranks - http://ranks.com/ • Yakeo - http://www.yakeo.com/ • Aeiwi - http://www.aeiwi.com/ • All.info - http://all.info/ • Rex - http://rex.skyline.net/ • Earth Station Nine - http://www.earthstation9.com/
  63. 63. A família Yahoo • Yahoo! - http://www.yahoo.com/ Directório principal • AllTheWeb - http://www.alltheweb.com/ Motor de pesquisa do Yahoo • Yahooligans! - http://yahooligans.yahoo.com/ Para crianças • Ujiko - http://www.ujiko.com/ Pesquisa personalizada do Yahoo
  64. 64. Forças e fraquezas do Yahoo (Abril 2005) • Strengths: * A large, new (as of Feb. 2004) search engine database * Includes cached copies of pages * Also includes links to the Yahoo! directory * Supports full Boolean searching • Weaknesses: * Lack of some advanced search features such as truncation * Only indexes first 500 KB of a Web page (still more than Google's 101KB) * Link searches require the inclusion of the http:// * Includes some pay for inclusion sites http://www.searchengineshowdown.com/features/yahoo/review.html
  65. 65. Pesquisar publicações científicas http://scholar.google.pt/ Directórios http://infomine.ucr.edu/ http://lii.org/
  66. 66. Sítios para Crianças Yahoo! Kids http://www.yahooligans.com Kids Click! http://www.kidsclick.org ThinkQuest Entries http://www.thinkquest.org/library Kids Search Tool http://www.rcls.org/ksearch.htm Ask Jeeves for Kids http://www.askforkids.com/
  67. 67. Pesquisadores para encaminhamento em Portugal http://www.iupi.pt/ http://www.busca.pt/ http://www.aeiou.pt/ http://www.sapo.pt/ http://www.cusco.pt
  68. 68. Portais e Jornais portugueses http://www.lusomundo.net http://www.iol.pt/ http://dn.sapo.pt/ http://jn.sapo.pt/ http://www.publico.pt/
  69. 69. Televisões portuguesas http://www.rtp.pt http://www.sic.pt http://www.tvi.iol.pt http://www.sporttv.pt http://www.telecine.pt
  70. 70. Rádios portuguesas http://www.radiocomercial.pt http://www.tsf.pt http://www.rdp.pt/antena1 http://www.rdp.pt/antena2 http://www.rdp.pt/antena3 http://www.radiocidade.iol.pt http://www.rr.pt/
  71. 71. Legislação http://www.dr.incm.pt http://www.digesto.gov.pt/
  72. 72. Governo, Parlamento e Administração Pública http://www.portaldocidadao.pt http://www.lojadocidadao.pt http://www.portugal.gov.pt http://www.parlamento.pt http://www.dgo.pt http://www.dgap.gov.pt
  73. 73. http://www.zdnet.com http://www.hotfiles.com http://www.shareware.com http://www.tucows.com http://www.jumbo.com
  74. 74. Notícias para os profissionais de Informação • ResourceShelf http://www.resourceshelf.com/ • LLRX (Legislação) http://www.llrx.com/ • Librarians' Index to the Internet http://lii.org/ • INFOMINE http://infomine.ucr.edu/ • The Internet Scout Project http://scout.wisc.edu/
  75. 75. http://lii.org Sítios confiáveis
  76. 76. Tipos de som na Internet MP3 MPEG (Moving Picture Experts Group) Audio Layer 3, é um standard para a codificação e compressão de sinais áudio. Faz diminuir o tamanho dos ficheiros áudio sem perder muita qualidade. A "codificação perceptual de áudio" e "compressão psico-acústica" removem partes do sinal que pouca diferença fazem à forma como de facto ouvimos os sons. WAV (Waveform Audio) é um formato "nativo" do Windows, utilizado por exemplo para os pequenos ruídos que um computador emite para indicar que o Windows foi iniciado ou a reciclagem foi limpa. Streaming Streaming audio ou streaming media é uma técnica que permite ouvir parte do ficheiro antes do download estar concluído. Funciona através do download e armazenamento de uma secção suficiente do ficheiro para actuar como buffer, permitindo a reprodução da música mesmo que a transmissão seja brevemente interrompida. Pode tirar uma amostra do áudio e decidir se pretende continuar a download ou simplesmente cancelar. Se por qualquer motivo a transmissão ficar demasiado lenta, o buffer pode ficar cheio e a reprodução pode soar menos bem.
  77. 77. Vídeo na Internet AVI Audio Video Interleaved.AVI. um formato multimédia da Microsoft , utilizado pelo Video for Windows. Os elementos áudio e vídeo são armazenados em segmentos alternados no ficheiro (.avi). MPEG Moving Pictures Experts Group standard para compressão e armazenamento de vídeos (.mpg) Windows Media e Microsoft's Windows Media Player (.asf) Real RealNetwork's RealVideo (.ram) Quicktime extensão do ficheiro Windows: .mov
  78. 78. Requisitos de Segurança • Integridade – Complecta e não alterada • Confidencialidade – Acesso condicionado • Autenticidade – Identidade da pessoa • Não repúdio – Transacção garantida
  79. 79. Assinaturas digitais Entidade Entidade a a lic lic Certificadora Certificadora úb P A úb P B AE a da a da riv P A riv P B A B
  80. 80. CAPTCHA "Completely Automated Public Turing test to tell Computers and Humans Apart“ Carnegie Mellon University Garantir que a resposta não é gerada por computadores, mas por humanos Turing Test (1950)
  81. 81. Fishing

×