Vyhledavani v prostredi Internetu

1,291 views

Published on

Presentation for project LiveOnLine www.liveonline.cz

Published in: Education
0 Comments
1 Like
Statistics
Notes
 • Be the first to comment

No Downloads
Views
Total views
1,291
On SlideShare
0
From Embeds
0
Number of Embeds
5
Actions
Shares
0
Downloads
5
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide
 • Entropie – neznalost, nejistota , neuspo řá danost systému
 • 50%  profese -  které nelze striktně oddělit od oblasti služeb, ale které zároveň velkou měrou zasahují do oblasti informačního sektoru, mezi ně patří lékaři, zdravotní sestry a například většina vedoucích pracovníků.
 • Průvodním jevem informační společnosti je informační exploze Kvantitativní nárůst informací – rozvoj všeho: formáty, typy informací,
 • vnímání zahlceno přebytkem informací ; získat informace není problém, ale je problém s jejich kvalitou a zpracování Exformace – nekomunikovaná informace,
 • Znalost - informace využívaná a ověřená praxí
 • formáty PDF, PS,
 • Základní entita – všechny el. Informační zdroje šedá lit. – maily, intranet,
 • Data o datech – Web of Science – 80.léta DC – czech home page - http://www.ics.muni.cz/dublin_core/index.html DCMI - http://dublincore.org/documents/dcmi-type-vocabulary/ - Jak vyplývá z definice – bez metadat, nebo obecněji, popisu DO by byla manipulace s DO obtížná, ba dokonce v mnoha případech nemožná
 • Komplexní standardizovaný proces s garanty jako je ISO – Mezinárodní organizace pro standardizaci a IFLA – Mezinárodní federace knihovnických asociací Metadata jsou obrazem popisu v elektronickém prostředí
 • Prvky jsou kvalifikovatelné do podprvků. Generátory – intuitivní formulář pro zápis metadat XML Extensible Markup Language - rozšiřitelný značkovací jazyk – strojem zpracovatelná a srozumitelná data – vnořená do dokumentu nebo externě propojená s nějakým jiným souborem.
 • Budeme potřebovat nějaký vyhledávací nástroj
 • Předmětové katalogy – adresáře
 • Tomuhle moc nerozumím, to bych si potřeboval asi ujasnit
 • Přednsatavení operátorů ve vyhledávačích!
 • Vyhledavani v prostredi Internetu

  1. 1. Barbora Poláková ; Martin Kozel
  2. 3. Osnova přednášky <ul><li>Co se děje? </li></ul><ul><ul><li>změny v přístupu a práci s informacemi </li></ul></ul><ul><li>Co s tím ? </li></ul><ul><ul><li>Struktura informací na webu – teorie a praxe </li></ul></ul><ul><li>Jak na to ? </li></ul><ul><ul><li>Strategie vyhledávání a postupy </li></ul></ul>
  3. 4. Informace <ul><ul><li>Komunikovatelný popis jevu, jehož přijetím dochází ke změnám v informačním systému. </li></ul></ul><ul><ul><li>Odstraněná ENTROPIE </li></ul></ul><ul><ul><ul><li> Vyšší míra uspořádanosti </li></ul></ul></ul><ul><ul><li>Čím více neurčitosti odstraní tím větší má informace hodnotu. (Shannon,1948) </li></ul></ul><ul><ul><ul><li>popsatelná </li></ul></ul></ul><ul><ul><ul><li>kontextově nezávislá </li></ul></ul></ul><ul><ul><ul><li>organizovatelná </li></ul></ul></ul><ul><li>informační zdroj/pramen </li></ul>
  4. 5. Informační společnost <ul><li>je taková společnost, ve které je věnována pozornost informační činnosti natolik, že dojde ke snížení zájmu o zemědělskou a průmyslovou výrobu (Vlasák, 2000) </li></ul><ul><li>Marc Uri Porat (1976). Information economy : definition and measurement </li></ul><ul><li>70.léta – postindustriální společnost </li></ul><ul><ul><ul><li>průmysl ----- > služby </li></ul></ul></ul>
  5. 6. <ul><li>80.léta – informační společnost </li></ul><ul><ul><li>propojení počítačového průmyslu s ostatními průmyslovými odvětvími </li></ul></ul><ul><ul><li>rozvoj informační a počítačové GRAMOTNOSTI </li></ul></ul><ul><ul><li>INFORMAČNÍ SEKTOR – profese tvorby, sběru, zpracovávání, uchovávání, zpětného vyhledávání a dalšího šíření informací (Vlasák, 2000) </li></ul></ul>
  6. 7. Informační exploze <ul><li>Informace = Moc = Peníze !!! </li></ul><ul><li>Prudký rozvoj informačních technologií a jejich dostupnost </li></ul><ul><li>KVANTITATIVNÍ nárůst informací a informačních zdrojů </li></ul><ul><ul><li>Redundance ; relevance ; pertinence </li></ul></ul><ul><ul><li>Mrtvá data – long tail effect </li></ul></ul>
  7. 8. Informační smog (Shenk 1997) <ul><li>lidstvo se nevyvíjí dost rychle aby zvládalo množství informací </li></ul><ul><li>Exformace - informace existující za hranicemi našeho vědomí (Gore, 1994) </li></ul><ul><li>Zahlcení </li></ul><ul><ul><li>snížení citlivosti k obsahu  - mozková kapacita je stále stejná (Černohlávková, 2006) </li></ul></ul>
  8. 9. Znalostní společnost <ul><li>nadstavba informační společnosti založená na kolaboraci a interakci mezi uživateli </li></ul><ul><li>Web 2.0 - Tim Bernards-Lee (2000) </li></ul><ul><li>Znalost </li></ul><ul><ul><li>kontextově závislá ; pragmatický obraz informace reprezentovaný intelektuálním kapitálem jednotlivce (Bukh, 2001) </li></ul></ul>
  9. 10. Terminologické vyjasnění <ul><li>Základní abstraktní pojmy : </li></ul><ul><ul><li>INFORMACE </li></ul></ul><ul><ul><li>ZNALOSTI </li></ul></ul><ul><li>Základní konkrétní pojmy : </li></ul><ul><ul><li>Informační / elektronický zdroj </li></ul></ul><ul><ul><li>digitální / informační objekt / entita </li></ul></ul>
  10. 11. Publikační procesy
  11. 12. Publikační proces informačního zdroje - původní <ul><ul><li>Nakladatelství, časopisy, databáze, databázová centra </li></ul></ul>
  12. 13. Publikační proces informačního zdroje – nyní Web 2.0 – sociální sítě, wiki, blog
  13. 14. Hodnocení <ul><li>+ </li></ul><ul><ul><li>Aktuálnost </li></ul></ul><ul><ul><li>Rychlost </li></ul></ul><ul><ul><li>Kooperace </li></ul></ul><ul><li>- </li></ul><ul><ul><li>Kontrola kvality, relevance </li></ul></ul><ul><ul><li>Korektura </li></ul></ul><ul><ul><li>Odborný dohled </li></ul></ul><ul><ul><li>Distribuce a popis jsou na autorovi – NEDOHLEDATELNOST </li></ul></ul>
  14. 15. KDE TO VŠECHNO MŮŽEME NAJÍT ?
  15. 16. World Wide Web <ul><li>Viditelný / povrchový web </li></ul><ul><ul><li>informační entity volně přístupné a snadno dostupné pomocí vyhledávacích strojů </li></ul></ul><ul><li>Neviditelný / hluboký web </li></ul><ul><ul><li>neviditelný pro běžné vyhledavače </li></ul></ul><ul><ul><ul><li>databáze, adresáře, rejstříky, dokumenty v nepodporovaných formátech, licencované stránky </li></ul></ul></ul><ul><ul><ul><li>500x větší než povrchový web </li></ul></ul></ul>
  16. 17. Web povrchový a hluboký (Bergman,2001)
  17. 18. Obsahové rozvrstvení hlubokého webu (Bergman, 2001)
  18. 19. CO TAM MŮŽEME NAJÍT ?
  19. 20. Digitální objekt (DO) <ul><li>základní entita </li></ul><ul><li>Hledisko původu : </li></ul><ul><ul><li>digitalizované informační zdroje </li></ul></ul><ul><ul><ul><li>E-book ; postprinty </li></ul></ul></ul><ul><ul><li>born digital </li></ul></ul><ul><ul><ul><li>Webové stránky, fóra, komunity, blogy, wiki </li></ul></ul></ul>
  20. 21. Hledisko typů DO <ul><ul><li>MIME - Multipurpose Internet Mail Extension </li></ul></ul><ul><ul><ul><li>Specifikuje charakter obsahu oficiálně komunikovaných DO na internetu </li></ul></ul></ul><ul><ul><ul><li>Typy: </li></ul></ul></ul><ul><ul><ul><li>Text </li></ul></ul></ul><ul><ul><ul><li>Obraz </li></ul></ul></ul><ul><ul><ul><li>Video </li></ul></ul></ul><ul><ul><ul><li>Zvuk </li></ul></ul></ul><ul><ul><ul><li>Software </li></ul></ul></ul><ul><ul><ul><li>Trojrozměrné digitální objekty </li></ul></ul></ul>
  21. 22. Digitální objekt Hlavička / Metadata Obsah Podpis
  22. 23. Metadata – Velká a mocná <ul><li>„ Data o datech “ </li></ul><ul><li>Strukturované informace, které popisují, osvětlují, lokalizují a usnadňují vyhledávání a využívání informačního zdroje . (Guidlines for Digitalization, 2007) </li></ul>
  23. 24. Popis DO <ul><li>Předobraz metadatového popisu je v popisu tradičních zdrojů. </li></ul><ul><ul><li>strojem čitelný X stroji srozumitelný </li></ul></ul><ul><li>Dvě úrovně popisu: </li></ul><ul><ul><li>věcná – obsah, anotace, abstrakt, klíčová slova, kódy systematického třídění … </li></ul></ul><ul><ul><li>popisná –popis dokumentu podle formálních znaků ; autor, název, vydavatel, rok vyd. … </li></ul></ul>
  24. 25. Tradiční bbg. Záznam - MARC 21
  25. 26. Dublin Core Metadata Initiative -DCMI <ul><li>Dublin Core </li></ul><ul><ul><li>Soubor 15 metadatových kvalifikovatelných prvků </li></ul></ul><ul><ul><li>Původně popis zdrojů na WWW ; současně popis jakéhokoli objektu </li></ul></ul><ul><li>Garant popisu - autor  user-friendly </li></ul><ul><li>Dublin Core Czech </li></ul><ul><li>DCMI homepage </li></ul>
  26. 27. Prvky DC
  27. 28. Identifikátory <ul><li>URL </li></ul><ul><ul><li>Adresa DO; určuje pozici DO v prostředí webu </li></ul></ul><ul><li>URN </li></ul><ul><ul><li>Znakový řetězec nebo číslo, které jednoznačně identifikuje dokument </li></ul></ul><ul><ul><li>Trvalé, nepřenosné </li></ul></ul><ul><ul><li>Generátory metadat </li></ul></ul><ul><ul><li>XML soubory </li></ul></ul>
  28. 29. Metadata - DC
  29. 30. TAK JSME TO HEZKY POPSALI … A JAK TO NAJDEM?
  30. 31. Vyhledávací nástroje „ HLAVORUČNÍ “ <ul><li>Předmětové katalogy - directories- </li></ul><ul><ul><li>Seznam katalog, Yahoo katalog </li></ul></ul><ul><li>třídění a organizace DO podle předem dané taxonomie nebo předmětové klasifikace </li></ul><ul><ul><li>Nejpodobnější tradičním knihovnám </li></ul></ul><ul><ul><li>Lidský faktor </li></ul></ul><ul><ul><li>Malé pokrytí, úplnost taxonomie </li></ul></ul>
  31. 32. Vyhledávací nástroje AUTOMATICKÉ <ul><li>Vyhledavače - search engine </li></ul><ul><ul><li>Altavista </li></ul></ul><ul><li>Metavyhledavače </li></ul><ul><ul><li>víc indexů najednou </li></ul></ul><ul><ul><li>Open Text </li></ul></ul><ul><li>Sekvenční analýza </li></ul><ul><li>Automatická INDEXACE digitálních objektů za pomoci speciálního softwaru </li></ul><ul><ul><li>Robot ; crawler ; spiders ; bot </li></ul></ul><ul><ul><li>Index – reprezentace fondu úplných textů - metadata </li></ul></ul>
  32. 33. Vyhledavač – obecné schéma Vyhledavač Prostředí webu (Poláková, 2009)
  33. 34. Google Schéma (Brin & Page, 2000)
  34. 35. Uživatelské rozhraní – 1/2 Textové <ul><li>Textový vyhledávací dotaz </li></ul><ul><li>Textová reprezentace výsledku </li></ul><ul><ul><li>Index – zkrácená informace o příslušném zdroji </li></ul></ul><ul><ul><li>odkaz na fulltext </li></ul></ul><ul><ul><ul><li>Google </li></ul></ul></ul>
  35. 36. Question answering 2/2
  36. 37. Uživatelské rozhraní – 1/3 Clustry <ul><li>Vektorová logika – </li></ul><ul><ul><li>Vážení podobnosti dokumentů s dotazy – relevance </li></ul></ul><ul><li>Informační prostor – soubor prvku a vztahů mezi nimi udržovaných informačním systémem (Ingwersen 1996) </li></ul>
  37. 38. Clustry 2/3 v informačním prostoru (Traykovski & Sosisk, 2007)
  38. 39. Clusty . com 3/3
  39. 40. Uživatelské rozhraní – 1 /3 Vizuální
  40. 41. Carrot 2 2/3
  41. 42. Searchme 3/3
  42. 43. <ul><li>CO, KDE, a JAK </li></ul>
  43. 44. Základní princip CO? KDE? JAK?
  44. 45. Co chci najít? <ul><li>Informační potřeba </li></ul><ul><ul><li>to co vím mi nestačí </li></ul></ul><ul><li>Požadavek </li></ul><ul><ul><li>konkretizovaná představa o informační potřebě </li></ul></ul><ul><li>Dotaz </li></ul><ul><ul><li>Kladu přímo zdroji, ve kterém hledám </li></ul></ul><ul><ul><li>Ve vyhledávačích obecně: </li></ul></ul><ul><ul><li>navigační, informační, transakční (např. co, kdy, kde atd.) </li></ul></ul>
  45. 46. Informační potřeba <ul><li>V 80-90 letech se rozvíjí věda nazvaná „informační chování uživatele“ </li></ul><ul><li>Posun v přístupu </li></ul><ul><li>computer-centred => user-centred </li></ul><ul><li>Tři základní přístupy </li></ul><ul><ul><li>Kognitivní </li></ul></ul><ul><ul><li>Sociální </li></ul></ul><ul><ul><li>Sociokognitivní (nejvíc in, kombinace individualismu s kontextualitou prostředí) </li></ul></ul>
  46. 47. KDE <ul><li>Typ zdroje </li></ul><ul><ul><li>Primární zdroje </li></ul></ul><ul><ul><li>Sekundární zdroje </li></ul></ul><ul><ul><li>Terciální zdroje </li></ul></ul><ul><li>Vyhledavače, katalogy, databáze, encyklopedie </li></ul><ul><li>Globální / lokální charakter, Gatekeeping </li></ul>
  47. 48. JAK <ul><li>Vychytávky </li></ul><ul><ul><li>Boolean logika (AND, OR, NOT ) </li></ul></ul><ul><ul><li>Proximitní operátory ( NEAR, WITHIN, SAME, „…“) </li></ul></ul><ul><ul><li>Lematizace (skloňování, ?, * atd.) </li></ul></ul><ul><li>Typy vyhledávání </li></ul><ul><ul><li>Fulltextové </li></ul></ul><ul><ul><li>Faktografické </li></ul></ul><ul><ul><li>Atd. </li></ul></ul><ul><li>Rešeršní strategie </li></ul>
  48. 49. JAK <ul><li>ANALYTICKÉ VYHLEDÁVÁNÍ </li></ul><ul><ul><li>Systematická strategie </li></ul></ul><ul><ul><li>Příprava, promýšlení problému, předdotazy </li></ul></ul><ul><li>PROHLÍŽENÍ (browsing) </li></ul><ul><ul><li>Intuitivní vyhledávání </li></ul></ul>
  49. 50. ZPĚTNÁ VAZBA
  50. 51. REŠERŠNÍ STRATEGIE <ul><li>Základní kameny </li></ul><ul><li>Rostoucí perla </li></ul><ul><li>Osekávání </li></ul>
  51. 52. Literatura <ul><li>GORE, Albert. Země na misce vah. 1.vyd. Praha: Argo, 1994, ISBN 80-85794-21-7. str.186. </li></ul><ul><li>ČERNOHLÁVKOVÁ, Kateřina. Informační hygiena. Brno : Masarykova Univerzita, 2006. </li></ul><ul><li>SHENK, David. Data Smog : Surviving the Information Glut. 1 st ed. San Francisco : Harper Edge,1997. 250 s. ISBN 0060187018. </li></ul><ul><li>ARMS, W. Key Concepts in the Architecture of the Digital Library. D-Lib Magazine [online]. July 1995 [cit. 2007-10-22]. Dostupný z WWW: < http://www.dlib.org/dlib/July95/07arms.html >. ISSN 1082-9873. </li></ul><ul><li>Brin S., Page, L. The Anatomy of a Large-Scale Hypertextual Web Search Engine. Stanford University [ online ] 2000 [cit. 2010 -03-22 ] . Dostupný z WWW: http://infolab.stanford.edu/~backrub/google.html </li></ul><ul><li>SKLENÁK (2000). Data informace znalosti </li></ul><ul><li>BUKH, P.N. Larsen H.T., Mouritsen J. (2001) Constructing intellectual capital statements. Scandinavian Journal of managemennt roč. 17, s. 87-108 </li></ul>
  52. 53. Literatura <ul><li>VLASÁK, R. (2000). Informační povolání a informační společnost </li></ul><ul><li>P ILECK Á, Věra Kognitivní aspekty vyhledávání. Dostupný z WWW: < h ttp://www. ikaros . cz / node /3592 > . </li></ul><ul><li>Pilecká, Věra (2010) Kognitivní přístupy k vyhledávání informací. Praha : Univerzita Karlova. </li></ul><ul><li>Mírková, Miluše (2009) Bibliografická a rešeršní činnost. Dostupný z WWW: http://home.czu.cz/ ~ mirkova/ </li></ul><ul><li>Portál pro podporu informační gramotnosti – www. inforgram . cz </li></ul>

  ×