SlideShare a Scribd company logo
1 of 10
Download to read offline
www.magdalenaszpunar.com
Sieć ukryta a sieć widzialna
O zasobach WWW nieindeksowanych przez wyszukiwarki
prof. UJ dr hab. Magdalena Szpunar
www.magdalenaszpunar.com
● tylko 56 mln stron internetowych tj. ok. 25% wszystkich
stron internetowych jest silnie związanych z „centrum”
● w większości innych przypadków prawdopodobieństwo
znalezienia drogi z jednej strony na inną, bez
wykorzystania adresu URL jest bliskie zeru
● aż 10% witryn w internecie jest odizolowanych całkowicie
Topologia „muchy” -
połączenia w sieci WWW
www.magdalenaszpunar.com
● badania Alberta-László Barabási z 1999 roku →
połączenia między poszczególnymi węzłami sieci
internetowej (stronami WWW) rozkładają się
nierównomiernie
● gdyby połączenia były kwestią przypadku – rozkład
normalny
● opracowanie algorytmu opisującego rozrastanie sieci
internetowej
Rozrastanie się sieci
internetowej
www.magdalenaszpunar.com
● statystyczny rozkład węzłów podlega bezskalowemu rozkładowi
potęgowemu
● bardzo duża liczba witryn ma niewiele połączeń z innymi,
niewiele witryn wykazuje bardzo dużą liczbę połączeń
● kolejne węzły przyłączają się z większym prawdopodobieństwem
do tych, które posiadają większą liczbę połączeń
● przyłączanie ma charakter preferencyjny → efekt św. Mateusza
„bogaci się bogacą, biedni biednieją” lub prawo silniejszego (power
law)
● węzły strategiczne, superwęzły, punkty węzłowe
● struktura oligarchiczna, a nie demokratyczna
Ryc. Najpopularniejsze witryny
internetowe w Polsce
według Mapy Internetu /R.
Enikiejew/
Właściwości połączeń w obrębie
sieci WWW
www.magdalenaszpunar.com
● wyszukiwarki indeksują jedynie około 1% wszystkich informacji
zgromadzonych w Sieci
● szacuje się, że sieć głęboka gromadzi 500 razy więcej
informacji, niż sieć płytka
● 73% badanych deklaruje, że informacje wyłuskiwane przez
szperacze są wiarygodne i dokładne
● 66% uważa, że wyszukiwarki są obiektywnym i rzetelnym
źródłem informacji
● technologia definiująca /Jay Bolter/
● „kształtujemy nasze narzędzia, a potem one kształtują nas”
/Marshall McLuhan/
Ograniczenie horyzontu użytkownika
www.magdalenaszpunar.com
Sieć ukryta a sieć widzialna
www.magdalenaszpunar.com
● zasada najmniejszego wysiłku (the principle of least
effort) → szybko i efektywnie dotrzeć do interesujących
treści
● zasada minimaksu → osiągnięcie celu jak najmniejszym
kosztem
● wyniki proponowane przez wyszukiwarki → trafne,
adekwatne i satysfakcjonujące
Specyfika zachowań
informacyjnych online
www.magdalenaszpunar.com
● główna przyczyna: mechanizmy wyszukująco-indeksujące
● połączone ze sobą hierplinkami strony można zobrazować za pomocą
struktury grafu
● struktura grafu nie jest dokładnie znana, opracowanie algorytmu, który
wyszuka i zindeksuje wszystkie strony internetowe jest trudne
● boty (pająki, crawlery) przeczesują internet metodą grafu co sprawia,
że nie docierają do stron do których nie prowadzą żadne linki, po
wtóre każdy z nich wybiera różne drogi, co sprawia, że automaty
różnych wyszukiwarek rejestrują odmienne zbiory danych
● crawlery „nie widzą” stron prywatnych (zasoby chronione hasłem);
zasobów ograniczających działanie botów np. poprzez CAPTCHA
● znaczenie ma także to, czy strona jest zbudowana w statycznym
HTML-u, czy bazuje także na treściach dynamicznie pobieranych z
serwerów WWW w technologii Flash, czy Ajax
Przyczyny istnienia ukrytego
internetu
www.magdalenaszpunar.com
● Immanentna cecha internetu na tle innych mediów →
rozproszona topologia, brak wyraźnego centrum → coraz
wyraźniej widoczna topologia oparta o superwęzły/węzły
strategiczne
● Apogeum demokratyzacji informacji → model raczej
oligarchiczny, niż demokratyczny i egalitarny
● Brak właściciela → dominacja gigantów internetowych,
zawłaszczanie przestrzeni internetu, komercjalizacja
● Brak kontroli → filtrowanie, cenzurowanie treści online,
inwigilacja jednostek, zanik prywatności, PRISM
● Przełamanie informacyjnego monopolu mediów masowych →
monopol koncernów medialnych, egocasting
● Aktywna rola odbiorców – użytkowników → hipoteza opóźnienia
kulturowego, reguła 1%, reprodukowanie zachowań typowych
dla mediów masowych – bierność, pasywność
Utopie internetu a
rzeczywistość
www.magdalenaszpunar.com

More Related Content

More from Stowarzyszenie Profesjonalistów Informacji

More from Stowarzyszenie Profesjonalistów Informacji (20)

Anonimowe sieci dystrybucji informacji na przykładzie sieci TOR
Anonimowe sieci dystrybucji informacji na przykładzie sieci TORAnonimowe sieci dystrybucji informacji na przykładzie sieci TOR
Anonimowe sieci dystrybucji informacji na przykładzie sieci TOR
 
Obraz biznesu - wizualna prezentacja danych
Obraz biznesu - wizualna prezentacja danychObraz biznesu - wizualna prezentacja danych
Obraz biznesu - wizualna prezentacja danych
 
Przyszłość rynku informacji
Przyszłość rynku informacjiPrzyszłość rynku informacji
Przyszłość rynku informacji
 
Market Intelligence - monitorowanie konkurencji i działań konkurencyjnych
Market Intelligence - monitorowanie konkurencji i działań konkurencyjnychMarket Intelligence - monitorowanie konkurencji i działań konkurencyjnych
Market Intelligence - monitorowanie konkurencji i działań konkurencyjnych
 
Rezultaty projektów jako źródła informacji
Rezultaty projektów jako źródła informacjiRezultaty projektów jako źródła informacji
Rezultaty projektów jako źródła informacji
 
Metody poszukiwania informacji w sieci TOR (i dlaczego nie są skuteczne)
Metody poszukiwania informacji w sieci TOR (i dlaczego nie są skuteczne)Metody poszukiwania informacji w sieci TOR (i dlaczego nie są skuteczne)
Metody poszukiwania informacji w sieci TOR (i dlaczego nie są skuteczne)
 
Weryfikacja Informacji
Weryfikacja Informacji Weryfikacja Informacji
Weryfikacja Informacji
 
Facebook jako źródło informacji
Facebook jako źródło informacjiFacebook jako źródło informacji
Facebook jako źródło informacji
 
Aplikacje osint
Aplikacje osintAplikacje osint
Aplikacje osint
 
Wielki Chiński Firewall czyli o codziennym korzystaniu z internetu w Chinach ...
Wielki Chiński Firewall czyli o codziennym korzystaniu z internetu w Chinach ...Wielki Chiński Firewall czyli o codziennym korzystaniu z internetu w Chinach ...
Wielki Chiński Firewall czyli o codziennym korzystaniu z internetu w Chinach ...
 
Rynek informacji gospodarczej w Polsce - wyniki branży 2012-2015 Analiza Spra...
Rynek informacji gospodarczej w Polsce - wyniki branży 2012-2015 Analiza Spra...Rynek informacji gospodarczej w Polsce - wyniki branży 2012-2015 Analiza Spra...
Rynek informacji gospodarczej w Polsce - wyniki branży 2012-2015 Analiza Spra...
 
Katarzyna staszewska
Katarzyna staszewskaKatarzyna staszewska
Katarzyna staszewska
 
Niekomercyjne źródła informacji na Ukrainie
Niekomercyjne źródła informacji na UkrainieNiekomercyjne źródła informacji na Ukrainie
Niekomercyjne źródła informacji na Ukrainie
 
Agregacja 17 źródeł danych jak wdrożyć i nie zwariować
Agregacja 17 źródeł danych jak wdrożyć i nie zwariowaćAgregacja 17 źródeł danych jak wdrożyć i nie zwariować
Agregacja 17 źródeł danych jak wdrożyć i nie zwariować
 
Wyszukiwanie informacji w pracy Sekcji Informacji Naukowej Biblioteki Jagiell...
Wyszukiwanie informacji w pracy Sekcji Informacji Naukowej Biblioteki Jagiell...Wyszukiwanie informacji w pracy Sekcji Informacji Naukowej Biblioteki Jagiell...
Wyszukiwanie informacji w pracy Sekcji Informacji Naukowej Biblioteki Jagiell...
 
Infobroker w sektorze finansów publicznych
Infobroker w sektorze finansów publicznychInfobroker w sektorze finansów publicznych
Infobroker w sektorze finansów publicznych
 
Źródła informacji medycznej w pracy infobrokera
Źródła informacji medycznej w pracy infobrokeraŹródła informacji medycznej w pracy infobrokera
Źródła informacji medycznej w pracy infobrokera
 
Techniki pozyskiwania informacji z social mediów
Techniki pozyskiwania informacji z social mediówTechniki pozyskiwania informacji z social mediów
Techniki pozyskiwania informacji z social mediów
 
Wykorzystanie sztucznej inteligencji w zarządzaniu wiedza
Wykorzystanie sztucznej inteligencji w zarządzaniu wiedzaWykorzystanie sztucznej inteligencji w zarządzaniu wiedza
Wykorzystanie sztucznej inteligencji w zarządzaniu wiedza
 
Zarządzanie nieopatentowaną wiedzą techniczną w przedsiębiorstwach ii warszta...
Zarządzanie nieopatentowaną wiedzą techniczną w przedsiębiorstwach ii warszta...Zarządzanie nieopatentowaną wiedzą techniczną w przedsiębiorstwach ii warszta...
Zarządzanie nieopatentowaną wiedzą techniczną w przedsiębiorstwach ii warszta...
 

Sieć ukryta a sieć widzialna. O zasobach WWW nieindeksowanych przez wyszukiwarki

  • 1. www.magdalenaszpunar.com Sieć ukryta a sieć widzialna O zasobach WWW nieindeksowanych przez wyszukiwarki prof. UJ dr hab. Magdalena Szpunar
  • 2. www.magdalenaszpunar.com ● tylko 56 mln stron internetowych tj. ok. 25% wszystkich stron internetowych jest silnie związanych z „centrum” ● w większości innych przypadków prawdopodobieństwo znalezienia drogi z jednej strony na inną, bez wykorzystania adresu URL jest bliskie zeru ● aż 10% witryn w internecie jest odizolowanych całkowicie Topologia „muchy” - połączenia w sieci WWW
  • 3. www.magdalenaszpunar.com ● badania Alberta-László Barabási z 1999 roku → połączenia między poszczególnymi węzłami sieci internetowej (stronami WWW) rozkładają się nierównomiernie ● gdyby połączenia były kwestią przypadku – rozkład normalny ● opracowanie algorytmu opisującego rozrastanie sieci internetowej Rozrastanie się sieci internetowej
  • 4. www.magdalenaszpunar.com ● statystyczny rozkład węzłów podlega bezskalowemu rozkładowi potęgowemu ● bardzo duża liczba witryn ma niewiele połączeń z innymi, niewiele witryn wykazuje bardzo dużą liczbę połączeń ● kolejne węzły przyłączają się z większym prawdopodobieństwem do tych, które posiadają większą liczbę połączeń ● przyłączanie ma charakter preferencyjny → efekt św. Mateusza „bogaci się bogacą, biedni biednieją” lub prawo silniejszego (power law) ● węzły strategiczne, superwęzły, punkty węzłowe ● struktura oligarchiczna, a nie demokratyczna Ryc. Najpopularniejsze witryny internetowe w Polsce według Mapy Internetu /R. Enikiejew/ Właściwości połączeń w obrębie sieci WWW
  • 5. www.magdalenaszpunar.com ● wyszukiwarki indeksują jedynie około 1% wszystkich informacji zgromadzonych w Sieci ● szacuje się, że sieć głęboka gromadzi 500 razy więcej informacji, niż sieć płytka ● 73% badanych deklaruje, że informacje wyłuskiwane przez szperacze są wiarygodne i dokładne ● 66% uważa, że wyszukiwarki są obiektywnym i rzetelnym źródłem informacji ● technologia definiująca /Jay Bolter/ ● „kształtujemy nasze narzędzia, a potem one kształtują nas” /Marshall McLuhan/ Ograniczenie horyzontu użytkownika
  • 7. www.magdalenaszpunar.com ● zasada najmniejszego wysiłku (the principle of least effort) → szybko i efektywnie dotrzeć do interesujących treści ● zasada minimaksu → osiągnięcie celu jak najmniejszym kosztem ● wyniki proponowane przez wyszukiwarki → trafne, adekwatne i satysfakcjonujące Specyfika zachowań informacyjnych online
  • 8. www.magdalenaszpunar.com ● główna przyczyna: mechanizmy wyszukująco-indeksujące ● połączone ze sobą hierplinkami strony można zobrazować za pomocą struktury grafu ● struktura grafu nie jest dokładnie znana, opracowanie algorytmu, który wyszuka i zindeksuje wszystkie strony internetowe jest trudne ● boty (pająki, crawlery) przeczesują internet metodą grafu co sprawia, że nie docierają do stron do których nie prowadzą żadne linki, po wtóre każdy z nich wybiera różne drogi, co sprawia, że automaty różnych wyszukiwarek rejestrują odmienne zbiory danych ● crawlery „nie widzą” stron prywatnych (zasoby chronione hasłem); zasobów ograniczających działanie botów np. poprzez CAPTCHA ● znaczenie ma także to, czy strona jest zbudowana w statycznym HTML-u, czy bazuje także na treściach dynamicznie pobieranych z serwerów WWW w technologii Flash, czy Ajax Przyczyny istnienia ukrytego internetu
  • 9. www.magdalenaszpunar.com ● Immanentna cecha internetu na tle innych mediów → rozproszona topologia, brak wyraźnego centrum → coraz wyraźniej widoczna topologia oparta o superwęzły/węzły strategiczne ● Apogeum demokratyzacji informacji → model raczej oligarchiczny, niż demokratyczny i egalitarny ● Brak właściciela → dominacja gigantów internetowych, zawłaszczanie przestrzeni internetu, komercjalizacja ● Brak kontroli → filtrowanie, cenzurowanie treści online, inwigilacja jednostek, zanik prywatności, PRISM ● Przełamanie informacyjnego monopolu mediów masowych → monopol koncernów medialnych, egocasting ● Aktywna rola odbiorców – użytkowników → hipoteza opóźnienia kulturowego, reguła 1%, reprodukowanie zachowań typowych dla mediów masowych – bierność, pasywność Utopie internetu a rzeczywistość