Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Sieć ukryta a sieć widzialna. O zasobach WWW nieindeksowanych przez wyszukiwarki

458 views

Published on

Prezentacja dr hab. prof. UJ Magdaleny Szpunar z wykładu otwierającego ogólnopolską konferencję dla brokerów informacji i branż pokrewnych: IV Warsztat Pracy Infobrokera - 4.0 WPI

Prelegent: dr hab. prof. UJ Magdalena Szpunar, Instytut Dziennikarstwa, Mediów i Komunikacji Społecznej, Uniwersytet Jagiellońskiego
Miejsce: Wydział Zarządzania i Komunikacji Społecznej UJ, Kraków
Data: 28-29.05.2019

Więcej informacji o konferencji znajdziesz na www.spi.org.pl

Published in: Business
  • Be the first to comment

  • Be the first to like this

Sieć ukryta a sieć widzialna. O zasobach WWW nieindeksowanych przez wyszukiwarki

  1. 1. www.magdalenaszpunar.com Sieć ukryta a sieć widzialna O zasobach WWW nieindeksowanych przez wyszukiwarki prof. UJ dr hab. Magdalena Szpunar
  2. 2. www.magdalenaszpunar.com ● tylko 56 mln stron internetowych tj. ok. 25% wszystkich stron internetowych jest silnie związanych z „centrum” ● w większości innych przypadków prawdopodobieństwo znalezienia drogi z jednej strony na inną, bez wykorzystania adresu URL jest bliskie zeru ● aż 10% witryn w internecie jest odizolowanych całkowicie Topologia „muchy” - połączenia w sieci WWW
  3. 3. www.magdalenaszpunar.com ● badania Alberta-László Barabási z 1999 roku → połączenia między poszczególnymi węzłami sieci internetowej (stronami WWW) rozkładają się nierównomiernie ● gdyby połączenia były kwestią przypadku – rozkład normalny ● opracowanie algorytmu opisującego rozrastanie sieci internetowej Rozrastanie się sieci internetowej
  4. 4. www.magdalenaszpunar.com ● statystyczny rozkład węzłów podlega bezskalowemu rozkładowi potęgowemu ● bardzo duża liczba witryn ma niewiele połączeń z innymi, niewiele witryn wykazuje bardzo dużą liczbę połączeń ● kolejne węzły przyłączają się z większym prawdopodobieństwem do tych, które posiadają większą liczbę połączeń ● przyłączanie ma charakter preferencyjny → efekt św. Mateusza „bogaci się bogacą, biedni biednieją” lub prawo silniejszego (power law) ● węzły strategiczne, superwęzły, punkty węzłowe ● struktura oligarchiczna, a nie demokratyczna Ryc. Najpopularniejsze witryny internetowe w Polsce według Mapy Internetu /R. Enikiejew/ Właściwości połączeń w obrębie sieci WWW
  5. 5. www.magdalenaszpunar.com ● wyszukiwarki indeksują jedynie około 1% wszystkich informacji zgromadzonych w Sieci ● szacuje się, że sieć głęboka gromadzi 500 razy więcej informacji, niż sieć płytka ● 73% badanych deklaruje, że informacje wyłuskiwane przez szperacze są wiarygodne i dokładne ● 66% uważa, że wyszukiwarki są obiektywnym i rzetelnym źródłem informacji ● technologia definiująca /Jay Bolter/ ● „kształtujemy nasze narzędzia, a potem one kształtują nas” /Marshall McLuhan/ Ograniczenie horyzontu użytkownika
  6. 6. www.magdalenaszpunar.com Sieć ukryta a sieć widzialna
  7. 7. www.magdalenaszpunar.com ● zasada najmniejszego wysiłku (the principle of least effort) → szybko i efektywnie dotrzeć do interesujących treści ● zasada minimaksu → osiągnięcie celu jak najmniejszym kosztem ● wyniki proponowane przez wyszukiwarki → trafne, adekwatne i satysfakcjonujące Specyfika zachowań informacyjnych online
  8. 8. www.magdalenaszpunar.com ● główna przyczyna: mechanizmy wyszukująco-indeksujące ● połączone ze sobą hierplinkami strony można zobrazować za pomocą struktury grafu ● struktura grafu nie jest dokładnie znana, opracowanie algorytmu, który wyszuka i zindeksuje wszystkie strony internetowe jest trudne ● boty (pająki, crawlery) przeczesują internet metodą grafu co sprawia, że nie docierają do stron do których nie prowadzą żadne linki, po wtóre każdy z nich wybiera różne drogi, co sprawia, że automaty różnych wyszukiwarek rejestrują odmienne zbiory danych ● crawlery „nie widzą” stron prywatnych (zasoby chronione hasłem); zasobów ograniczających działanie botów np. poprzez CAPTCHA ● znaczenie ma także to, czy strona jest zbudowana w statycznym HTML-u, czy bazuje także na treściach dynamicznie pobieranych z serwerów WWW w technologii Flash, czy Ajax Przyczyny istnienia ukrytego internetu
  9. 9. www.magdalenaszpunar.com ● Immanentna cecha internetu na tle innych mediów → rozproszona topologia, brak wyraźnego centrum → coraz wyraźniej widoczna topologia oparta o superwęzły/węzły strategiczne ● Apogeum demokratyzacji informacji → model raczej oligarchiczny, niż demokratyczny i egalitarny ● Brak właściciela → dominacja gigantów internetowych, zawłaszczanie przestrzeni internetu, komercjalizacja ● Brak kontroli → filtrowanie, cenzurowanie treści online, inwigilacja jednostek, zanik prywatności, PRISM ● Przełamanie informacyjnego monopolu mediów masowych → monopol koncernów medialnych, egocasting ● Aktywna rola odbiorców – użytkowników → hipoteza opóźnienia kulturowego, reguła 1%, reprodukowanie zachowań typowych dla mediów masowych – bierność, pasywność Utopie internetu a rzeczywistość
  10. 10. www.magdalenaszpunar.com

×