Cerca d’informació a Internet: implicacions jurídiques Julià Minguillón Universitat Oberta de Catalunya Seminari de Recerc...
Taula de continguts <ul><li>Què és això de la  World Wide Web ? </li></ul><ul><li>El concepte d’enllaç </li></ul><ul><li>E...
La  World Wide Web <ul><li>1989-1990 </li></ul><ul><li>(Sir) Tim Berners-Lee proposa un mecanisme per compartir documents ...
La  World Wide Web <ul><li>1990-1993 </li></ul><ul><li>Desenvolupament dels protocols necessaris per a compartir documents...
La  World Wide Web <ul><li>1993-1994 </li></ul><ul><li>Apareixen els primers web  sites  (llocs), pàgines web i navegadors...
El concepte d’enllaç <ul><li>Cada document HTML (o recurs) en un  servidor  té un identificador: </li></ul><ul><ul><li>htt...
Estadístiques <ul><li>1993 </li></ul><ul><li>Uns pocs centenars de llocs </li></ul><ul><li>1994 </li></ul><ul><li>10000 ll...
Estadístiques <ul><li>Avui </li></ul><ul><li>> 200000000 llocs web </li></ul><ul><li>> 20000000000 pàgines web </li></ul><...
Accés a la informació <ul><li>Estratègies </li></ul><ul><ul><li>Browsing </li></ul></ul><ul><ul><li>Searching </li></ul></...
Browsing <ul><li>La web no té una pàgina inicial </li></ul><ul><li>Organització jeràrquica: </li></ul><ul><ul><li>Per tema...
Searching <ul><li>Motors de cerca </li></ul><ul><li>Tres fases: </li></ul><ul><ul><li>Web  crawler </li></ul></ul><ul><ul>...
Web  crawlers <ul><li>Sistemes automàtics que visiten sistemàtica i repetidament un lloc, obtenint l’estructura i el conti...
Limitacions <ul><li>Accés protegit per paraula clau </li></ul><ul><li>Ús de CAPTCHAs </li></ul><ul><li>Tipus de recurs / d...
Protocol d’exclusió <ul><li>Fitxer  robots.txt </li></ul><ul><li>Ha de ser  públic </li></ul><ul><li>No obliga,  només ind...
Problemes <ul><li>Els cercadors permeten trobar informació sensible </li></ul><ul><li>El contingut i els seus enllaços són...
Amagant i trobant informació <ul><li>Ús de paraules clau “secretes”: </li></ul><ul><ul><li>pron,p0rn </li></ul></ul><ul><u...
Problemes <ul><li>Enllaços trencats / permanents </li></ul><ul><li>Versions prèvies ( cache ) </li></ul><ul><li>Vulnerabil...
Canvi de paradigma <ul><li>Web 2.0 </li></ul><ul><li>D’un model productor-consumidor a un altre on tots els usuaris “creen...
Més problemes 2.0 <ul><li>Un usuari A pot afegir un enllaç en el blog de B com a comentari a un post apuntant a un conting...
“ Futurs” problemes 3.0 <ul><li>Amb cerques contextualitzades serà possible esbrinar moltes coses dels usuaris: </li></ul>...
Privacitat dels usuaris <ul><li>Privacitat vs personalització </li></ul><ul><li>Opt-in vs Opt-out </li></ul><ul><li>Egosur...
Responsabilitats <ul><li>Qui crea / penja el contingut </li></ul><ul><li>Qui l’enllaça públicament </li></ul><ul><li>Qui r...
Responsabilitats <ul><li>Usuaris finals </li></ul><ul><li>Proveïdors de serveis </li></ul><ul><li>Cercadors </li></ul><ul>...
Debat <ul><li>La responsabilitat és principalment de qui penja el contingut </li></ul><ul><li>Els proveïdors (cercadors) s...
Referències <ul><li>http://en.wikipedia.org/wiki/World_Wide_Web </li></ul><ul><li>http://news.netcraft.com/archives/web_se...
Gràcies! <ul><li>Contacte: </li></ul><ul><li>Julià Minguillón </li></ul><ul><li>[email_address] </li></ul><ul><li>CC-BY-NC...
Upcoming SlideShare
Loading in …5
×

Cerca d’informació a Internet: implicacions jurídiques

744 views

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
744
On SlideShare
0
From Embeds
0
Number of Embeds
34
Actions
Shares
0
Downloads
3
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Cerca d’informació a Internet: implicacions jurídiques

  1. 1. Cerca d’informació a Internet: implicacions jurídiques Julià Minguillón Universitat Oberta de Catalunya Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  2. 2. Taula de continguts <ul><li>Què és això de la World Wide Web ? </li></ul><ul><li>El concepte d’enllaç </li></ul><ul><li>Estadístiques de la web </li></ul><ul><li>Cercant i endreçant informació </li></ul><ul><li>Motors de cerca </li></ul><ul><li>Problemes </li></ul><ul><li>Responsabilitats </li></ul><ul><li>Debat: implicacions jurídiques </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  3. 3. La World Wide Web <ul><li>1989-1990 </li></ul><ul><li>(Sir) Tim Berners-Lee proposa un mecanisme per compartir documents entre ordinadors enllaçant-se uns amb els altres </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  4. 4. La World Wide Web <ul><li>1990-1993 </li></ul><ul><li>Desenvolupament dels protocols necessaris per a compartir documents: </li></ul><ul><ul><ul><li>HyperText Transfer Protocol (HTTP) </li></ul></ul></ul><ul><ul><ul><li>HyperText Markup Language (HTML) </li></ul></ul></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  5. 5. La World Wide Web <ul><li>1993-1994 </li></ul><ul><li>Apareixen els primers web sites (llocs), pàgines web i navegadors: </li></ul><ul><ul><ul><li>What’s new </li></ul></ul></ul><ul><ul><ul><li>NCSA Mosaic </li></ul></ul></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  6. 6. El concepte d’enllaç <ul><li>Cada document HTML (o recurs) en un servidor té un identificador: </li></ul><ul><ul><li>http://<servidor>/<cami>/<document> </li></ul></ul><ul><li>El llenguatge HTML permet enllaçar documents creant un graf dirigit ( A -> B ) </li></ul><ul><li>El client (navegador) permet “navegar” d’un document a l’altre </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  7. 7. Estadístiques <ul><li>1993 </li></ul><ul><li>Uns pocs centenars de llocs </li></ul><ul><li>1994 </li></ul><ul><li>10000 llocs </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  8. 8. Estadístiques <ul><li>Avui </li></ul><ul><li>> 200000000 llocs web </li></ul><ul><li>> 20000000000 pàgines web </li></ul><ul><li>> 1800000000 usuaris (26.6%) </li></ul><ul><ul><ul><li>400% creixement (2000-2009) </li></ul></ul></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  9. 9. Accés a la informació <ul><li>Estratègies </li></ul><ul><ul><li>Browsing </li></ul></ul><ul><ul><li>Searching </li></ul></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  10. 10. Browsing <ul><li>La web no té una pàgina inicial </li></ul><ul><li>Organització jeràrquica: </li></ul><ul><ul><li>Per tema </li></ul></ul><ul><ul><li>Per idioma / àrea geogràfica </li></ul></ul><ul><ul><li>http://www.dmoz.org/ </li></ul></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  11. 11. Searching <ul><li>Motors de cerca </li></ul><ul><li>Tres fases: </li></ul><ul><ul><li>Web crawler </li></ul></ul><ul><ul><li>Creació de l’índex </li></ul></ul><ul><ul><li>Gestor de consultes </li></ul></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  12. 12. Web crawlers <ul><li>Sistemes automàtics que visiten sistemàtica i repetidament un lloc, obtenint l’estructura i el contingut del mateix -> web surfers </li></ul><ul><li>Tot site té una pàgina inicial </li></ul><ul><li>Si està enllaçat , s’hi pot accedir ! </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  13. 13. Limitacions <ul><li>Accés protegit per paraula clau </li></ul><ul><li>Ús de CAPTCHAs </li></ul><ul><li>Tipus de recurs / document </li></ul><ul><li>Cerca en profunditat / amplada </li></ul><ul><li>Temps entre visites consecutives </li></ul><ul><li>Protocol d’ exclusió / inclusió </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  14. 14. Protocol d’exclusió <ul><li>Fitxer robots.txt </li></ul><ul><li>Ha de ser públic </li></ul><ul><li>No obliga, només indica </li></ul><ul><li>Revela informació sensible ! </li></ul><ul><li>Google hack : intitle:index.of robots.txt </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  15. 15. Problemes <ul><li>Els cercadors permeten trobar informació sensible </li></ul><ul><li>El contingut i els seus enllaços són coses diferents </li></ul><ul><li>Els usuaris poden enllaçar cap a informació sensible / continguts </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  16. 16. Amagant i trobant informació <ul><li>Ús de paraules clau “secretes”: </li></ul><ul><ul><li>pron,p0rn </li></ul></ul><ul><ul><li>4udio, 4ud10 </li></ul></ul><ul><li>Fitxers 0day </li></ul><ul><li>Enllaços HTML-like a enllaços P2P </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  17. 17. Problemes <ul><li>Enllaços trencats / permanents </li></ul><ul><li>Versions prèvies ( cache ) </li></ul><ul><li>Vulnerabilitats del programari </li></ul><ul><li>Patrons de navegació (cas AOL) </li></ul><ul><li>Model opt-out </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  18. 18. Canvi de paradigma <ul><li>Web 2.0 </li></ul><ul><li>D’un model productor-consumidor a un altre on tots els usuaris “creen” i comparteixen contingut </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  19. 19. Més problemes 2.0 <ul><li>Un usuari A pot afegir un enllaç en el blog de B com a comentari a un post apuntant a un contingut sensible en un servidor de C </li></ul><ul><li>Un usuari A penja (i etiqueta) una foto on apareix un usuari B; un altre usuari C (amic del primer) té accés </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  20. 20. “ Futurs” problemes 3.0 <ul><li>Amb cerques contextualitzades serà possible esbrinar moltes coses dels usuaris: </li></ul><ul><ul><li>On treballa </li></ul></ul><ul><ul><li>Per on es mou </li></ul></ul><ul><ul><li>Què consumeix </li></ul></ul><ul><ul><li>Quin tipus d’amics té </li></ul></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  21. 21. Privacitat dels usuaris <ul><li>Privacitat vs personalització </li></ul><ul><li>Opt-in vs Opt-out </li></ul><ul><li>Egosurfing </li></ul><ul><li>Alguns usuaris canviarien la seva privacitat per una “piruleta”! </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  22. 22. Responsabilitats <ul><li>Qui crea / penja el contingut </li></ul><ul><li>Qui l’enllaça públicament </li></ul><ul><li>Qui re-publica l’enllaç / contingut </li></ul><ul><li>Qui permet trobar-lo </li></ul><ul><li>Qui pot eliminar-lo </li></ul><ul><li>... </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  23. 23. Responsabilitats <ul><li>Usuaris finals </li></ul><ul><li>Proveïdors de serveis </li></ul><ul><li>Cercadors </li></ul><ul><li>Agregadors </li></ul><ul><li>Xarxes socials </li></ul><ul><li>Desenvolupadors </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  24. 24. Debat <ul><li>La responsabilitat és principalment de qui penja el contingut </li></ul><ul><li>Els proveïdors (cercadors) són responsables d’eliminar l’accés si són requerits </li></ul><ul><li>El servei de caché dels cercadors és realment necessari? </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  25. 25. Referències <ul><li>http://en.wikipedia.org/wiki/World_Wide_Web </li></ul><ul><li>http://news.netcraft.com/archives/web_server_survey.html </li></ul><ul><li>http://www.internetworldstats.com/stats.htm </li></ul><ul><li>http://www.worldwidewebsize.com/ </li></ul><ul><li>http://www.googleguide.com/google_works.html </li></ul><ul><li>http://en.wikipedia.org/wiki/Robots_Exclusion_Standard </li></ul><ul><li>http://www.hackersforcharity.org/ghdb/ </li></ul><ul><li>http://w2.eff.org/Privacy/AOL/exhibit_d.pdf </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC
  26. 26. Gràcies! <ul><li>Contacte: </li></ul><ul><li>Julià Minguillón </li></ul><ul><li>[email_address] </li></ul><ul><li>CC-BY-NC-SA </li></ul><ul><li>http://www.slideshare.net/jminguillona </li></ul>J. Minguillón Seminari de Recerca dels Estudis de Dret i Ciència Política, 29 d’Abril de 2010, UOC

×