Web Visible Invisible
Upcoming SlideShare
Loading in...5
×

Like this? Share it with your network

Share
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
1,415
On Slideshare
1,403
From Embeds
12
Number of Embeds
4

Actions

Shares
Downloads
7
Comments
0
Likes
0

Embeds 12

http://www.slideshare.net 5
http://migue-cursoweb20parte2.blogspot.com 3
http://lawebinvisibleparte1.wikispaces.com 3
http://www.slideee.com 1

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. La Web Visible Vs Invisible Miguelina Ojeda
  • 2. Internet Visible o web superficial
    • Es aquella parte de la red cuyo contenido puede ser indizado, y por tanto recuperado, por los motores de búsqueda.
  • 3. Características
    • La información no está contenida en bases de datos
    • Es de libre acceso
    • No requiere la realización de un proceso de registro para acceder
  • 4. Internet invisible o profunda
    • Corresponde a toda esa información presente en Internet pero que no puede ser indizada ni recuperada por los motores de búsqueda tradicionales.
  • 5. Internet invisible o profunda
    • Contienen:
    • Catálogos, revistas digitales, blogs, entradas a diccionarios, contenido de sitios que demandan un login, (aunque sea gratuito), entre otros tipos de contenido que no aparecen entre los resultados de una búsqueda convencional.
    • Es 400 a 550 veces más grande que el World Wide Web
  • 6. Clasificación de los contenidos de la web “invisible”
    • Bases de datos bibliográficas: incluidos los catálogos de bibliotecas, las bases de datos de referencias bibliográficas, gratuitas o de pago, etc.
    • Bases de datos alfanuméricas y a texto completo. También se incluyen en esta categoría las obras de referencia, tipo enciclopedia o diccionarios.
    • Revistas electrónicas y archivos de documentos: tanto las de acceso gratuito, que normalmente exigen registro previo, como las de pago (acceso a través de IP o palabra clave), son invisibles a los motores de búsqueda.
    • Documentos en formatos no indizables, esto es, ficheros no HTML o textuales desarrollados con formatos más elaborados (pdf; ppt; doc; etc)
  • 7. La web privada
    • Son páginas web que podrían estar indizadas en los motores de búsqueda pero son excluidas por alguna de estas causas:
    • Las páginas están protegidas por contraseñas ( passwords ).
    • Contienen un archivo “robots.txt” para evitar ser indizadas.
    • Contienen un campo “noindex” para evitar que el buscador indice la parte correspondiente al cuerpo de la página.
  • 8. La Web propietaria
    • En estas páginas es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o pagada.
    • Se dice que al menos 95% de la Web profunda contiene información de acceso público y gratuito.
  • 9. La Web realmente invisible:
    • Se compone de páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, como las siguientes:
    • Páginas web que incluyen formatos como PDF, PostScript, Flash, Shockwave, programas ejecutables y archivos comprimidos.
    • Páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario.
    • Información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica. Otra dificultad consiste en la variable estructura y diseño de las bases de datos, así como en los diferentes procedimientos de búsqueda.