internet invisible

7,789 views
7,499 views

Published on

que es. caracteristicas, clasificacion

Published in: Business
1 Comment
2 Likes
Statistics
Notes
No Downloads
Views
Total views
7,789
On SlideShare
0
From Embeds
0
Number of Embeds
74
Actions
Shares
0
Downloads
124
Comments
1
Likes
2
Embeds 0
No embeds

No notes for slide

internet invisible

  1. 1. INTERNET INVISIBLE
  2. 2. DEFINICIÒN <ul><li>Se denomina 'Internet invisible' o Infranet al conjunto de recursos accesibles únicamente a través de algún tipo de pasarela o formulario Web que por tanto, no pueden ser indicados de forma estructural por los robots de los buscadores. </li></ul><ul><li>Es toda la información a la cual no acceden los buscadores comunes. Generalmente, es información almacenada y accesible mediante base de datos. </li></ul><ul><li>Se llama Internet invisible al conjunto de recursos Web a los que se consigue acceder de manera indirecta y habitualmente con alguna restricción, cuyo contenido permanece vedado a la indización de los robots de búsqueda de los buscadores. </li></ul><ul><li>En 1994 la doctora Jill Ellsworth utilizó el término de &quot;Invisible Web&quot; ( Internet Invisible ), para referirse a la información que los motores de búsqueda tradicionales no pueden encontrar. </li></ul><ul><li>Otra forma de denominar a esta información es &quot; depp web” (Internet profunda ) , ya que en realidad no es invisible, sólo hay que saber llegar a ella a través de navegadores convencionales o con plugin. Por ello, el término más correcto para denominar a la web invisible sería &quot; no indizable &quot; . </li></ul>
  3. 3. Tipos de Internet <ul><li>Internet global: Red de información libre y gratuita que es accesible mediante la interconexión de ordenadores. La forma de acceso se realiza mediante programas navegadores, Chats, mensajería o intercambio de protocolos (FTP, P2P). </li></ul><ul><li>Internet invisible: Información que está disponible en Internet pero que únicamente es accesible a través de páginas generadas dinámicamente tras realizar una consulta en una base de datos. Es inaccesible mediante los procesos habituales de recuperación de la información que realizan buscadores, directorios y agentes de búsqueda. Pero podemos acceder mediante herramientas de navegación, correo. </li></ul><ul><li>Internet oscuro: Los servidores o host que son totalmente inaccesibles desde nuestro ordenador. La causa principal se debe a zonas restringidas con fines de seguridad nacional y militar, otros motivos son la configuración incorrecta de routers, servicios de cortafuegos y protección, servidores inactivos y finalmente &quot;secuestro&quot; de servidores para utilización ilegal. </li></ul>
  4. 4. TIPOS DE INFORMACIÒN <ul><li>Bases de datos: los buscadores sólo proporcionan acceso a la página de inicio porque las restantes son dinámicas. </li></ul><ul><li>Documentos en formato pdf, word...: los motores de búsquedas fueron creados sólo para localizar e indizar páginas html, aunque actualmente Google indiza documentos en formato pdf, doc, xml. </li></ul><ul><li>Páginas web que no son indizadas por los motores de búsqueda: porque se excluyen ellas mismas a través de un protocolo de exclusión. </li></ul><ul><li>Sitios web que necesitan contraseña: los motores de búsqueda no pueden acceder al contenido de estas páginas. </li></ul>
  5. 5. TAMAÑO ESTIMADO <ul><li>Por cada millón de páginas visibles hay otros 500 0 550 millones ocultas. </li></ul><ul><li>El 90% es información pública y gratuita. </li></ul><ul><li>La información es de 400 a 550 veces mayor que la web visible. </li></ul><ul><li>Calidad </li></ul><ul><li>1000-2000 veces superior a la web visible. </li></ul>
  6. 6. Sitios de Dudosa Calidad
  7. 7. Sitios de buena Calidad
  8. 8. CLASIFICACIÒN DE INTERNET INVISIBLE <ul><li>Sherman y Price (2001) identifican cuatro tipos de contenidos invisibles en la Web: la Web opaca (the opaque Web), la Web privada (the private Web), la Web propietaria (the proprietary Web) y la Web realmente invisible (the truly invisibleWeb). </li></ul>
  9. 9. WEB OPACA <ul><li>Se compone de archivos que podrían estar incluidos en los índices de los motores de búsqueda, pero no lo están por alguna de estas razones: </li></ul><ul><li>Extensión de la indización: por economía, no todas las páginas de un sitio son indizadas en los buscadores. </li></ul><ul><li>Frecuencia de la indización: los motores de búsqueda no tienen la capacidad de indizar todas las páginas existentes; diariamente se añaden, modifican o desaparecen muchas y la indización no se realiza al mismo ritmo. </li></ul><ul><li>Número máximo de resultados visibles: aunque los motores de búsqueda arrojan a veces un gran número de resultados de búsqueda, generalmente limitan el número de documentos que se muestran (entre 200 y 1000 documentos). </li></ul><ul><li>URL’s desconectados: las generaciones más recientes de buscadores, como Google, presentan los documentos por relevancia basada en el número de veces que aparecen referenciados o ligados en otros. Si un documento no tiene una liga en otro documento será imposible que la página sea descubierta, pues no habrá sido indizada. </li></ul>
  10. 10. WEB PRIVADA <ul><li>Consiste en las páginas Web que podrían estar indizadas en los motores de búsqueda pero son excluidas deliberadamente por alguna de estas causas: </li></ul><ul><li>Las páginas están protegidas por contraseñas (passwords). </li></ul><ul><li>Contienen un archivo “robots.txt” para evitar ser indizadas. </li></ul><ul><li>Contienen un campo “noindex” para evitar que el buscador índice la parte correspondiente al cuerpo de la página. </li></ul>
  11. 11. WEB PROPIETARIA <ul><li>Incluye aquellas páginas en las que es necesario registrarse para tener acceso al contenido, ya sea de forma gratuita o pagada. Se dice que al menos 95% de la Web profunda contiene información de acceso público y gratuito (Turner, 2003) </li></ul>
  12. 12. WEB REALMENTE INVISIBLE <ul><li>Se compone de páginas que no pueden ser indizadas por limitaciones técnicas de los buscadores, como las siguientes: </li></ul><ul><li>Páginas Web que incluyen formatos como PDF, PostScript, Flash, Shockwave, programas ejecutables y archivos comprimidos. </li></ul><ul><li>Páginas generadas dinámicamente, es decir, que se generan a partir de datos que introduce el usuario. </li></ul><ul><li>Información almacenada en bases de datos relacionales, que no puede ser extraída a menos que se realice una petición específica. Otra dificultad consiste en la variable estructura y diseño de las bases de datos, así como en los diferentes procedimientos de búsqueda. </li></ul>
  13. 13. CLASIFICACIÒN DE LA WEB INVISIBLE <ul><li>Web invisible contiene un gran número de fuentes de información que no pueden buscarse porque su contenido no ha sido indizado ni puede serlo por los principales buscadores. </li></ul><ul><li>Aun cuando recuperemos un sitio que contenga una base de datos, es improbable que el buscador conduzca a la base de datos misma, puesto que requiere que se navegue por el sitio Web para encontrarla. </li></ul><ul><li>Así pues, la Web invisible está constituida por toda esa información accesible vía Web, pero a la que no es posible llegar mediante una consulta a los buscadores tradicionales . </li></ul>
  14. 14. <ul><li>Bases de datos bibliográficas : incluidos los catálogos de bibliotecas, las bases de datos de referencias bibliográficas, gratuitas o de pago, etc. </li></ul><ul><li>Bases de datos alfanuméricas y a texto completo : que incluyen en esta categoría las obras de referencia, tipo enciclopedia o diccionarios. </li></ul><ul><li>Revistas electrónicas y archivos de documentos : tanto las de acceso gratuito, que normalmente exigen registro previo, como los repositorios institucionales; como las de pago (acceso a través de IP o clave personal), que son invisibles a los motores de búsqueda tradicionales. </li></ul><ul><li>Documentos en formatos no indizables , esto es, ficheros no HTML o textuales desarrollados con formatos más elaborados (pdf; ppt; doc; etc). </li></ul>
  15. 15. EJEMPLOS <ul><li>Bibliotecas Digitales </li></ul><ul><li>Base de Datos de Bibliotecas </li></ul><ul><li>Catálogos de Editoriales </li></ul><ul><li>Directorio de publicaciones Periódicas </li></ul><ul><li>Directorio de base de Datos </li></ul><ul><li>Guías o recopilaciones de sitios. </li></ul>
  16. 16. SITIOS DE INTERNET INVISIBLE
  17. 18. Motores de Búsqueda <ul><li>Buscadores: Especializados- Regionales-Generales. </li></ul><ul><li>Ejemplo: </li></ul><ul><li>Google </li></ul><ul><li>Youtube </li></ul><ul><li>Altavista </li></ul><ul><li>Web crawler </li></ul>
  18. 19. METABUSCADORES <ul><li>Un metabuscador es una clase de buscador que carece de base de datos propia y, en su lugar, usa las de otros buscadores y muestra una combinación de las mejores páginas que ha devuelto cada buscador. </li></ul><ul><li>EJEMPLO: </li></ul><ul><li>IXQUICK </li></ul><ul><li>MAMMA </li></ul><ul><li>VIVISIMO </li></ul><ul><li>GLUSTY </li></ul>
  19. 20. DIRECTORIO <ul><li>Es una agrupación de archivos de datos, atendiendo a su contenido, a su propósito o a cualquier criterio que decida el usuario. </li></ul><ul><li>Técnicamente el directorio almacena información acerca de los archivos que contiene: como los atributos de los archivos o dónde se encuentran físicamente en el dispositivo de almacenamiento. </li></ul><ul><li>EJEMPLO: </li></ul><ul><li>EXIT </li></ul><ul><li>YAHOO </li></ul>
  20. 21. CONCLUSIONES <ul><li>Calidad y cantidad </li></ul><ul><li>Ahorro de tiempo </li></ul><ul><li>Ahorro de dinero </li></ul>

×