2. Se denomina 'Internet invisible' o
Intranet al conjunto de recursos
accesibles únicamente a través de
algún tipo de pasarela o formulario
Web que por tanto, no pueden ser
indicados de forma estructural por
los robots de los buscadores.
Es toda la información a la cual no
acceden los buscadores comunes.
Generalmente, es información
almacenada y accesible mediante base
de datos. Se llama Internet invisible al
conjunto de recursos Web a los que se
consigue acceder de manera indirecta y
habitualmente con alguna restricción,
cuyo contenido permanece vedado a la
indización de los robots de búsqueda de
los buscadores.
3. TIPOS DE INTERNET
Internet global: Red de información libre y gratuita que es
accesible mediante la interconexión de ordenadores. La
forma de acceso se realiza mediante programas
navegadores, Chats, mensajería o intercambio de
protocolos (FTP, P2P).
Internet invisible: Información que está disponible en Internet pero
que únicamente es accesible a través de páginas generadas
dinámicamente tras realizar una consulta en una base de datos. Es
inaccesible mediante los procesos habituales de recuperación de la
información que realizan buscadores, directorios y agentes de
búsqueda. Pero podemos acceder mediante herramientas de
navegación, correo.
Internet oscuro: Los servidores o host que son totalmente
inaccesibles desde nuestro ordenador. La causa principal
se debe a zonas restringidas con fines de seguridad
nacional y militar, otros motivos son la configuración
incorrecta de routers, servicios de cortafuegos y protección,
servidores inactivos y finalmente " secuestro"
de servidores para utilización ilegal.
4. TIPOS DE INFORMACIÓN
Bases de datos: los
buscadores sólo
proporcionan acceso
a la página de inicio
porque las restantes
son dinámicas.
Documentos en
formato pdf, Word,
etc.: los motores de
búsquedas fueron
creados sólo para
localizar e indizar
páginas html, aunque
actualmente Google
indiza documentos en
formato pdf, doc, xml.
Páginas web que no
son indizadas por los
motores de búsqueda:
porque se excluyen
ellas mismas a través
de un protocolo.
5. CLASIFICACIÒN DE INTERNET INVISIBLE
WEB OPACA: Se compone de
archivos que podrían estar
incluidos en los índices de los
motores de búsqueda
WEB PRIVADA: Consiste en
las páginas Web que podrían
estar indizadas en los motores
de búsqueda pero son
excluidas deliberadamente
WEB PROPIETARIA: Incluye
aquellas páginas en las que es
necesario registrarse para tener
acceso al contenido, ya sea de forma
gratuita o pagada. Se dice que al
menos 95% de la Web profunda
contiene información de acceso
público y gratuito (Turner, 2003).
WEB REALMENTE
INVISIBLE: Se compone de
páginas que no pueden ser
indizadas por limitaciones
técnicas de los buscadores
6. ¿QUÉ SE ENCUENTRA EN LA WEB
PROFUNDA?
Guías y listas de teléfonos, e-
mail, y todo tipo de
directorios, "People finders"
es decir listas de
profesionales de todas la
disciplinas.
Leyes, decretos, en
general información
legal, aunque alguna se
puede encontrar en web
estático.
Patentes, Diccionarios,
aunque muchos glosarios se
encuentran disponibles, y no
nos olvidemos que la
Wikipedia tiene un poco de
todo.
Productos de venta a través
de e-commerce, Archivos
multimedia y gráfico que no
tengan la metadata de
palabras claves que la
identifique en forma clara.
Sitios de empresas,
Publicaciones digitales
de libros y diarios,
Páginas amarillas o
blancas (Yellow/White
pages).
Bibliotecas, Librerías. y
por supuesto todo
aquello ilegal y demás
que no se encuentra
normalmente.