El documento explica los diferentes componentes de la World Wide Web. Describe la web visible e invisible, y cómo esta última se divide en varias categorías como la web opaca, privada, propietaria y realmente invisible. Explica también cómo buscar información en la web invisible a través de buscadores especializados. Por último, introduce el concepto de web semántica y cómo buscadores como Wolfram Alpha permiten realizar búsquedas más inteligentes a través del uso de operadores y consultas semánticas.
1. “Investigación en
Internet”
TECNOLOGÍA DE LA COMUNICACIÓN I
LICS. EN COMUNICACIÓN SOCIAL Y PERIODISMO
CLASE 3- AÑO 2013
ELABORADO POR PROF. VIVIANA M. PONCE
(VMPONCE@UNSL.EDU.AR)
CREATIVE COMMONS RECONOCIMIENTO-NOCOMERCIAL-COMPARTIRIGUAL 3.0
UNPORTED LICENSE
2. LA WWW y sus componentes
Web Visible y Web Invisible
~17%
~83%
3. LA WWW y sus componentes
Web Visible o Superficial
“porción de la Web que es vista y
consecuentemente indexada por los
buscadores comunes”.buscadores comunes”.
•Se compone de páginas estáticas,
conforma una porción muy pequeña de
toda la Web y requiere en muchos casos de
la evaluación de la información
encontrada..
4. LA WWW y sus componentes
Web Invisible o Profunda
“porción de la Web que no puede ser indexada por los
buscadores comunes”.
Contiene la mejor calidad de información, pero también la más peligrosa,
por lo que en algunos casos suele denominarse “Web Oscura”
5. Se divide en:
-Web Opaca
La Web Invisible o Profunda
-Web Opaca
-Web Privada
-Web Propietaria
-Web Realmente Invisible
6. Web opaca
Se compone de contenidos que no son indexados por
un buscador por cuestiones de economía.
La Web Invisible o Profunda
Solo 2 páginas
de Flickr
7. Web opaca
Solo algunos de sus resultados son devueltos por un
buscador por cuestiones de economía.
La Web Invisible o Profunda
Solo muestra
100 resultados
8. Web opaca
Se compone de contenidos que pueden no aparecer
hasta después de una actualización del rastreo de
los buscadores (frecuencia de indización).
La Web Invisible o Profunda
Último rastreo: 30/07
Próximo rastreo: 30/08
Páginas
creadas del
31/07 al
29/08. No
aparecerán
como parte
de los
resultados!
9. Web opaca
Se compone de contenidos que pueden no aparecer porque
tienen un número bajo de Page Rank que el buscador no
considera a la hora de mostrar los resultados.
Solo se muestran las
páginas con mayor
La Web Invisible o Profunda
páginas con mayor
Page Rank
10. Web opaca
Se compone de páginas web que no son linkeadas
por ninguna otra página, entonces sus direcciones
URL se encuentran “desconectadas”
La Web Invisible o Profunda
Páginas que no
son
referenciadas o
linkeadas o
votadas desde
otras páginas
quedan fuera
del rastreo
12. Web privada
- Las páginas contienen un archivo “robots.txt” que
evita que sean indexadas
La Web Invisible o Profunda
“robots.txt”
13. Web privada
- Las páginas contienen un campo “noindex” que
evita que el buscador indice la parte
correspondiente al cuerpo de la página
La Web Invisible o Profunda
“noindex”
14. Web propietaria
- Incluye páginas en las que es necesario registrarse
para acceder al contenido
La Web Invisible o Profunda
15. Web realmente invisible
- Incluye archivos de la Web en diversos formatos:
.pdf, .js, .ppt, etc.
.PDF
.JS
La Web Invisible o Profunda
Muchos buscadores han evolucionado y nos permiten encontrar gran diversidad
de tipos de archivos…
.JS
.RAR
.ZIP…
16. Web realmente invisible
- Incluye páginas que se generan dinámicamente,
esto es, en tiempo de ejecución (por ej. al realizar
una consulta en una base de datos).
Página dinámica
La Web Invisible o Profunda
Página estática
17. Web realmente invisible
- Incluye páginas que se generan en tiempo real (por
ej. la transmisión en vivo y en directo de un
partido). Página generada en tiempo real
La Web Invisible o Profunda
18. ¿Cómo buscar?
- A través de buscadores
especializados en bases de
La Web Invisible o Profunda
especializados en bases de
datos de tipo motor de
búsqueda y directorio.
42. Buscadores de la Web
Invisible o Profunda
¿Cómo trabajan este tipo de buscadores?
•Poseen una base de datos propia compuesta por otras bases de datos y
que puede ser elaborada por personas o por robots, que efectúan sus
búsquedas en sitios web confiables.
•Los resultados pueden estar desactualizados y son en general•Los resultados pueden estar desactualizados y son en general
confiables, pero no se debe desestimar la posibilidad de evaluarlos.
•Poseen opciones de búsquedas completas de información en las bases
de datos: por título, autor, descripción, contenido, palabras clave, etc.
En muchos casos también permiten las búsquedas por temas o
categorías.
•Permiten la configuración del buscador, en cuanto a las bases de datos
en las que buscan información, la tipología de archivos que indexan y el
lugar y cantidad de resultados que devuelven.
43. LA WWW y sus componentes
Web Semántica
“es una extensión de la Web existente que permite la realización de
búsquedas más inteligentes a través de buscadores inteligentes”.
Se encuentra en desarrollo y requiere de una reestructuración de la Web
para funcionar de manera potente.
44. ¿Qué se pretende con la Web
Semántica?
Mejorar las búsquedas, de forma tal que las máquinas no solo sean
capaces de utilizar la información, sino también interpretarla…
45. •Agregarle semántica a la WWW implica:
-Definir OWL: conceptos u ontologías que puedan ser utilizadas
por usuarios, sistemas y bases de datos.
-Definir RDF: o información descriptiva sobre los conceptos y
ontologías y cómo se encuentran relacionados.
-Definir SPARQL: o lenguaje de consulta sobre las ontologías y su
¿Qué se pretende con la Web
Semántica?
-Definir SPARQL: o lenguaje de consulta sobre las ontologías y su
descripción que permita hacer búsquedas sobre los recursos de la
Web semántica, utilizando distintas fuentes de datos.
Ejemplos
Ontologías: “Pintor”, “Pintura”, “Escuela”, “Lugar”
RDF de Pintura: soporte, técnica, proceso, tema, etc. Relación entre “Pintor” y
“Pintura”: “Un pintor es el autor de una o más pinturas...”
SPARQL: “Pinturas al óleo de Van Gogh”
46. •El buscador no trabaja a nivel sintáctico sino
semántico, esto es, puede “comprender” el
significado de la búsqueda que realiza.
¿Qué se pretende con la Web
Semántica?
significado de la búsqueda que realiza.
“Quiero viajar a Lima, Perú, y sólo quiero gastar
3000 dólares”
Aún se encuentra en desarrollo y se proyectan muchos
años más para que pueda explotarse en su totalidad.
47. •A través de buscadores especializados en la Web
Semántica:
-Wolfram Alfa
¿Cómo buscamos información en
la Web Semántica?
-Wolfram Alfa
-Twine
-Swoogle
Cada buscador tiene sus propios operadores de
búsqueda, por lo que se debe estudiar c/u de ellos en
particular.
48. •Wolfram Alpha (sin uso de operadores)
Devuelve toda la información asociada a un concepto.
¿Cómo buscamos información en
la Web Semántica?
60. •Wolfram Alpha (Favoritos)
¿Cómo buscamos información en
la Web Semántica?
Aún quedan muchas posibilidades por explorar…¡te invitamos a recorrerlas!
61. FIN DE LA PRESENTACIÓN
TECNOLOGÍA DE LA COMUNICACIÓN I
LICS. EN COMUNICACIÓN SOCIAL Y PERIODISMO
CLASE 3- AÑO 2013
ELABORADO POR PROF. VIVIANA M. PONCEELABORADO POR PROF. VIVIANA M. PONCE
(VMPONCE@UNSL.EDU.AR)
CREATIVE COMMONS RECONOCIMIENTO-NOCOMERCIAL-
COMPARTIRIGUAL 3.0 UNPORTED LICENSE