1. MOTOR DE BUSQUEDA
PROFESOR: JUAN CARLOS MUNEVAR
ESTUDIANTE: JOHANA MADRID
2. INTERNET
Empezó en los Estados Unidos de América en 1969, como un
proyecto puramente militar.
Los sitios originales que se pusieron en red eran bases militares,
universidades y compañías con contratos del Departamento de
Defensa.
En 1984 el lado militar fue llamado MILNET. El lado educativo
todavía era llamado técnicamente ARPANET.
Un proyecto que era educativo y gubernamental ahora se ha
convertido en uno de los medios de comunicación más importante
de la actualidad
3. MOTOR DE BUSQUEDA
Los motores de búsqueda son software diseñado para
facilitar las búsqueda de información en los usuarios
por medio de datos enviados a el servidor, es una base
de datos en si, el busca paginas en Internet que
posean la palabra.
Un motor te lleva a la página exacta en la que
aparecen las palabras y frases buscadas
4. ESTRUCTURA DE UN MOTOR
DE BUSQUEDA
Araña: programa diseñado para recorrer la Web siguiendo los enlaces entre
páginas. Esta es la forma habitual empleada por los principales buscadores para
encontrar las páginas que posteriormente forman parte de sus bases de datos.
El origen de la palabra "araña" aplicada a los buscadores, es una traducción de
la palabra inglesa "spider".
En inglés "Web" significa "tela de araña", por lo tanto, a programas que corren
por la Web en busca de nuevas páginas, los anglosajones les llaman "spiders", y
nosotros, por traducción directa: "arañas".
A las arañas también se les llama robots o agentes robot.
5. ESTRUCTURA DE UN MOTOR
DE BUSQUEDA
Índice/catálogo, recibe toda la información obtenida
por la Araña
Software, extrae la información cuando se realiza una
búsqueda - hace un recorrido por todas las páginas
buscando la información solicitada posteriormente
entregándola en orden de relevancia.
6. ESTRUCTURA DE UN MOTOR
DE BUSQUEDA
La mayor parte de las que visitan tu Web, pertenecen a
buscadores. Pero cualquiera puede programar una araña y
enviarla por ejemplo, a buscar todos los emails que encuentre, o
todas las referencias a un producto determinado, etc.
Controlando las 6 principales arañas de los buscadores, tenemos
controladas al 90% de las arañas que nos interesan:
- Google Bot (Google)
- Slurp (Yahoo)
- MSNBot (Microsoft)
- Scooter (Altavista)
- Fast (webs privadas)
- Teoma (Ask Jeeves)
7. COMO FUNCIONA UN MOTOR DE
BUSQUEDA??????
Los buscadores de antes:
Los buscadores anteriores a Google (salvo Altavista), eran
directorios de páginas Web. Esto significa lo siguiente:
- Tú debías dar de alta tu página Web en el directorio del
buscador.
- Debías indicar cuales eran las palabras clave por las que
deseabas ser encontrado.
- Tú redactabas la definición de tu página Web.
Y cuando alguien buscaba una palabra que estaba incluida en tus
palabras clave o en tu definición, el buscador consultaba su lista
de páginas Web y mostraba tu página.
8. COMO FUNCIONA UN MOTOR
DE BUSQUEDA??????
Cómo funcionan ahora los buscadores
Ahora son índices automáticos de páginas Web:
1.- Una araña visita tu página Web.
2.- La araña lee el contenido de tu página Web.
3.- La araña lleva toda la información a una central, donde un
sistema la procesa y la almacena.
4.- El sistema crea un índice con las palabras que utilizas en tu Web
y las ordena por relevancia.
9. COMO FUNCIONA UN MOTOR
DE BUSQUEDA??????
5.- El sistema intenta descubrir si eres una buena página o no (en
realidad comprueba cuanta gente recomienda tu Web y cuan
importante es la gente que recomienda tu Web).
6.- Cuando alguien realiza una búsqueda, y el sistema muestra todas
las Web que contienen la palabra o frase buscada.
Y muestra los resultados en función de un algoritmo de ordenación
que tiene en cuenta la importancia de la página Web y la
importancia del término buscado, en esa página Web.
10. COMO FUNCIONA UN MOTOR
DE BUSQUEDA??????
Un buscador Web tiene tres subsistemas:
Un Recolector que visita una serie de páginas Web,
incorporándolas a una Colección
Un Indexador que convierte la colección en una estructura más
manejable y pequeña, llamada Índice
Un Buscador propiamente tal que recupera ciertas páginas del
índice basado en un requerimiento del usuario
11. COMO FUNCIONA UN MOTOR
DE BUSQUEDA??????
El recolector
Tiene la tarea de crear la colección de páginas, para ello, visita una serie
de páginas iniciales o puntos de partida, las incorpora a la colección,
extrae los enlaces de estas páginas, verifica si están o no presentas ya,
y si no están, visita estas páginas referenciadas.
El proceso es recursivo, y se realiza en un ciclo:
1.Revisar la lista de URL por visitar y escoger una
2.Visitar esa dirección
3.Transformarla para incorporarla a la colección (normalmente, eliminar
etiquetas e imágenes de la página, convertir documentos Word o PDF a
texto simple, recortarla si es demasiado grande) 4.Extraer los links de
la página, y si alguno no está en la lista, agregarlo
5.Volver al primer paso
12. COMO FUNCIONA UN MOTOR
DE BUSQUEDA??????
Indexador
Crea un índice con todas las palabras que aparecen en
el sitio Web, y con los nombres de las páginas en las
que aparecen; así, dada una palabra podremos ir
rápidamente a las páginas en las que aparece. El único
problema es construir y mantener actualizado el
índice.
13. COMO FUNCIONA UN MOTOR
DE BUSQUEDA??????
Buscador
Si alguien necesita los documentos donde aparezca "casa", el
sistema busca en la lista (índice) la palabra "casa", y obtiene de
inmediato cuales son los documentos que contienen la palabra. Si
se pregunta por dos o más términos, el sistema deberá comparar
las listas de cada uno de los términos, realizando una unión o
intersección según corresponda.
La Web es enorme, y hay montones de páginas en ella, pero una
persona no puede hacer nada útil si el buscador le entrega 10000
páginas para que las revise, así que el proceso de ranking
(ordenamiento) es crucial para tener, digamos, 10 o 20
direcciones, cantidad que es mucho más razonable.
14. COMO FUNCIONA UN MOTOR
DE BUSQUEDA??????
URL
Localizador Uniforme de Recursos (URL; Uniform Resource
Locator )es una dirección especial usada por los navegadores
Web, para tener acceso a información en Internet.
El URLs especifica el ordenador en que se hospeda, el directorio,
y el nombre del fichero. A través de estas direcciones o URLs
vamos a poder conectar los diferentes objetos (no solo texto),
aunque se acceda a ellos a través de diferentes protocolos.
Una cualidad de los URLs es que permiten utilizar los datos ya
existentes en la Internet (Wais, Gofher, ftp) y así es como
consigue la Web envolver a la Internet sencilla y eficazmente
15. Bibliografía
http://library.albany.edu/internet/ TUTORIAL UNIVERSIDAD
DE ALBANIA
MOTORES DE BUSQUEDA
http://www.dsp.umh.es/docent/ifarmacia/motores.htm
RECURSOS DE ODONTOLOGIA EN INTERNET
http://www.tlahui.com/meodont2.html#odontore
MOTORES DE BUSQUEDA. COMO BUSCAR?
http://www.monografias.com/trabajos/buscadores/buscadores.s
html