SlideShare a Scribd company logo
1 of 44
Download to read offline
Facultad de Comunicación y
Documentación

PROYECTO FIN DE CARRERA
(P.F.C.)

Batalla entre los majors:
análisis de la lucha por
la primacía en la Web
Alumno aspirante al grado de Licenciado en Documentación:
Pedro Miguel Álvarez Guillermo
ESQUEMA DE MI DEFENSA
1.

Introducción

2.

Justificación de la investigación

3.

Objetivos

4.

Metodología

5.

Desarrollo
5.1 Servicios de valor añadido
5.2 Características de búsqueda y rastreo
5.3 Comparativa de servicios de valor añadido
5.4 Comparativa de características de búsqueda

6.

Conclusiones

7.

Referencias.
2
1. INTRODUCCIÓN (I)
 Situación histórica: época de los gigantes mediáticos.
 Necesidad e interés cada vez más despierto por recuperar la
información con eficacia en la Red de Redes, además de la
necesidad de informarse, el posicionamiento dentro de los
buscadores y el ver quién ofrece los mejores productos y servicios.
•

Tras la crisis de los portales y empresas puntocom allá por el año
2000 y 2001, cuando se produjo el estallido de la llamada
burbuja tecnológica  pero los más grandes sobrevivieron
mediante estrategias de marketing, contenidos y de inversión.
Estrategia de Yahoo! actualmente está siendo agresiva y cuenta
con la experiencia de un portal clásico y con solera.
Microsoft (y por ende, MSN) se basa en su monopolio en el
mercado del software, debido a su veteranía (existe desde 1975).
3
1. INTRODUCCIÓN (II)
Pero la excepción que confirma la regla es Google (es
inevitable mencionarlo), que se empezó a popularizar entre la
comunidad internauta a partir del año 2000. Y desde
entonces no ha habido tregua por hacerse un hueco en la
lucha de los buscadores y de los servicios/productos de valor
añadido; cada vez ha sido una lidia o pugna más intensa.
 Yahoo! y MSN, están respaldados por su experiencia en
productos o servicios, por su inversión más o menos racional,
marketing y prestigio.
 Yahoo!, al abarcar menos terreno que MSN, está más en
condiciones éste último de "apretar", pero también de
competir fuertemente contra Google.
4
1. INTRODUCCIÓN (III)
 Google: líder de audiencia gracias a la popularidad de su
motor de búsqueda (su filosofía radica en tener voluntad para
innovar y organizar la información mundial, aunque tienen 10
principios muy claros existentes en su web). Luego está claro
que son proyectos distintos, con visiones de negocio muy
diferentes.
 Google se está ahora portalizando. Desde un principio
conocemos la filosofía de esta empresa y sabemos que sus
principios es la apuesta constante por la calidad de sus
servicios y productos. Y al no ser búsquedas en bases de
datos factuales sino deterministas, la búsqueda a texto
completo es más compleja.
5
1. INTRODUCCIÓN (IV)
 Pero tampoco MSN ha estado de brazos cruzados ya que a
Microsoft, tras su fracaso allá por el año ’94 con la red Microsoft
Network, no está dispuesta a perder el trono en el ámbito
cibernético, por la cuenta que le trae, ya que no se puede descuidar
ni un momento y por eso no está conforme con la hegemonía de su
navegador (que fue gracias al monopolio de Windows y la
integración del navegador en dicho sistema operativo); eso pilló de
sorpresa a Microsoft, pero que fue un éxito del que supo sacar jugo,
si bien el tema de los navegadores ya es otra historia de lidia
distinta.
 El caso es que Microsoft se ha desecho de los algoritmos de su
antiguo motor Inktomi y Overture para poner en marcha su propia
tecnología valiéndose del perfeccionamiento de su robot-trasteador
de la web, MSNBot, por haber adquirido recientemente la empresa
Lookout.
6
2. JUSTIFICACIÓN DE LA INVESTIGACIÓN (I)
 De entre los temas propuestos, elegí éste por ser en el que más
experiencia tengo y más me atrae de acuerdo a mi trayectoria
académica y formativa autodidacta.
 He considerado interesante -creo que era el momento idóneo e
ideal- elaborar una instantánea sobre cómo está la situación a
fecha de julio de 2005 en cuanto a lidia entre los buscadores más
importantes: Google, Yahoo! y MSN; todo ello intentando tener el
mayor rigor posible y algo de crítica.
 En este sentido, he procurado esmerarme tanto en la
documentación como en la fiabilidad de lo que leía (si se lee el
documento original se podrá percibir algo). También en el anexo,
con elementos de valor añadido que explico en la metodología y en
el cuerpo del trabajo, teniendo en cuenta anécdotas de
declaraciones de directivos de estos gigantes y proyectos
abandonados por Google por abarcar tanto y alternativas de
métodos de búsqueda o parámetros interesantes, que es algo con
lo que disfruto al descubrirlo. 7
2. JUSTIFICACIÓN DE LA INVESTIGACIÓN (II)
 No es fácil en esta fecha encontrar una recopilación como la que he
pretendido en este trabajo.
 Seguramente hay trabajos similares aunque yo los desconozca y habría
que ver su metodología si ha sido la misma y si son igual de exhaustivos
como aquí se pretendía, con tal de acaparar más
 De ahí, el tiempo que ha llevado, requiriendo una puesta al día continuada
durante cuatro meses. Pero también he procurado sintetizar descripciones
de servicios por motivos de espacio cuando lo requería.
 Al menos, éste ha sido mi criterio que expongo, ni mejor ni peor que
cualquier otro, sino más a mi manera, y concertado con mi director,
pretendiendo
hacer
un
tratamiento
integral
pero
también
pormenorizadamente cuando era estrictamente necesario, para no
arriesgarse a imprecisiones.
 Creo que ha merecido la pena el esfuerzo, lástima que sea algo efímero
por la obsolescencia y caduque tan pronto algunos enlaces, por su corta
longevidad, y no sabemos en el futuro cómo se llamarán o si existirán
estos servicios visto con el mismo concepto.
8
3. OBJETIVOS
A.

Dar cuenta de los proyectos que están floreciendo en torno a la propia
función de búsqueda, debido al estado de apogeo del sector de las
búsquedas en materia de características de búsqueda por la inserción de
nuevas tecnologías, y todo ello para intentar que se tenga una visión
pormenorizada pero a la vez sintética e integradora de lo que se está
haciendo en ese sentido.

B.

Analizar los principales servicios que ofrecen estas empresas para competir
en dicho sector y de paso, en el de los portales de Internet, que es lo que
se está ahora desarrollando más y a lo que se tiende de nuevo ahora que
no caen del todo en el generalismo de un portal horizontal.

C.

Veremos finalmente cómo los buscadores intentan con sus características
de búsqueda facilitarnos en gran medida nuestras consultas informativas
para tratar de mitigar el problema de la recuperación mediante texto libre
(que algún día se convertirá en recuperación lenguaje natural, cuando la
"web semántica" funcione y las páginas estén preparadas para ello (los
navegadores ya lo están con el código estándar XML).
9
4. METODOLOGÍA


1ª fase del trabajo: se hizo la descripción de los servicios de valor añadido
(SVA) de cada empresa o buscador -aunque no demasiada pormenorizada-.



2ª fase del trabajo: se analizaron las características fundamentales de
búsqueda (capacidades y herramientas de búsqueda) y a modo de valor
añadido coloqué información tanto personal como extraida de la ayuda de
los motores de búsqueda sobre el rastreo y los criterios de posicionamiento
que lleva a cabo el buscador en cuestión. En una tercera y última fase
integradora, más completa pero sintética, se construyó la tabla comparativa
de evaluación de los aspectos tratados en cada una de las dos fases
anteriores.

− Anexo: para dotar de algo de "frescura" al trabajo, he considerado
conveniente indicar algunas curiosidades y agregar una selección de
noticias de la prensa de Internet sobre todo, respecto a lo que se avecina a
día de hoy en este ámbito tan competitivo.
Nota: la sintaxis del lenguaje de búsqueda a la hora de establecer los
parámetros aparece en el documento original de la Tesis.
10
5. DESARROLLO.

5.1. SERVICIOS DE VALOR AÑADIDO

• GOOGLE XHTML (WAP 2.0)

• GOOGLE DESKBAR

• GOOGLE LOCAL

• GOOGLE NEWS

• ORKUT
• GOOGLE EARTH
• GOOGLE PERSONALIZED SEARCH
• GOOGLE HOME PERSONALIZED
• GOOGLE VIDEO VIEWER
• GOOGLE VIDEO SEARCH
• GOOGLE DESKTOP SEARCH
• GOOGLE GROUPS (v. 2)
• GOOGLE ACCOUNTS
• GOOGLE SUGGEST (beta)

• PICASA
• GOOGLE SITEMAPS
• BLOGGER
• GMAIL
• GOOGLE SEARCH APPLIANCE (+ mini)
• GOOGLE BROWSER BUTTONS
• GOOGLE ACCOUNTS
• BÚSQUEDAS TEMÁTICAS ESPECIALES
• GOOGLE PRINT

• GOOGLE ALERTS (beta)
11
5. DESARROLLO.

5.1. SERVICIOS DE VALOR AÑADIDO
OTROS SVA (DESCRITOS SOMERAMENTE):

• GOOGLE TOOLBAR

• Site-Flavored Google Search (beta)

• FROOGLE (y sus variantes)

• Versión WAP de Google

• GOOGLE COMPUTE

• Google-Friends Newsletter

• GOOGLE WEB APIs

• Google Store

• GOOGLE CATALOGUE SEARCH

• Google Web Accelerator

• GOOGLE ANSWERS

• Google Sets

• GOOGLE DOWNLOADS

• Google Scholar
- Más en la web del Laboratorio de Google -

12
5. DESARROLLO.

5.1. SERVICIOS DE VALOR AÑADIDO

• YAHOO! NEWS
• YAHOO! 360º (beta, integrado)
• FLICKR
• YAHOO! MAIL

• MY YAHOO! SEARCH
• YAHOO! LOCAL
• YAHOO! MOBILE
• YAHOO! MESSENGER

• MY YAHOO!

• ASK YAHOO!

• YAHOO! DEVELOPER

OTROS SVA (DESCRITOS SOMERAMENTE):

• MYWEB
• MY WEB 2.0 (no es de lo mismo)
• YAHOO! MAPS
• SHOPPING YAHOO!
• YAHOO! SMALL BUSINESS
• YAHOO! TOOLBAR 6.0
• YAHOO! DESKTOP SEARCH

• YAHOO! MÚSICA
• YAHOO! MUSIC ENGINE
• YAHOO! CINE
• YAHOO! SEARCH SUBSCRIPTIONS
• YAHOO! BUZZ GAME
• YAHOO! FARECHASE

13
5. DESARROLLO.

5.1. SERVICIOS DE VALOR AÑADIDO
OTROS SVA SECUNDARIOS (continuación):
• YAHOO! MÚSICA
• YAHOO! MUSIC ENGINE
• YAHOO! CINE
• YAHOO! SEARCH SUBSCRIPTIONS

- Más en la web del Laboratorio de Yahoo! -

• YAHOO! BUZZ GAME
• YAHOO! FARECHASE
• YAHOO! MINDSET (beta)
• MY YAHOO! TICKER (beta)
• YAHOO! ANTI-SPAM RESOURCE CENTERDOMAINKEYS
• SERVICIO ‘FOTOCORREO’
• YAHOO! MESSAGE BOARDS
14
5. DESARROLLO.

5.1. SERVICIOS DE VALOR AÑADIDO

- Más en la web del Laboratorio de MSN -

• MSN HOTMAIL
• MY MSN
• MSN MAPAS Y DIRECCIONES
(comienzo de gestación del proyecto MSN VIRTUAL EARTH, hoy BING MAPS).
• START.COM
• MSN GRUPOS
• MSN NEWSBOT
• MSN SPACES
• MSR NETSCAN - USENET SOCIAL ACCOUNTING SEARCH ENGINE
• MSN Toolbar
• MSN Mobile
• MSN Messenger
15
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO
INTRODUCCIÓN

 ¿Qué considero “características de búsqueda?
 Resultados de búsquedas numerados con plugin para el navegador
Mozilla Firefox en el caso de Google.
 Código de hipervínculo con los enlaces patrocinados.
 Servidores con versiones del portal no sincronizadas tanto en
Herramientas de idioma como con el filtro Google Safe.
 Búsqueda Avanzada.
 Cada buscador tiene sus recomendaciones en su ayuda para
fomentar el posicionamiento en la indexación de cara al rastreo.

16
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO
CARACTERÍSTICAS DE BÚSQUEDA

•
•
•
•
•
•
•
•
•
•
•
•
•
•

Búsqueda de sinónimos
Búsquedas de libros
Información meteorológica
Q&A
Información bursátil (stock quotes)
Results Prefetching
Mapas de calles
Titulares de noticias
Conversor de divisas
Calculadora
Traducción de páginas web
Búsqueda de archivos en diferentes
formatos
Vínculos en caché
Páginas similares

•
•
•

•
•
•

17

•
•
•
•
•
•
•

Trackback (o vínculos recibidos)
Restricción de dominio
Voy a tener suerte (búsqueda "con
confianza" o de lanzamiento
automático)
Exclusión de palabras
Búsqueda de frases literales
Consultas automáticas que incluyen
"and"
Términos de búsqueda en contexto
Definiciones (Google Glossary)
Corrector ortográfico
Búsquedas múltiples
Búsqueda por rangos numéricos
Uso de comodines
Directorio: búsqueda por categorías
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

•

inurl:
link:
location: (sólo funciona en Google News)
msgid: (sólo funciona en Google Groups)
movie:
phonebook:
related:
rphonebook:
site:
source: (sólo funciona en Google News)
stocks:
store: (sólo funciona en Froogle)

Operadores especiales:

allinanchor:
allintext:
allintitle:
allinurl:
author: (sólo funciona en Google Groups)
bphonebook:
cache:
datarange:
define:
filetype: (= ext)
group: (sólo funciona en Google Groups.

Nota:
Google no distingue mayúsculas
de minúsculas, ni las tildes, ni
realiza búsquedas con
operadores de truncamiento
(parciales).

funciona también como groups)

inanchor:
info:
id:
insubject: (sólo funciona en Google Groups)
intext:
intitle:

18
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO
RASTREO

GoogleBot
• Es el robot principal que utiliza Google para 'rastrear' los sitios
de Internet. No solamente indexa páginas web (HTML), sino
que también extrae información de ficheros PDF, PS, XLS,
DOC y algunos otros más.
• Su capacidad de rastreo influye mucho. Basado en servidores
Linux y con una arquitectura tecnológica de Intel y altas
cantidades de memoria RAM, además de hacer uso de caché
en la mayor parte del índice para evitar escrituras innecesarias
en discos duros, es capaz de admitir tantas búsquedas
simultáneas a nivel mundial.
19
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

GoogleBot
•

Sus algoritmos están implementados por multitud de criterios o factores
(Google tiene unos 100 y es un secreto que mantienen bastante bien
guardado pues no les interesa dar pistas a los spammers).

•

De cualquier manera, podemos intuir que pueden ser factores o
indicadores de relevancia: la frecuencia de actualización, webs que no
contengan residuos para tratar de engañar a un buscador, el peso de la
página, los metadatos o metaetiquetas (cuantos más se tengan, mejor
indexada estará la página en su directorio u otro en teoría, al estar más
completa la descripción y detallada, sobre todo si ellos la dan por válida) y
el PageRank que se mide por el número de enlaces que se reciben de
otras páginas, o lo que es lo mismo, la que apuntan a una determinada
web, para que suba más alto en la escala de cara al posicionamiento.
20
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO
CARACTERÍSTICAS DE BÚSQUEDA

•
•
•
•
•
•

•

Feeds para las noticias, pero sin el icono como en MSN.
Búsqueda contextual o relacionada (Y!Q Search Beta), de lo que no dispone
aún Google ni MSN.
Directorio Yahoo!: un clásico renovado, con dos modalidades: una gratuita que
no garantiza la inclusión, y otra que sí lo hace a cambio de 299 dólares).
Página de resultados de búsqueda
Incluir palabras/Excluir palabras
Cualquiera/OR:
Si una persona está interesada por igual en dos o más alternativas, debe usar
el operador booleano OR. Por ejemplo, podemos querer buscar "rock
alternativo OR progresivo".
Orden de las palabras
Para buscar una frase exacta, sólo hay que poner entre comillas dos o más
palabras. Por ejemplo, "No por mucho madrugar" (escribiendo las comillas en el
cajetín de búsqueda).
21
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

•

Búsquedas relacionadas
A veces también se reciben sugerencias. Si otros usuarios de Yahoo! han buscado
algo parecido, los enlaces a estas búsquedas relacionadas aparecerán bajo el
cajetín en la parte superior de la página de resultados.

•

Atajos Yahoo!
Los atajos de Yahoo! ayudan a encontrar lo que se busca instantáneamente. Cuando
se usan, la información buscada aparece de inmediato en la página de resultados.
Para el conversor de divisas, la palabra clave es cambio de divisas.
Para móviles, la palabra clave es melodías (seguida del nombre de un artista).
Para noticias, la palabra es noticias (seguida de un tema).
Para noticias deportivas, debes introducir el 'nombre de un equipo de fútbol'.

•

Categorías relacionadas/Categorías del Directorio
Las Categorías son conjuntos de sitios que nuestros editores han revisado y
organizado por temas en el Directorio Yahoo! Te pueden ser útiles a la hora de
definir una búsqueda o de encontrar algo en lo que no se había pensado
previamente.
22
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

•

Todo Internet
Estos resultados son una combinación de páginas y sitios webs relevantes
provistos por Yahoo!, no controlan su contenido lógicamente.

•

Preferencias de Búsqueda: Nueva Ventana, Filtro de Búsqueda Segura e
Idioma.
· Estricto

•

Yahoo! Búsqueda Segura

· Moderado (predeteminado)
· Desactivado

•

Búsqueda avanzada:
La Búsqueda Avanzada nos ayuda a encontrar sitios que responden a
criterios muy específicos. Las opciones que elijas se aplicarán sólo a la
búsqueda que realices en ese momento.
23
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

•

Fecha

•

Dominio

•

País

•

Idioma

•

Número de resultados

•

Buscar por URL

•

Podemos restringir la búsqueda según
el tipo de documento que necesitas.

Buscar por Formato

Los formatos que que aceptan este
filtro son:
• .htm, .html - HTML estándar
•. pdf - Adobe PDF
•. xls - Microsoft Excel
•. ppt - Microsoft PowerPoint
• .doc - Microsoft Word
• .xml, .rdf, .rss - Feeds de RSS o XML
• .txt - Formato de texto
24
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

•

Búsqueda de Imágenes
La Búsqueda de Imágenes de Yahoo! funciona con un motor de búsqueda
externo que nos permite buscar entre millones de imágenes en la Web.

Búsqueda Avanzada de Imágenes:
•
•
•
•
•

Tamaño
Tipo de archivo
Color
Dominio
Contenido adulto

25
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

•

Yahoo! Search Vídeo (http://video.search.yahoo.com)
Yahoo! Search Vídeo permite buscar entre millones de archivos de vídeo
en toda la Web.
Para comenzar a usar Yahoo! Search Vídeo, se acude a la URL de arriba
para después introducir la descripción de lo que quieres encontrar en el
cajetín de búsquedas. Por ejemplo, si se necesitan vídeos de gatos, teclea
"gatos" en el cajetín y pulsa el botón de "Búsquedas".
Para limitar la búsqueda a vídeos de un determinado tamaño o formato,
usa la Búsqueda Avanzada de Vídeo.
Las páginas de resultados mostrarán 20 miniaturas (imágenes reducidas)
por página.
26
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

•

Yahoo! Search Vídeo (http://video.search.yahoo.com)

Búsqueda Avanzada de Vídeo:
Las opciones elegidas sólo se aplicarán a la búsqueda que se realizan en
ese momento. Describo el primer campo y enumero los demás:
 Buscar
Para obtener resultados más precisos, este cajetín de texto
permite darle a Yahoo! Search Vídeo instrucciones precisas sobre los
términos que introduces.

Podemos usar símbolos como +, - y " " (comillas) para definir mejor nuestra
búsqueda.
Por ejemplo: Quieres ver vídeos de Jennifer Aniston sin Brad Pitt. Escribe
+"Jennifer Aniston" -"Brad Pitt" en el cajetín "Buscar".

El resto de campos son:
Formato

Tamaño Duración

Filtro de Búsqueda Segura
Sitio/Dominio
27
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO
RASTREO

•

Yahoo! dispone desde no hace muchos meses de un nuevo rastreador,
llamado Slurp, que literalmente significa 'absorber ruidosamente'. Al
igual que Google tiene un PageRank, Yahoo! tiene un webrank.

•

Los webmasters pueden activar el 'If-Modified-Since' en las opciones
de su servidor web. De esta manera, le podrán decir a los robots de los
buscadores y a los navegadores si su contenido se ha modificado
desde la última vez que visitaron una determinada página. Si no es así,
estas aplicaciones utilizarán su caché y no gastarán ancho de banda
del servidor Web.

•

Por último, Yahoo! también recomienda utilizar la directiva 'crawl-delay'
dentro del fichero 'robots.txt' del servidor web. Esta directiva solo está
soportada por los buscadores de Yahoo! y de MSN, y recuerda al robot
que debe volver a visitar un determinado sitio web al cabo de un cierto
número de segundos como mínimo.
28
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO
CARACTERÍSTICAS DE BÚSQUEDA

•

Consultas enciclopédicas dadas por su producto Encarta. Cuando
esto ocurre, aparece el icono “ ”. lo puedo saber, luego por eso lo
indico) para consultarla, que por cierto han incluido un enlace
dentro de su interfaz.

•

Otra novedad (y que no tiene ni Google ni Yahoo!) es el operador
contains: lo que hace es buscar sitios Web que contengan vínculos
a la extensión del nombre del archivo que se ha especificado.

•

MSN Search Local, en fase beta.

•

Búsquedas agrupadas (o Search Result Clustering): es un
proyecto del laboratorio de investigación de Asia, según indica la
barra de título de la dirección http://rwsm.directtaps.net, que en
realidad también funciona con una barra de herramientas). Se trata
como es lógico de un proyecto en fase beta o preliminar.
29
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• La sindicación RSS es otra aportación que ofrece este
renovado buscador, con el popular icono “
”, a diferencia
de Yahoo!, que requeriría el uso de un script para su
visualización.
• Otra novedad es un 'busca-imágenes', localizable en
www.picsearch.com, gracias a la adquisición de esa
empresa. Se verá con el tiempo cómo lo integran.
• Interfaz agradable y para refinar resultados contiene un menú
desplegable que hay en el botón "Generador de búsqueda"
(que equivale a la búsqueda avanzada).
• Lo superficial está cubierto con un diseño mediocre pero bien
accesible y usable; las novedades superaron las expectativas
que se tenían puestas.
30
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

* INTEGRACIÓN:
– Las novedades que trae en su interfaz y en los resultados, los pierde en su
punto fuerte: La "integración" con las "propiedades" de Microsoft. Digo, integra
los resultados con el "Desktop" pero para eso hay que instalar la MSN
Toolbar; integra resultados en el MSN Messenger, pero para eso hay que
configurarlo, etc.
– Pero lo realmente interesante es que por ejemplo, se busca, What is
Michelangelos known for? y sí, algunas cosas hay que probarlas en ingles y la
primer respuesta es: Por pintar la capilla sixtina.
– MSN Search lleva a cabo la ideología EEE (embrace, extend and extinguish),
tan característica de ellos y llevada a su máxima expresión.
– Al menos la conversión a CSS y XHTML de MSN sirve como un argumento
sólido para intentar fomentar los estándares, pues todavía hay mucha
resistencia entre los usuarios.
31
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO
RASTREO

•

En la web del portal MSN existe una ayuda bastante interesante a tener en
cuenta de cara al posicionamiento, y en la que se invita a aplicar unas
sugerencias que podrán ayudar a MSNBot (que es lógicamente como se llama
el rastreador de Microsoft) y a otros rastreadores Web para indizar y clasificar
tu sitio eficazmente. Además, proporcionan una lista de elementos y técnicas
recomendados por MSN Search, como hace también Yahoo! y Google.

•

No hay mucha información sobre cada cuánto tiempo rastrea MSN la Web, hay
mucha contradicción al respecto, pero todo parece indicar que lo están
haciendo últimamente con bastante cierta frecuencia.

•

De todas formas, según hemos podido ver en las prácticas de la asignatura
troncal "Técnicas y métodos avanzados en recuperación de información", MSN
sale mal parado tanto en valor medio aproximado de la efectividad de la
recuperación de información (medida de Borko, aplicando I0=E + P) como en la
similitud, con un 74% de resultados iguales aplicando en el mismo motor una
búsqueda con 'intersección' y otra con 'intersección+frase literal'.
32
5. DESARROLLO

5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO

• Según indica su ayuda, "no existe la posibilidad de pagar para
aumentar la relevancia de tu sitio en la clasificación", sino que se
realiza de forma totalmente automatizada.
• El algoritmo de clasificación de MSN Search analiza factores
como el contenido de las páginas, la cantidad y calidad de los
sitios que tienen vínculos con nuestras páginas y la relevancia
del contenido de tu sitio con respecto a palabras clave. Se trata
de un algoritmo complejo y sin intervención humana.
• Para más información sobre posicionamiento visitar su sitio de
ayuda en español en http://search.msn.es/docs/default.aspx?
FORM=HLHP.
33
5. DESARROLLO

5.3. COMPARATIVA DE S.V.A.

Nota: Datos a fecha de julio de
2005.

LEYENDA:

E-mail (1), barra de herramientas (2), directorio de catálogos de pedidos (3), servicio de alertas
de páginas afines a un criterio de búsqueda (4), noticias de actualidad en tiempo real (5),
gestor de grupos -o listas de correo- (6), traductor multilingüe (7), servicio de bitácoras (8),
gestor de historiales de búsquedas (9), servicio de expertos -consultoría de recursos
digitales- (10), códigos abiertos API (11), sistema (programa) de mensajería instantánea (12),
barra en escritorio de búsqueda de contenido (13), representación de callejeros y mapas (14),
búsqueda local (15), búsqueda en libros (16), acelerador web (17), servicios online desde
móvil, PDA o PocketPC (18), buscador de productos comerciales con comparación de precios
para cada tienda virtual (19), personalización del portal (20), búsqueda personalizada según
perfiles de interés (21), generador de términos de búsqueda taxonómicos (22) y sugerencias
de búsqueda en tiempo real (23).
34
5. DESARROLLO

5.4. COMPARATIVA DE CARACTERÍSTICAS DE BÚSQUEDA

Nota: Datos a fecha de julio de 2005.

LEYENDA:

Búsqueda agrupada -clustering- (1), búsqueda por frase literal (2), páginas caché (3),
búsqueda de imágenes (4), búsqueda de vídeos (5), búsqueda por formato (6), búsqueda por
truncamiento -o de exactitud- (7), búsquedas por operadores posicionales y/o por campos (8),
influencia o sensibilidad en los resultados a las tildes (9), directorio Web (10), soporte parcial
de indexación SWF o tecnología multimedia Flash (11), calculadora (12), búsqueda contextual
(13), sugerencias de búsquedas alternativas o relacionadas (14), búsqueda estilo glosario, de
diccionario o enciclopedia (15), búsqueda por códigos especiales de patentes (16), páginas
similares (17), refinamiento -búsqueda sobre resultados- (18), esquema jerárquico (19),
búsquedas numeradas (20), búsqueda por expresiones regulares (o por patrones) (21),
corrector ortográfico (22), soporte o implementación de RSS (23), filtro de búsqueda segura
(24), clasificación de resultados por diferentes criterios combinados (25), búsquedas de
sinónimos (26) y URL's adicionales de un dominio (27).
35
6. CONCLUSIONES (I)
 Las empresas de Internet se encuentran en un mundo muy dinámico y un mercado
muy cambiante, con la imparable adquisición de nuevas empresas y más con la
salida a Bolsa del gigante Google, que es de las que más cotizan. Ya se sabe, si no
se puede con el enemigo, lo mejor es unirse a él (si se deja).
 Trayectora de crecimiento de la empresa determina muchas veces que se vea
mermada la calidad de muchos productos/servicios.
 La competencia beneficia al usuario final, salvo cuando no se establecen los límites y
se descontrola la adquisición de empresas. Todo tiene un límite.
 Tendencia a la integración de servicios en un solo portal; plataformas engloban a
otras.
 Pese a la competencia, aunque admitan sugerencias de los usuarios, las
estadísticas “ciegan”: no dejan ver la realidad de las cosas, se centran más en el
mercado que en los propios usuarios.
 Tecnología incierta, pendiente de madurar.
 En indexación queda aún mucho camino por recorrer, debido a la amplia variedad de
formatos existentes y tecnologías con protección, que es el caballo de la batalla y el
quid de la cuestión.
36
6. CONCLUSIONES (II)
 Los buscadores deben prepararse para la Web semántica -como de hecho ya lo
están haciendo, aunque sin prisa, por haber tecnologías que primero deben madurar,
como ya señalaba-, el futuro de la actual Web, pero aún queda mucho camino por
recorrer.
 Portalización de los buscadores, gran transformación experimentada en los últimos
años. Necesidad de poner orden y concierto a las APIs creadas.
 Cada empresa improvisa su prioridad lanzando o respondiendo enfoques de ideas,
aunque no sean originales y tardías por centrarse en otras parcelas.
 Juegan con la ley de la ventaja e intentan cubrirse huecos y complementarse para
intentar ganar terreno a corto plazo constituyendo para el usuario un valor añadido.
 Preferencia del internauta del “buscador” frente al ‘directorio’.
 Proliferación en cadena de los laboratorios de investigación de estas empresas a
disposición del usuario para productos/servicios en fase beta.
37
6. CONCLUSIONES (III)
 Exceso de lanzamientos de nuevos servicios en versiones beta. Lanzamientos
apresurados con tal de no quedarse atrás y ser el pionero en Nuevas Tecnologías.
Yahoo subcontrata para no llamar beta a sus productos pero Google no aplica tanto
el “outsourcing” y echa manos de recursos propios; de ahí, su tardanza muchas
veces. Aunque Google cuenta con un gran equipo.
 Necesidad de dotación de mayor infraestructura y personal debido al aumento de
número de internautas y poder satisfacer demandas de los usuarios a través de
canales de comunicación.
 Blogs para divulgar sus avances de laboratorio y lanzamientos experimentales o no.
 Yahoo y Microsoft se lo piensan más a la hora de ofertar nuevos servicios y lanzan
versiones de nuevas funcionalidades en varios idiomas. El idioma influye en el grado
de desarrollo respecto a la prestación de servicios y en la actualización de
contenidos, que es discontinua por no sincronizarse las versiones de distintos
idiomas de un mismo portal. Y no olvidemos el tema de la censura en China.
 Se van acortando distancias entre los tres gigantes. Supremacía clara de Google
cada vez menos evidente, aunque siendo el rey indiscutible.
38
6. CONCLUSIONES (IV)
 Surgen motores de búsqueda revolucionarios, alternativos a Google con algoritmos
innovadores, con criterios de valoración diferentes al Page Rank. Veremos lo que
duran estas páginas como Ask Jeeves y Clusty, por citar sólo unos ejemplos.
 Resultados de búsqueda procedentes de diferentes bases de datos en algunos
casos, como Altavista, debido a la compra de empresas, patentes y tecnologías.
 La Web 2.0 va a ocasionar un terrible duelo entre estos tres titanes. Y esto sólo
acaba de empezar, ¿quién sabe cómo acabará, si las tecnologías se interconectarán
o no, o simplemente cambiará de nombre y filosofía? Por ejemplo Flickr de Yahoo!
está ganando terreno claramente en número de registros a Orkut de Google.
 El espionaje e intereses ocultos son posibles, pese a muchas cláusulas que leamos y
demás letra pequeña. Somos marionetas frente a esas empresas.
 Se percibe claramente las intenciones de hacerse con el control de la Web
(anárquica hasta ahora y esperemos que dure), cuando la Web no pertenece a
nadie, al mismo tiempo que no debe ser censurada. Finalmente, se observa que todo
sea hace por número de registros, visitas y por su propio beneficio; de ahí que afilen
sus armas y cada vez hayan menos diferencias en las características de búsqueda.

39
6. CONCLUSIONES (V)
En fin, de momento, que no se tambalee Google (que su aparición ya de por sí ha supuesto
una auténtica revolución en la Red y para nuestras vidas), porque nos tambalearemos
todos, pero que tampoco se lo crean, que no es bueno para que prospere la calidad de su
índice, que todavía puede mejorar y mucho. Eso sí, temblemos porque Google amenaza
con seguir acaparándolo todo, y sobre todo las editoriales y sociedades de autores.
En definitiva, que si es bueno, perdure, ya habrá tiempo de ver lo que nos depara el futuro.

Unas cuantas citas (las tres últimas personales) para finalizar:
1.

En la Internet empresarial quien golpea primero, por lo general, golpea dos veces.

2.

Si el príncipe esclarecido y el general competente derrotan al enemigo cada vez
que pasan a la acción, si sus hazañas se salen fuera de lo común es gracias a la
información previa. Sun Tzu. ‘El arte de la Guerra’, s. VI a.C.

3.

Como regla general la persona más exitosa en la vida es aquella que tiene la mejor
información. Benjamín Disraeli.

4.

La mejor fuente de información son las personas que juran no contarlo a nadie.
Anónimo.

5.

En un futuro la sociedad se dividirá en dos partes: las que están informatizadas y
las que no.

6.

Internet es la Tercera Revolución Industrial y tan sólo depende de ti formar parte
de la historia.
(fin del mensaje).
40
7. REFERENCIAS (I)
Nota: Las referencias se han realizado siguiendo la norma internacional ISO 690-2
para publicaciones electrónicas, que constituyen el tipo de fuentes de información
empleadas en este trabajo. He hecho una selección de las fuentes más consultadas,
aunque no sea del todo exhaustiva.

 Google [en línea]. EEUU. <http://www.google.com/options/> [Consulta: 14 abril
2005].
 Labs Google [en línea]. EEUU. <http://labs.google.com> [Consulta: 5 mayo
2005].
 Yahoo! [en línea]. EEUU. <http://www.yahoo.com> [Consulta: 14 abril 2005].
 MSN Sandbox [en línea]. EEUU. <http://sandbox.msn.com> [Consulta: 11 junio
2005].
 Google Blog [en línea]. EEUU. <http://googleblog.blogspot.com> [Consulta: 8
mayo 2005].
 Yahoo! Search blog [en línea]. EEUU. <http://www.ysearchblog.com> [Consulta:
8 mayo 2005].
 msnsearch's WebLog [en línea]. EEUU. <http://blogs.msdn.com/msnsearch/>
[Consulta: 8 mayo 2005].
41
7. REFERENCIAS (II)
 Search Engine Watch: Tips About Internet Search Engines & Search Engine
Submission [en línea]. EEUU. <http://searchenginewatch.com> [Consulta: 14
abril 2005].
 Search Engine Optimization (SEO) Resources in the Yahoo! Directory [en
línea]. EEUU. <http://dir.yahoo.com/Computers_and_Internet/Internet/
World_Wide_Web/Site_Announcement_and_Promotion/Search_Engine_Optimi
zation__SEO_> [Consulta: 4 febrero 2005].
 Googledirson [en línea]. España. <http://google.dirson.com> [Consulta: 5 marzo
2005].
 Tramullas.com [en línea]. España. <http://www.tramullas.com> [Consulta: 2 julio
2005].
 Posicionamiento en buscadores: guía básica [en línea]. EEUU.
<http://www.guia-buscadores.com/posicionamiento/> [Consulta: 12 mayo 2005].
 Recuperación de Información en la Web [en línea]. España.
<http://irsweb.blogspot.com> [Consulta: 30 mayo 2005].
 Google Blogoscoped [en línea]. EEUU. <http://blog.outer-court.com> [Consulta:
12 mayo 2005].
42
7. REFERENCIAS (III)
 Barrapunto: La información que te interesa [en línea]. España.
<http://www.barrapunto.com> [Consulta: 10 mayo 2005].
 El Blog de Enrique Dans [en línea]. España. <http://www.enriquedans.com>
[Consulta: 12 junio 2005].
 Google Community [en línea]. EEUU. <http://www.googlecommunity.com>
[Consulta: 17 mayo 2005].
 Deakialli DocuMental [en línea]. España. <http://deakialli.bitacoras.com>
[Consulta: 30 mayo 2005].
 Métodos de busca: Cómo buscar información en Internet [en línea]. España.
<http://www.metodosdebusca.com> [Consulta: 1 junio 2005].
 Error500 [en línea]. España. <http://www.error500.net> [Consulta: 3 abril 2005].
 Trucos de Google - buscadores y gestión documental [en línea]. España.
<http://trucosdegoogle.blogspot.com> [Consulta: 17 mayo 2005].
 Denken Über [en línea]. España. <http://www.uberbin.net> [Consulta: 4 marzo
2005].

43
«Batalla entre los majors:
análisis de la lucha por la primacía en la Web»
Proyecto Fin de Carrera dirigido por
el Dr. D. Francisco Javier Martínez Méndez
Universidad de Murcia, 2005
Departamento de Información y Documentación
Facultad de Comunicación y Documentación

Muchas Gracias a todos

More Related Content

What's hot (16)

Informatica
InformaticaInformatica
Informatica
 
Andrea reinoso
Andrea reinosoAndrea reinoso
Andrea reinoso
 
navegadores
navegadoresnavegadores
navegadores
 
Tipos de navegadores
Tipos de navegadoresTipos de navegadores
Tipos de navegadores
 
Informatica11
Informatica11Informatica11
Informatica11
 
Tipos de Navegadores de Internet
Tipos de Navegadores de Internet Tipos de Navegadores de Internet
Tipos de Navegadores de Internet
 
Navegadores de Internet
Navegadores de InternetNavegadores de Internet
Navegadores de Internet
 
Presentacion de navegadores
Presentacion de navegadoresPresentacion de navegadores
Presentacion de navegadores
 
Navegadores
NavegadoresNavegadores
Navegadores
 
Exploradores navegadores de internet
Exploradores navegadores de internetExploradores navegadores de internet
Exploradores navegadores de internet
 
Pechano
PechanoPechano
Pechano
 
TIPOS DE NAVEGADORES
TIPOS DE  NAVEGADORESTIPOS DE  NAVEGADORES
TIPOS DE NAVEGADORES
 
Andrea reinoso
Andrea reinosoAndrea reinoso
Andrea reinoso
 
Un navegador o navegador web
Un navegador o navegador webUn navegador o navegador web
Un navegador o navegador web
 
Consulta informatica.
Consulta  informatica.Consulta  informatica.
Consulta informatica.
 
Aporte a las diapositivas "Internet"
Aporte a las diapositivas "Internet"Aporte a las diapositivas "Internet"
Aporte a las diapositivas "Internet"
 

Similar to Batalla entre los 'majors': análisis de la lucha por la primacía en la Web

Similar to Batalla entre los 'majors': análisis de la lucha por la primacía en la Web (20)

Presentación PFC
Presentación PFCPresentación PFC
Presentación PFC
 
Tic72 equipo10 tema21_rok_quickcart
Tic72 equipo10 tema21_rok_quickcartTic72 equipo10 tema21_rok_quickcart
Tic72 equipo10 tema21_rok_quickcart
 
Seo y la importancia del seo local
Seo y la importancia del seo local Seo y la importancia del seo local
Seo y la importancia del seo local
 
Monografia
MonografiaMonografia
Monografia
 
1.3 google
1.3 google1.3 google
1.3 google
 
Consejos prácticos para poner en marcha un portal de transparencia
Consejos prácticos para poner en marcha un portal de transparenciaConsejos prácticos para poner en marcha un portal de transparencia
Consejos prácticos para poner en marcha un portal de transparencia
 
Manual completisimo de google
Manual completisimo de googleManual completisimo de google
Manual completisimo de google
 
Trabajo google sites sena
Trabajo google sites senaTrabajo google sites sena
Trabajo google sites sena
 
Trabajo google
Trabajo googleTrabajo google
Trabajo google
 
CASOS DE EXITO Y FRACASO
CASOS DE EXITO Y FRACASOCASOS DE EXITO Y FRACASO
CASOS DE EXITO Y FRACASO
 
Template paper-2015
Template paper-2015Template paper-2015
Template paper-2015
 
Tarea 4 II
Tarea 4 IITarea 4 II
Tarea 4 II
 
Introducción al Posicionamiento en Buscadores SEO
Introducción al Posicionamiento en Buscadores SEOIntroducción al Posicionamiento en Buscadores SEO
Introducción al Posicionamiento en Buscadores SEO
 
Google site
Google siteGoogle site
Google site
 
Google site
Google siteGoogle site
Google site
 
Google site
Google siteGoogle site
Google site
 
logro 1 - 2
logro 1 - 2logro 1 - 2
logro 1 - 2
 
Informatica
InformaticaInformatica
Informatica
 
Cuaderno digital
Cuaderno digitalCuaderno digital
Cuaderno digital
 
Trabajo para Gestión de redes
Trabajo para Gestión de redesTrabajo para Gestión de redes
Trabajo para Gestión de redes
 

More from Pedro M. Álvarez

More from Pedro M. Álvarez (14)

Marketing de la profesión de Documentalista
Marketing de la profesión de DocumentalistaMarketing de la profesión de Documentalista
Marketing de la profesión de Documentalista
 
Obtener FECHA DE REGISTRO en LinkedIn
Obtener FECHA DE REGISTRO en LinkedInObtener FECHA DE REGISTRO en LinkedIn
Obtener FECHA DE REGISTRO en LinkedIn
 
Google interland - Certificate of strongness
Google interland - Certificate of strongnessGoogle interland - Certificate of strongness
Google interland - Certificate of strongness
 
CURSO BÁSICO DE MARKETING DIGITAL (para titulados universitarios)
CURSO BÁSICO DE MARKETING DIGITAL (para titulados universitarios)CURSO BÁSICO DE MARKETING DIGITAL (para titulados universitarios)
CURSO BÁSICO DE MARKETING DIGITAL (para titulados universitarios)
 
Frases de origen militar
Frases de origen militarFrases de origen militar
Frases de origen militar
 
Desaprender y aprender
Desaprender y aprenderDesaprender y aprender
Desaprender y aprender
 
Entrevistadetrabajo
EntrevistadetrabajoEntrevistadetrabajo
Entrevistadetrabajo
 
Rare birds collection
Rare birds collectionRare birds collection
Rare birds collection
 
Suiza espectacular (ruta turística)
Suiza espectacular (ruta turística)Suiza espectacular (ruta turística)
Suiza espectacular (ruta turística)
 
Animales raros
Animales rarosAnimales raros
Animales raros
 
Voitures a papa
Voitures a papaVoitures a papa
Voitures a papa
 
Correos Basura
Correos BasuraCorreos Basura
Correos Basura
 
Planeta Tierra
Planeta TierraPlaneta Tierra
Planeta Tierra
 
Suspiros De España
Suspiros De EspañaSuspiros De España
Suspiros De España
 

Recently uploaded

IA en la empresa. La inteligencia artificial potencia la tarea diaria
IA en la empresa. La inteligencia artificial potencia la tarea diariaIA en la empresa. La inteligencia artificial potencia la tarea diaria
IA en la empresa. La inteligencia artificial potencia la tarea diariaEducática
 
Garcia_Garcia_PracticasWeb7Reportes.pptx
Garcia_Garcia_PracticasWeb7Reportes.pptxGarcia_Garcia_PracticasWeb7Reportes.pptx
Garcia_Garcia_PracticasWeb7Reportes.pptxANDREADELCARMENGARCI
 
Verde Ilustrado Moderno Redes Sociales Informe de Marketing Presentación (1).pdf
Verde Ilustrado Moderno Redes Sociales Informe de Marketing Presentación (1).pdfVerde Ilustrado Moderno Redes Sociales Informe de Marketing Presentación (1).pdf
Verde Ilustrado Moderno Redes Sociales Informe de Marketing Presentación (1).pdfmiriamsarahihm2008
 
RESUMENES DE FUNCIONES DESARROLLO DE BLOG
RESUMENES DE FUNCIONES DESARROLLO DE BLOGRESUMENES DE FUNCIONES DESARROLLO DE BLOG
RESUMENES DE FUNCIONES DESARROLLO DE BLOGmarianhenao98
 
cuadro comparativo de web 1.0 web 2.0 web 3.0 web 4.0......pptx
cuadro comparativo de web 1.0 web 2.0 web 3.0 web 4.0......pptxcuadro comparativo de web 1.0 web 2.0 web 3.0 web 4.0......pptx
cuadro comparativo de web 1.0 web 2.0 web 3.0 web 4.0......pptxange07u
 
Texto Argumentativo (Basura Electronica)
Texto Argumentativo (Basura Electronica)Texto Argumentativo (Basura Electronica)
Texto Argumentativo (Basura Electronica)AlejandraCasallas7
 
carta combinada para empleados de una empresa
carta combinada para empleados de una empresacarta combinada para empleados de una empresa
carta combinada para empleados de una empresafspro99
 
Lista de selección dinámica desde MySQL hacia PHP (con PDO)
Lista de selección dinámica desde MySQL hacia PHP (con PDO)Lista de selección dinámica desde MySQL hacia PHP (con PDO)
Lista de selección dinámica desde MySQL hacia PHP (con PDO)ChristianRivera122452
 
David_Gallegos - tarea de la sesión 8.pptx
David_Gallegos - tarea de la sesión 8.pptxDavid_Gallegos - tarea de la sesión 8.pptx
David_Gallegos - tarea de la sesión 8.pptxDAVIDROBERTOGALLEGOS
 
Excel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdfExcel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdfSOFIAACOSTAESCOBAR
 
TareaSesión8_ListaDinamica_Garcia_Garcia.pptx
TareaSesión8_ListaDinamica_Garcia_Garcia.pptxTareaSesión8_ListaDinamica_Garcia_Garcia.pptx
TareaSesión8_ListaDinamica_Garcia_Garcia.pptxANDREADELCARMENGARCI
 
Lista de datos (tecnología) combinación de...
Lista de datos (tecnología) combinación de...Lista de datos (tecnología) combinación de...
Lista de datos (tecnología) combinación de...NicolleAndrade7
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfssuser337a5e
 
Trabajo de tecnología excel avanzado:métodos estadísticos
Trabajo de tecnología excel avanzado:métodos estadísticosTrabajo de tecnología excel avanzado:métodos estadísticos
Trabajo de tecnología excel avanzado:métodos estadísticosJuanCamilomurillo2
 
Basisschulung zum Datenschutz DE_SPA.pptx
Basisschulung zum Datenschutz  DE_SPA.pptxBasisschulung zum Datenschutz  DE_SPA.pptx
Basisschulung zum Datenschutz DE_SPA.pptxsergioagudo4
 
Tarea_de_la_sesión_8 Base de Datos Individual.pptx
Tarea_de_la_sesión_8 Base de Datos Individual.pptxTarea_de_la_sesión_8 Base de Datos Individual.pptx
Tarea_de_la_sesión_8 Base de Datos Individual.pptxVICTORMANUELBEASAGUI
 
El Libro de la Inteligencia Artificial (versión 13)
El Libro de la Inteligencia Artificial (versión 13)El Libro de la Inteligencia Artificial (versión 13)
El Libro de la Inteligencia Artificial (versión 13)Alfredo Vela Zancada
 
Tabla ejemplo, complemento de las cartas
Tabla ejemplo, complemento de las cartasTabla ejemplo, complemento de las cartas
Tabla ejemplo, complemento de las cartasSantiagoMeneses18
 
CALCULADORA CIENTIFICA trabajo grupal 9-6.docx
CALCULADORA CIENTIFICA trabajo grupal 9-6.docxCALCULADORA CIENTIFICA trabajo grupal 9-6.docx
CALCULADORA CIENTIFICA trabajo grupal 9-6.docxzoecaicedosalazar
 
Texto Argumentativo (Basura Electronica)
Texto Argumentativo (Basura Electronica)Texto Argumentativo (Basura Electronica)
Texto Argumentativo (Basura Electronica)lucianavillotalozano
 

Recently uploaded (20)

IA en la empresa. La inteligencia artificial potencia la tarea diaria
IA en la empresa. La inteligencia artificial potencia la tarea diariaIA en la empresa. La inteligencia artificial potencia la tarea diaria
IA en la empresa. La inteligencia artificial potencia la tarea diaria
 
Garcia_Garcia_PracticasWeb7Reportes.pptx
Garcia_Garcia_PracticasWeb7Reportes.pptxGarcia_Garcia_PracticasWeb7Reportes.pptx
Garcia_Garcia_PracticasWeb7Reportes.pptx
 
Verde Ilustrado Moderno Redes Sociales Informe de Marketing Presentación (1).pdf
Verde Ilustrado Moderno Redes Sociales Informe de Marketing Presentación (1).pdfVerde Ilustrado Moderno Redes Sociales Informe de Marketing Presentación (1).pdf
Verde Ilustrado Moderno Redes Sociales Informe de Marketing Presentación (1).pdf
 
RESUMENES DE FUNCIONES DESARROLLO DE BLOG
RESUMENES DE FUNCIONES DESARROLLO DE BLOGRESUMENES DE FUNCIONES DESARROLLO DE BLOG
RESUMENES DE FUNCIONES DESARROLLO DE BLOG
 
cuadro comparativo de web 1.0 web 2.0 web 3.0 web 4.0......pptx
cuadro comparativo de web 1.0 web 2.0 web 3.0 web 4.0......pptxcuadro comparativo de web 1.0 web 2.0 web 3.0 web 4.0......pptx
cuadro comparativo de web 1.0 web 2.0 web 3.0 web 4.0......pptx
 
Texto Argumentativo (Basura Electronica)
Texto Argumentativo (Basura Electronica)Texto Argumentativo (Basura Electronica)
Texto Argumentativo (Basura Electronica)
 
carta combinada para empleados de una empresa
carta combinada para empleados de una empresacarta combinada para empleados de una empresa
carta combinada para empleados de una empresa
 
Lista de selección dinámica desde MySQL hacia PHP (con PDO)
Lista de selección dinámica desde MySQL hacia PHP (con PDO)Lista de selección dinámica desde MySQL hacia PHP (con PDO)
Lista de selección dinámica desde MySQL hacia PHP (con PDO)
 
David_Gallegos - tarea de la sesión 8.pptx
David_Gallegos - tarea de la sesión 8.pptxDavid_Gallegos - tarea de la sesión 8.pptx
David_Gallegos - tarea de la sesión 8.pptx
 
Excel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdfExcel avanzado y métodos estadísticos.pdf
Excel avanzado y métodos estadísticos.pdf
 
TareaSesión8_ListaDinamica_Garcia_Garcia.pptx
TareaSesión8_ListaDinamica_Garcia_Garcia.pptxTareaSesión8_ListaDinamica_Garcia_Garcia.pptx
TareaSesión8_ListaDinamica_Garcia_Garcia.pptx
 
Lista de datos (tecnología) combinación de...
Lista de datos (tecnología) combinación de...Lista de datos (tecnología) combinación de...
Lista de datos (tecnología) combinación de...
 
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdfBLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
BLOG, EXCEL AVANZADO, MÉTODOS ESTADÍSTICOS.pdf
 
Trabajo de tecnología excel avanzado:métodos estadísticos
Trabajo de tecnología excel avanzado:métodos estadísticosTrabajo de tecnología excel avanzado:métodos estadísticos
Trabajo de tecnología excel avanzado:métodos estadísticos
 
Basisschulung zum Datenschutz DE_SPA.pptx
Basisschulung zum Datenschutz  DE_SPA.pptxBasisschulung zum Datenschutz  DE_SPA.pptx
Basisschulung zum Datenschutz DE_SPA.pptx
 
Tarea_de_la_sesión_8 Base de Datos Individual.pptx
Tarea_de_la_sesión_8 Base de Datos Individual.pptxTarea_de_la_sesión_8 Base de Datos Individual.pptx
Tarea_de_la_sesión_8 Base de Datos Individual.pptx
 
El Libro de la Inteligencia Artificial (versión 13)
El Libro de la Inteligencia Artificial (versión 13)El Libro de la Inteligencia Artificial (versión 13)
El Libro de la Inteligencia Artificial (versión 13)
 
Tabla ejemplo, complemento de las cartas
Tabla ejemplo, complemento de las cartasTabla ejemplo, complemento de las cartas
Tabla ejemplo, complemento de las cartas
 
CALCULADORA CIENTIFICA trabajo grupal 9-6.docx
CALCULADORA CIENTIFICA trabajo grupal 9-6.docxCALCULADORA CIENTIFICA trabajo grupal 9-6.docx
CALCULADORA CIENTIFICA trabajo grupal 9-6.docx
 
Texto Argumentativo (Basura Electronica)
Texto Argumentativo (Basura Electronica)Texto Argumentativo (Basura Electronica)
Texto Argumentativo (Basura Electronica)
 

Batalla entre los 'majors': análisis de la lucha por la primacía en la Web

  • 1. Facultad de Comunicación y Documentación PROYECTO FIN DE CARRERA (P.F.C.) Batalla entre los majors: análisis de la lucha por la primacía en la Web Alumno aspirante al grado de Licenciado en Documentación: Pedro Miguel Álvarez Guillermo
  • 2. ESQUEMA DE MI DEFENSA 1. Introducción 2. Justificación de la investigación 3. Objetivos 4. Metodología 5. Desarrollo 5.1 Servicios de valor añadido 5.2 Características de búsqueda y rastreo 5.3 Comparativa de servicios de valor añadido 5.4 Comparativa de características de búsqueda 6. Conclusiones 7. Referencias. 2
  • 3. 1. INTRODUCCIÓN (I)  Situación histórica: época de los gigantes mediáticos.  Necesidad e interés cada vez más despierto por recuperar la información con eficacia en la Red de Redes, además de la necesidad de informarse, el posicionamiento dentro de los buscadores y el ver quién ofrece los mejores productos y servicios. • Tras la crisis de los portales y empresas puntocom allá por el año 2000 y 2001, cuando se produjo el estallido de la llamada burbuja tecnológica  pero los más grandes sobrevivieron mediante estrategias de marketing, contenidos y de inversión. Estrategia de Yahoo! actualmente está siendo agresiva y cuenta con la experiencia de un portal clásico y con solera. Microsoft (y por ende, MSN) se basa en su monopolio en el mercado del software, debido a su veteranía (existe desde 1975). 3
  • 4. 1. INTRODUCCIÓN (II) Pero la excepción que confirma la regla es Google (es inevitable mencionarlo), que se empezó a popularizar entre la comunidad internauta a partir del año 2000. Y desde entonces no ha habido tregua por hacerse un hueco en la lucha de los buscadores y de los servicios/productos de valor añadido; cada vez ha sido una lidia o pugna más intensa.  Yahoo! y MSN, están respaldados por su experiencia en productos o servicios, por su inversión más o menos racional, marketing y prestigio.  Yahoo!, al abarcar menos terreno que MSN, está más en condiciones éste último de "apretar", pero también de competir fuertemente contra Google. 4
  • 5. 1. INTRODUCCIÓN (III)  Google: líder de audiencia gracias a la popularidad de su motor de búsqueda (su filosofía radica en tener voluntad para innovar y organizar la información mundial, aunque tienen 10 principios muy claros existentes en su web). Luego está claro que son proyectos distintos, con visiones de negocio muy diferentes.  Google se está ahora portalizando. Desde un principio conocemos la filosofía de esta empresa y sabemos que sus principios es la apuesta constante por la calidad de sus servicios y productos. Y al no ser búsquedas en bases de datos factuales sino deterministas, la búsqueda a texto completo es más compleja. 5
  • 6. 1. INTRODUCCIÓN (IV)  Pero tampoco MSN ha estado de brazos cruzados ya que a Microsoft, tras su fracaso allá por el año ’94 con la red Microsoft Network, no está dispuesta a perder el trono en el ámbito cibernético, por la cuenta que le trae, ya que no se puede descuidar ni un momento y por eso no está conforme con la hegemonía de su navegador (que fue gracias al monopolio de Windows y la integración del navegador en dicho sistema operativo); eso pilló de sorpresa a Microsoft, pero que fue un éxito del que supo sacar jugo, si bien el tema de los navegadores ya es otra historia de lidia distinta.  El caso es que Microsoft se ha desecho de los algoritmos de su antiguo motor Inktomi y Overture para poner en marcha su propia tecnología valiéndose del perfeccionamiento de su robot-trasteador de la web, MSNBot, por haber adquirido recientemente la empresa Lookout. 6
  • 7. 2. JUSTIFICACIÓN DE LA INVESTIGACIÓN (I)  De entre los temas propuestos, elegí éste por ser en el que más experiencia tengo y más me atrae de acuerdo a mi trayectoria académica y formativa autodidacta.  He considerado interesante -creo que era el momento idóneo e ideal- elaborar una instantánea sobre cómo está la situación a fecha de julio de 2005 en cuanto a lidia entre los buscadores más importantes: Google, Yahoo! y MSN; todo ello intentando tener el mayor rigor posible y algo de crítica.  En este sentido, he procurado esmerarme tanto en la documentación como en la fiabilidad de lo que leía (si se lee el documento original se podrá percibir algo). También en el anexo, con elementos de valor añadido que explico en la metodología y en el cuerpo del trabajo, teniendo en cuenta anécdotas de declaraciones de directivos de estos gigantes y proyectos abandonados por Google por abarcar tanto y alternativas de métodos de búsqueda o parámetros interesantes, que es algo con lo que disfruto al descubrirlo. 7
  • 8. 2. JUSTIFICACIÓN DE LA INVESTIGACIÓN (II)  No es fácil en esta fecha encontrar una recopilación como la que he pretendido en este trabajo.  Seguramente hay trabajos similares aunque yo los desconozca y habría que ver su metodología si ha sido la misma y si son igual de exhaustivos como aquí se pretendía, con tal de acaparar más  De ahí, el tiempo que ha llevado, requiriendo una puesta al día continuada durante cuatro meses. Pero también he procurado sintetizar descripciones de servicios por motivos de espacio cuando lo requería.  Al menos, éste ha sido mi criterio que expongo, ni mejor ni peor que cualquier otro, sino más a mi manera, y concertado con mi director, pretendiendo hacer un tratamiento integral pero también pormenorizadamente cuando era estrictamente necesario, para no arriesgarse a imprecisiones.  Creo que ha merecido la pena el esfuerzo, lástima que sea algo efímero por la obsolescencia y caduque tan pronto algunos enlaces, por su corta longevidad, y no sabemos en el futuro cómo se llamarán o si existirán estos servicios visto con el mismo concepto. 8
  • 9. 3. OBJETIVOS A. Dar cuenta de los proyectos que están floreciendo en torno a la propia función de búsqueda, debido al estado de apogeo del sector de las búsquedas en materia de características de búsqueda por la inserción de nuevas tecnologías, y todo ello para intentar que se tenga una visión pormenorizada pero a la vez sintética e integradora de lo que se está haciendo en ese sentido. B. Analizar los principales servicios que ofrecen estas empresas para competir en dicho sector y de paso, en el de los portales de Internet, que es lo que se está ahora desarrollando más y a lo que se tiende de nuevo ahora que no caen del todo en el generalismo de un portal horizontal. C. Veremos finalmente cómo los buscadores intentan con sus características de búsqueda facilitarnos en gran medida nuestras consultas informativas para tratar de mitigar el problema de la recuperación mediante texto libre (que algún día se convertirá en recuperación lenguaje natural, cuando la "web semántica" funcione y las páginas estén preparadas para ello (los navegadores ya lo están con el código estándar XML). 9
  • 10. 4. METODOLOGÍA  1ª fase del trabajo: se hizo la descripción de los servicios de valor añadido (SVA) de cada empresa o buscador -aunque no demasiada pormenorizada-.  2ª fase del trabajo: se analizaron las características fundamentales de búsqueda (capacidades y herramientas de búsqueda) y a modo de valor añadido coloqué información tanto personal como extraida de la ayuda de los motores de búsqueda sobre el rastreo y los criterios de posicionamiento que lleva a cabo el buscador en cuestión. En una tercera y última fase integradora, más completa pero sintética, se construyó la tabla comparativa de evaluación de los aspectos tratados en cada una de las dos fases anteriores. − Anexo: para dotar de algo de "frescura" al trabajo, he considerado conveniente indicar algunas curiosidades y agregar una selección de noticias de la prensa de Internet sobre todo, respecto a lo que se avecina a día de hoy en este ámbito tan competitivo. Nota: la sintaxis del lenguaje de búsqueda a la hora de establecer los parámetros aparece en el documento original de la Tesis. 10
  • 11. 5. DESARROLLO. 5.1. SERVICIOS DE VALOR AÑADIDO • GOOGLE XHTML (WAP 2.0) • GOOGLE DESKBAR • GOOGLE LOCAL • GOOGLE NEWS • ORKUT • GOOGLE EARTH • GOOGLE PERSONALIZED SEARCH • GOOGLE HOME PERSONALIZED • GOOGLE VIDEO VIEWER • GOOGLE VIDEO SEARCH • GOOGLE DESKTOP SEARCH • GOOGLE GROUPS (v. 2) • GOOGLE ACCOUNTS • GOOGLE SUGGEST (beta) • PICASA • GOOGLE SITEMAPS • BLOGGER • GMAIL • GOOGLE SEARCH APPLIANCE (+ mini) • GOOGLE BROWSER BUTTONS • GOOGLE ACCOUNTS • BÚSQUEDAS TEMÁTICAS ESPECIALES • GOOGLE PRINT • GOOGLE ALERTS (beta) 11
  • 12. 5. DESARROLLO. 5.1. SERVICIOS DE VALOR AÑADIDO OTROS SVA (DESCRITOS SOMERAMENTE): • GOOGLE TOOLBAR • Site-Flavored Google Search (beta) • FROOGLE (y sus variantes) • Versión WAP de Google • GOOGLE COMPUTE • Google-Friends Newsletter • GOOGLE WEB APIs • Google Store • GOOGLE CATALOGUE SEARCH • Google Web Accelerator • GOOGLE ANSWERS • Google Sets • GOOGLE DOWNLOADS • Google Scholar - Más en la web del Laboratorio de Google - 12
  • 13. 5. DESARROLLO. 5.1. SERVICIOS DE VALOR AÑADIDO • YAHOO! NEWS • YAHOO! 360º (beta, integrado) • FLICKR • YAHOO! MAIL • MY YAHOO! SEARCH • YAHOO! LOCAL • YAHOO! MOBILE • YAHOO! MESSENGER • MY YAHOO! • ASK YAHOO! • YAHOO! DEVELOPER OTROS SVA (DESCRITOS SOMERAMENTE): • MYWEB • MY WEB 2.0 (no es de lo mismo) • YAHOO! MAPS • SHOPPING YAHOO! • YAHOO! SMALL BUSINESS • YAHOO! TOOLBAR 6.0 • YAHOO! DESKTOP SEARCH • YAHOO! MÚSICA • YAHOO! MUSIC ENGINE • YAHOO! CINE • YAHOO! SEARCH SUBSCRIPTIONS • YAHOO! BUZZ GAME • YAHOO! FARECHASE 13
  • 14. 5. DESARROLLO. 5.1. SERVICIOS DE VALOR AÑADIDO OTROS SVA SECUNDARIOS (continuación): • YAHOO! MÚSICA • YAHOO! MUSIC ENGINE • YAHOO! CINE • YAHOO! SEARCH SUBSCRIPTIONS - Más en la web del Laboratorio de Yahoo! - • YAHOO! BUZZ GAME • YAHOO! FARECHASE • YAHOO! MINDSET (beta) • MY YAHOO! TICKER (beta) • YAHOO! ANTI-SPAM RESOURCE CENTERDOMAINKEYS • SERVICIO ‘FOTOCORREO’ • YAHOO! MESSAGE BOARDS 14
  • 15. 5. DESARROLLO. 5.1. SERVICIOS DE VALOR AÑADIDO - Más en la web del Laboratorio de MSN - • MSN HOTMAIL • MY MSN • MSN MAPAS Y DIRECCIONES (comienzo de gestación del proyecto MSN VIRTUAL EARTH, hoy BING MAPS). • START.COM • MSN GRUPOS • MSN NEWSBOT • MSN SPACES • MSR NETSCAN - USENET SOCIAL ACCOUNTING SEARCH ENGINE • MSN Toolbar • MSN Mobile • MSN Messenger 15
  • 16. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO INTRODUCCIÓN  ¿Qué considero “características de búsqueda?  Resultados de búsquedas numerados con plugin para el navegador Mozilla Firefox en el caso de Google.  Código de hipervínculo con los enlaces patrocinados.  Servidores con versiones del portal no sincronizadas tanto en Herramientas de idioma como con el filtro Google Safe.  Búsqueda Avanzada.  Cada buscador tiene sus recomendaciones en su ayuda para fomentar el posicionamiento en la indexación de cara al rastreo. 16
  • 17. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO CARACTERÍSTICAS DE BÚSQUEDA • • • • • • • • • • • • • • Búsqueda de sinónimos Búsquedas de libros Información meteorológica Q&A Información bursátil (stock quotes) Results Prefetching Mapas de calles Titulares de noticias Conversor de divisas Calculadora Traducción de páginas web Búsqueda de archivos en diferentes formatos Vínculos en caché Páginas similares • • • • • • 17 • • • • • • • Trackback (o vínculos recibidos) Restricción de dominio Voy a tener suerte (búsqueda "con confianza" o de lanzamiento automático) Exclusión de palabras Búsqueda de frases literales Consultas automáticas que incluyen "and" Términos de búsqueda en contexto Definiciones (Google Glossary) Corrector ortográfico Búsquedas múltiples Búsqueda por rangos numéricos Uso de comodines Directorio: búsqueda por categorías
  • 18. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • inurl: link: location: (sólo funciona en Google News) msgid: (sólo funciona en Google Groups) movie: phonebook: related: rphonebook: site: source: (sólo funciona en Google News) stocks: store: (sólo funciona en Froogle) Operadores especiales: allinanchor: allintext: allintitle: allinurl: author: (sólo funciona en Google Groups) bphonebook: cache: datarange: define: filetype: (= ext) group: (sólo funciona en Google Groups. Nota: Google no distingue mayúsculas de minúsculas, ni las tildes, ni realiza búsquedas con operadores de truncamiento (parciales). funciona también como groups) inanchor: info: id: insubject: (sólo funciona en Google Groups) intext: intitle: 18
  • 19. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO RASTREO GoogleBot • Es el robot principal que utiliza Google para 'rastrear' los sitios de Internet. No solamente indexa páginas web (HTML), sino que también extrae información de ficheros PDF, PS, XLS, DOC y algunos otros más. • Su capacidad de rastreo influye mucho. Basado en servidores Linux y con una arquitectura tecnológica de Intel y altas cantidades de memoria RAM, además de hacer uso de caché en la mayor parte del índice para evitar escrituras innecesarias en discos duros, es capaz de admitir tantas búsquedas simultáneas a nivel mundial. 19
  • 20. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO GoogleBot • Sus algoritmos están implementados por multitud de criterios o factores (Google tiene unos 100 y es un secreto que mantienen bastante bien guardado pues no les interesa dar pistas a los spammers). • De cualquier manera, podemos intuir que pueden ser factores o indicadores de relevancia: la frecuencia de actualización, webs que no contengan residuos para tratar de engañar a un buscador, el peso de la página, los metadatos o metaetiquetas (cuantos más se tengan, mejor indexada estará la página en su directorio u otro en teoría, al estar más completa la descripción y detallada, sobre todo si ellos la dan por válida) y el PageRank que se mide por el número de enlaces que se reciben de otras páginas, o lo que es lo mismo, la que apuntan a una determinada web, para que suba más alto en la escala de cara al posicionamiento. 20
  • 21. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO CARACTERÍSTICAS DE BÚSQUEDA • • • • • • • Feeds para las noticias, pero sin el icono como en MSN. Búsqueda contextual o relacionada (Y!Q Search Beta), de lo que no dispone aún Google ni MSN. Directorio Yahoo!: un clásico renovado, con dos modalidades: una gratuita que no garantiza la inclusión, y otra que sí lo hace a cambio de 299 dólares). Página de resultados de búsqueda Incluir palabras/Excluir palabras Cualquiera/OR: Si una persona está interesada por igual en dos o más alternativas, debe usar el operador booleano OR. Por ejemplo, podemos querer buscar "rock alternativo OR progresivo". Orden de las palabras Para buscar una frase exacta, sólo hay que poner entre comillas dos o más palabras. Por ejemplo, "No por mucho madrugar" (escribiendo las comillas en el cajetín de búsqueda). 21
  • 22. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Búsquedas relacionadas A veces también se reciben sugerencias. Si otros usuarios de Yahoo! han buscado algo parecido, los enlaces a estas búsquedas relacionadas aparecerán bajo el cajetín en la parte superior de la página de resultados. • Atajos Yahoo! Los atajos de Yahoo! ayudan a encontrar lo que se busca instantáneamente. Cuando se usan, la información buscada aparece de inmediato en la página de resultados. Para el conversor de divisas, la palabra clave es cambio de divisas. Para móviles, la palabra clave es melodías (seguida del nombre de un artista). Para noticias, la palabra es noticias (seguida de un tema). Para noticias deportivas, debes introducir el 'nombre de un equipo de fútbol'. • Categorías relacionadas/Categorías del Directorio Las Categorías son conjuntos de sitios que nuestros editores han revisado y organizado por temas en el Directorio Yahoo! Te pueden ser útiles a la hora de definir una búsqueda o de encontrar algo en lo que no se había pensado previamente. 22
  • 23. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Todo Internet Estos resultados son una combinación de páginas y sitios webs relevantes provistos por Yahoo!, no controlan su contenido lógicamente. • Preferencias de Búsqueda: Nueva Ventana, Filtro de Búsqueda Segura e Idioma. · Estricto • Yahoo! Búsqueda Segura · Moderado (predeteminado) · Desactivado • Búsqueda avanzada: La Búsqueda Avanzada nos ayuda a encontrar sitios que responden a criterios muy específicos. Las opciones que elijas se aplicarán sólo a la búsqueda que realices en ese momento. 23
  • 24. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Fecha • Dominio • País • Idioma • Número de resultados • Buscar por URL • Podemos restringir la búsqueda según el tipo de documento que necesitas. Buscar por Formato Los formatos que que aceptan este filtro son: • .htm, .html - HTML estándar •. pdf - Adobe PDF •. xls - Microsoft Excel •. ppt - Microsoft PowerPoint • .doc - Microsoft Word • .xml, .rdf, .rss - Feeds de RSS o XML • .txt - Formato de texto 24
  • 25. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Búsqueda de Imágenes La Búsqueda de Imágenes de Yahoo! funciona con un motor de búsqueda externo que nos permite buscar entre millones de imágenes en la Web. Búsqueda Avanzada de Imágenes: • • • • • Tamaño Tipo de archivo Color Dominio Contenido adulto 25
  • 26. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Yahoo! Search Vídeo (http://video.search.yahoo.com) Yahoo! Search Vídeo permite buscar entre millones de archivos de vídeo en toda la Web. Para comenzar a usar Yahoo! Search Vídeo, se acude a la URL de arriba para después introducir la descripción de lo que quieres encontrar en el cajetín de búsquedas. Por ejemplo, si se necesitan vídeos de gatos, teclea "gatos" en el cajetín y pulsa el botón de "Búsquedas". Para limitar la búsqueda a vídeos de un determinado tamaño o formato, usa la Búsqueda Avanzada de Vídeo. Las páginas de resultados mostrarán 20 miniaturas (imágenes reducidas) por página. 26
  • 27. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Yahoo! Search Vídeo (http://video.search.yahoo.com) Búsqueda Avanzada de Vídeo: Las opciones elegidas sólo se aplicarán a la búsqueda que se realizan en ese momento. Describo el primer campo y enumero los demás:  Buscar Para obtener resultados más precisos, este cajetín de texto permite darle a Yahoo! Search Vídeo instrucciones precisas sobre los términos que introduces. Podemos usar símbolos como +, - y " " (comillas) para definir mejor nuestra búsqueda. Por ejemplo: Quieres ver vídeos de Jennifer Aniston sin Brad Pitt. Escribe +"Jennifer Aniston" -"Brad Pitt" en el cajetín "Buscar". El resto de campos son: Formato Tamaño Duración Filtro de Búsqueda Segura Sitio/Dominio 27
  • 28. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO RASTREO • Yahoo! dispone desde no hace muchos meses de un nuevo rastreador, llamado Slurp, que literalmente significa 'absorber ruidosamente'. Al igual que Google tiene un PageRank, Yahoo! tiene un webrank. • Los webmasters pueden activar el 'If-Modified-Since' en las opciones de su servidor web. De esta manera, le podrán decir a los robots de los buscadores y a los navegadores si su contenido se ha modificado desde la última vez que visitaron una determinada página. Si no es así, estas aplicaciones utilizarán su caché y no gastarán ancho de banda del servidor Web. • Por último, Yahoo! también recomienda utilizar la directiva 'crawl-delay' dentro del fichero 'robots.txt' del servidor web. Esta directiva solo está soportada por los buscadores de Yahoo! y de MSN, y recuerda al robot que debe volver a visitar un determinado sitio web al cabo de un cierto número de segundos como mínimo. 28
  • 29. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO CARACTERÍSTICAS DE BÚSQUEDA • Consultas enciclopédicas dadas por su producto Encarta. Cuando esto ocurre, aparece el icono “ ”. lo puedo saber, luego por eso lo indico) para consultarla, que por cierto han incluido un enlace dentro de su interfaz. • Otra novedad (y que no tiene ni Google ni Yahoo!) es el operador contains: lo que hace es buscar sitios Web que contengan vínculos a la extensión del nombre del archivo que se ha especificado. • MSN Search Local, en fase beta. • Búsquedas agrupadas (o Search Result Clustering): es un proyecto del laboratorio de investigación de Asia, según indica la barra de título de la dirección http://rwsm.directtaps.net, que en realidad también funciona con una barra de herramientas). Se trata como es lógico de un proyecto en fase beta o preliminar. 29
  • 30. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • La sindicación RSS es otra aportación que ofrece este renovado buscador, con el popular icono “ ”, a diferencia de Yahoo!, que requeriría el uso de un script para su visualización. • Otra novedad es un 'busca-imágenes', localizable en www.picsearch.com, gracias a la adquisición de esa empresa. Se verá con el tiempo cómo lo integran. • Interfaz agradable y para refinar resultados contiene un menú desplegable que hay en el botón "Generador de búsqueda" (que equivale a la búsqueda avanzada). • Lo superficial está cubierto con un diseño mediocre pero bien accesible y usable; las novedades superaron las expectativas que se tenían puestas. 30
  • 31. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO * INTEGRACIÓN: – Las novedades que trae en su interfaz y en los resultados, los pierde en su punto fuerte: La "integración" con las "propiedades" de Microsoft. Digo, integra los resultados con el "Desktop" pero para eso hay que instalar la MSN Toolbar; integra resultados en el MSN Messenger, pero para eso hay que configurarlo, etc. – Pero lo realmente interesante es que por ejemplo, se busca, What is Michelangelos known for? y sí, algunas cosas hay que probarlas en ingles y la primer respuesta es: Por pintar la capilla sixtina. – MSN Search lleva a cabo la ideología EEE (embrace, extend and extinguish), tan característica de ellos y llevada a su máxima expresión. – Al menos la conversión a CSS y XHTML de MSN sirve como un argumento sólido para intentar fomentar los estándares, pues todavía hay mucha resistencia entre los usuarios. 31
  • 32. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO RASTREO • En la web del portal MSN existe una ayuda bastante interesante a tener en cuenta de cara al posicionamiento, y en la que se invita a aplicar unas sugerencias que podrán ayudar a MSNBot (que es lógicamente como se llama el rastreador de Microsoft) y a otros rastreadores Web para indizar y clasificar tu sitio eficazmente. Además, proporcionan una lista de elementos y técnicas recomendados por MSN Search, como hace también Yahoo! y Google. • No hay mucha información sobre cada cuánto tiempo rastrea MSN la Web, hay mucha contradicción al respecto, pero todo parece indicar que lo están haciendo últimamente con bastante cierta frecuencia. • De todas formas, según hemos podido ver en las prácticas de la asignatura troncal "Técnicas y métodos avanzados en recuperación de información", MSN sale mal parado tanto en valor medio aproximado de la efectividad de la recuperación de información (medida de Borko, aplicando I0=E + P) como en la similitud, con un 74% de resultados iguales aplicando en el mismo motor una búsqueda con 'intersección' y otra con 'intersección+frase literal'. 32
  • 33. 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Según indica su ayuda, "no existe la posibilidad de pagar para aumentar la relevancia de tu sitio en la clasificación", sino que se realiza de forma totalmente automatizada. • El algoritmo de clasificación de MSN Search analiza factores como el contenido de las páginas, la cantidad y calidad de los sitios que tienen vínculos con nuestras páginas y la relevancia del contenido de tu sitio con respecto a palabras clave. Se trata de un algoritmo complejo y sin intervención humana. • Para más información sobre posicionamiento visitar su sitio de ayuda en español en http://search.msn.es/docs/default.aspx? FORM=HLHP. 33
  • 34. 5. DESARROLLO 5.3. COMPARATIVA DE S.V.A. Nota: Datos a fecha de julio de 2005. LEYENDA: E-mail (1), barra de herramientas (2), directorio de catálogos de pedidos (3), servicio de alertas de páginas afines a un criterio de búsqueda (4), noticias de actualidad en tiempo real (5), gestor de grupos -o listas de correo- (6), traductor multilingüe (7), servicio de bitácoras (8), gestor de historiales de búsquedas (9), servicio de expertos -consultoría de recursos digitales- (10), códigos abiertos API (11), sistema (programa) de mensajería instantánea (12), barra en escritorio de búsqueda de contenido (13), representación de callejeros y mapas (14), búsqueda local (15), búsqueda en libros (16), acelerador web (17), servicios online desde móvil, PDA o PocketPC (18), buscador de productos comerciales con comparación de precios para cada tienda virtual (19), personalización del portal (20), búsqueda personalizada según perfiles de interés (21), generador de términos de búsqueda taxonómicos (22) y sugerencias de búsqueda en tiempo real (23). 34
  • 35. 5. DESARROLLO 5.4. COMPARATIVA DE CARACTERÍSTICAS DE BÚSQUEDA Nota: Datos a fecha de julio de 2005. LEYENDA: Búsqueda agrupada -clustering- (1), búsqueda por frase literal (2), páginas caché (3), búsqueda de imágenes (4), búsqueda de vídeos (5), búsqueda por formato (6), búsqueda por truncamiento -o de exactitud- (7), búsquedas por operadores posicionales y/o por campos (8), influencia o sensibilidad en los resultados a las tildes (9), directorio Web (10), soporte parcial de indexación SWF o tecnología multimedia Flash (11), calculadora (12), búsqueda contextual (13), sugerencias de búsquedas alternativas o relacionadas (14), búsqueda estilo glosario, de diccionario o enciclopedia (15), búsqueda por códigos especiales de patentes (16), páginas similares (17), refinamiento -búsqueda sobre resultados- (18), esquema jerárquico (19), búsquedas numeradas (20), búsqueda por expresiones regulares (o por patrones) (21), corrector ortográfico (22), soporte o implementación de RSS (23), filtro de búsqueda segura (24), clasificación de resultados por diferentes criterios combinados (25), búsquedas de sinónimos (26) y URL's adicionales de un dominio (27). 35
  • 36. 6. CONCLUSIONES (I)  Las empresas de Internet se encuentran en un mundo muy dinámico y un mercado muy cambiante, con la imparable adquisición de nuevas empresas y más con la salida a Bolsa del gigante Google, que es de las que más cotizan. Ya se sabe, si no se puede con el enemigo, lo mejor es unirse a él (si se deja).  Trayectora de crecimiento de la empresa determina muchas veces que se vea mermada la calidad de muchos productos/servicios.  La competencia beneficia al usuario final, salvo cuando no se establecen los límites y se descontrola la adquisición de empresas. Todo tiene un límite.  Tendencia a la integración de servicios en un solo portal; plataformas engloban a otras.  Pese a la competencia, aunque admitan sugerencias de los usuarios, las estadísticas “ciegan”: no dejan ver la realidad de las cosas, se centran más en el mercado que en los propios usuarios.  Tecnología incierta, pendiente de madurar.  En indexación queda aún mucho camino por recorrer, debido a la amplia variedad de formatos existentes y tecnologías con protección, que es el caballo de la batalla y el quid de la cuestión. 36
  • 37. 6. CONCLUSIONES (II)  Los buscadores deben prepararse para la Web semántica -como de hecho ya lo están haciendo, aunque sin prisa, por haber tecnologías que primero deben madurar, como ya señalaba-, el futuro de la actual Web, pero aún queda mucho camino por recorrer.  Portalización de los buscadores, gran transformación experimentada en los últimos años. Necesidad de poner orden y concierto a las APIs creadas.  Cada empresa improvisa su prioridad lanzando o respondiendo enfoques de ideas, aunque no sean originales y tardías por centrarse en otras parcelas.  Juegan con la ley de la ventaja e intentan cubrirse huecos y complementarse para intentar ganar terreno a corto plazo constituyendo para el usuario un valor añadido.  Preferencia del internauta del “buscador” frente al ‘directorio’.  Proliferación en cadena de los laboratorios de investigación de estas empresas a disposición del usuario para productos/servicios en fase beta. 37
  • 38. 6. CONCLUSIONES (III)  Exceso de lanzamientos de nuevos servicios en versiones beta. Lanzamientos apresurados con tal de no quedarse atrás y ser el pionero en Nuevas Tecnologías. Yahoo subcontrata para no llamar beta a sus productos pero Google no aplica tanto el “outsourcing” y echa manos de recursos propios; de ahí, su tardanza muchas veces. Aunque Google cuenta con un gran equipo.  Necesidad de dotación de mayor infraestructura y personal debido al aumento de número de internautas y poder satisfacer demandas de los usuarios a través de canales de comunicación.  Blogs para divulgar sus avances de laboratorio y lanzamientos experimentales o no.  Yahoo y Microsoft se lo piensan más a la hora de ofertar nuevos servicios y lanzan versiones de nuevas funcionalidades en varios idiomas. El idioma influye en el grado de desarrollo respecto a la prestación de servicios y en la actualización de contenidos, que es discontinua por no sincronizarse las versiones de distintos idiomas de un mismo portal. Y no olvidemos el tema de la censura en China.  Se van acortando distancias entre los tres gigantes. Supremacía clara de Google cada vez menos evidente, aunque siendo el rey indiscutible. 38
  • 39. 6. CONCLUSIONES (IV)  Surgen motores de búsqueda revolucionarios, alternativos a Google con algoritmos innovadores, con criterios de valoración diferentes al Page Rank. Veremos lo que duran estas páginas como Ask Jeeves y Clusty, por citar sólo unos ejemplos.  Resultados de búsqueda procedentes de diferentes bases de datos en algunos casos, como Altavista, debido a la compra de empresas, patentes y tecnologías.  La Web 2.0 va a ocasionar un terrible duelo entre estos tres titanes. Y esto sólo acaba de empezar, ¿quién sabe cómo acabará, si las tecnologías se interconectarán o no, o simplemente cambiará de nombre y filosofía? Por ejemplo Flickr de Yahoo! está ganando terreno claramente en número de registros a Orkut de Google.  El espionaje e intereses ocultos son posibles, pese a muchas cláusulas que leamos y demás letra pequeña. Somos marionetas frente a esas empresas.  Se percibe claramente las intenciones de hacerse con el control de la Web (anárquica hasta ahora y esperemos que dure), cuando la Web no pertenece a nadie, al mismo tiempo que no debe ser censurada. Finalmente, se observa que todo sea hace por número de registros, visitas y por su propio beneficio; de ahí que afilen sus armas y cada vez hayan menos diferencias en las características de búsqueda. 39
  • 40. 6. CONCLUSIONES (V) En fin, de momento, que no se tambalee Google (que su aparición ya de por sí ha supuesto una auténtica revolución en la Red y para nuestras vidas), porque nos tambalearemos todos, pero que tampoco se lo crean, que no es bueno para que prospere la calidad de su índice, que todavía puede mejorar y mucho. Eso sí, temblemos porque Google amenaza con seguir acaparándolo todo, y sobre todo las editoriales y sociedades de autores. En definitiva, que si es bueno, perdure, ya habrá tiempo de ver lo que nos depara el futuro. Unas cuantas citas (las tres últimas personales) para finalizar: 1. En la Internet empresarial quien golpea primero, por lo general, golpea dos veces. 2. Si el príncipe esclarecido y el general competente derrotan al enemigo cada vez que pasan a la acción, si sus hazañas se salen fuera de lo común es gracias a la información previa. Sun Tzu. ‘El arte de la Guerra’, s. VI a.C. 3. Como regla general la persona más exitosa en la vida es aquella que tiene la mejor información. Benjamín Disraeli. 4. La mejor fuente de información son las personas que juran no contarlo a nadie. Anónimo. 5. En un futuro la sociedad se dividirá en dos partes: las que están informatizadas y las que no. 6. Internet es la Tercera Revolución Industrial y tan sólo depende de ti formar parte de la historia. (fin del mensaje). 40
  • 41. 7. REFERENCIAS (I) Nota: Las referencias se han realizado siguiendo la norma internacional ISO 690-2 para publicaciones electrónicas, que constituyen el tipo de fuentes de información empleadas en este trabajo. He hecho una selección de las fuentes más consultadas, aunque no sea del todo exhaustiva.  Google [en línea]. EEUU. <http://www.google.com/options/> [Consulta: 14 abril 2005].  Labs Google [en línea]. EEUU. <http://labs.google.com> [Consulta: 5 mayo 2005].  Yahoo! [en línea]. EEUU. <http://www.yahoo.com> [Consulta: 14 abril 2005].  MSN Sandbox [en línea]. EEUU. <http://sandbox.msn.com> [Consulta: 11 junio 2005].  Google Blog [en línea]. EEUU. <http://googleblog.blogspot.com> [Consulta: 8 mayo 2005].  Yahoo! Search blog [en línea]. EEUU. <http://www.ysearchblog.com> [Consulta: 8 mayo 2005].  msnsearch's WebLog [en línea]. EEUU. <http://blogs.msdn.com/msnsearch/> [Consulta: 8 mayo 2005]. 41
  • 42. 7. REFERENCIAS (II)  Search Engine Watch: Tips About Internet Search Engines & Search Engine Submission [en línea]. EEUU. <http://searchenginewatch.com> [Consulta: 14 abril 2005].  Search Engine Optimization (SEO) Resources in the Yahoo! Directory [en línea]. EEUU. <http://dir.yahoo.com/Computers_and_Internet/Internet/ World_Wide_Web/Site_Announcement_and_Promotion/Search_Engine_Optimi zation__SEO_> [Consulta: 4 febrero 2005].  Googledirson [en línea]. España. <http://google.dirson.com> [Consulta: 5 marzo 2005].  Tramullas.com [en línea]. España. <http://www.tramullas.com> [Consulta: 2 julio 2005].  Posicionamiento en buscadores: guía básica [en línea]. EEUU. <http://www.guia-buscadores.com/posicionamiento/> [Consulta: 12 mayo 2005].  Recuperación de Información en la Web [en línea]. España. <http://irsweb.blogspot.com> [Consulta: 30 mayo 2005].  Google Blogoscoped [en línea]. EEUU. <http://blog.outer-court.com> [Consulta: 12 mayo 2005]. 42
  • 43. 7. REFERENCIAS (III)  Barrapunto: La información que te interesa [en línea]. España. <http://www.barrapunto.com> [Consulta: 10 mayo 2005].  El Blog de Enrique Dans [en línea]. España. <http://www.enriquedans.com> [Consulta: 12 junio 2005].  Google Community [en línea]. EEUU. <http://www.googlecommunity.com> [Consulta: 17 mayo 2005].  Deakialli DocuMental [en línea]. España. <http://deakialli.bitacoras.com> [Consulta: 30 mayo 2005].  Métodos de busca: Cómo buscar información en Internet [en línea]. España. <http://www.metodosdebusca.com> [Consulta: 1 junio 2005].  Error500 [en línea]. España. <http://www.error500.net> [Consulta: 3 abril 2005].  Trucos de Google - buscadores y gestión documental [en línea]. España. <http://trucosdegoogle.blogspot.com> [Consulta: 17 mayo 2005].  Denken Über [en línea]. España. <http://www.uberbin.net> [Consulta: 4 marzo 2005]. 43
  • 44. «Batalla entre los majors: análisis de la lucha por la primacía en la Web» Proyecto Fin de Carrera dirigido por el Dr. D. Francisco Javier Martínez Méndez Universidad de Murcia, 2005 Departamento de Información y Documentación Facultad de Comunicación y Documentación Muchas Gracias a todos