Batalla entre los 'majors': análisis de la lucha por la primacía en la Web
Upcoming SlideShare
Loading in...5
×
 

Batalla entre los 'majors': análisis de la lucha por la primacía en la Web

on

  • 2,631 views

Actualmente Google, MSN y Yahoo! vienen librando una contienda por la primacía en la Web. Esta "lucha" pasa por la inserción de nuevas tecnologías en sus sistemas de búsqueda y por la promoción ...

Actualmente Google, MSN y Yahoo! vienen librando una contienda por la primacía en la Web. Esta "lucha" pasa por la inserción de nuevas tecnologías en sus sistemas de búsqueda y por la promoción de nuevos servicios de valor añadido. Presentación del Proyecto Fin de Carrera entregado el 11 de julio de 2005 para obtener la Licenciatura en Documentación por la Facultad de Comunicación y Documentación de la Universidad de Murcia.

Statistics

Views

Total Views
2,631
Views on SlideShare
2,631
Embed Views
0

Actions

Likes
0
Downloads
7
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Adobe PDF

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

Batalla entre los 'majors': análisis de la lucha por la primacía en la Web Batalla entre los 'majors': análisis de la lucha por la primacía en la Web Presentation Transcript

  • Facultad de Comunicación y Documentación PROYECTO FIN DE CARRERA (P.F.C.) Batalla entre los majors: análisis de la lucha por la primacía en la Web Alumno aspirante al grado de Licenciado en Documentación: Pedro Miguel Álvarez Guillermo
  • ESQUEMA DE MI DEFENSA 1. Introducción 2. Justificación de la investigación 3. Objetivos 4. Metodología 5. Desarrollo 5.1 Servicios de valor añadido 5.2 Características de búsqueda y rastreo 5.3 Comparativa de servicios de valor añadido 5.4 Comparativa de características de búsqueda 6. Conclusiones 7. Referencias. 2
  • 1. INTRODUCCIÓN (I)  Situación histórica: época de los gigantes mediáticos.  Necesidad e interés cada vez más despierto por recuperar la información con eficacia en la Red de Redes, además de la necesidad de informarse, el posicionamiento dentro de los buscadores y el ver quién ofrece los mejores productos y servicios. • Tras la crisis de los portales y empresas puntocom allá por el año 2000 y 2001, cuando se produjo el estallido de la llamada burbuja tecnológica  pero los más grandes sobrevivieron mediante estrategias de marketing, contenidos y de inversión. Estrategia de Yahoo! actualmente está siendo agresiva y cuenta con la experiencia de un portal clásico y con solera. Microsoft (y por ende, MSN) se basa en su monopolio en el mercado del software, debido a su veteranía (existe desde 1975). 3
  • 1. INTRODUCCIÓN (II) Pero la excepción que confirma la regla es Google (es inevitable mencionarlo), que se empezó a popularizar entre la comunidad internauta a partir del año 2000. Y desde entonces no ha habido tregua por hacerse un hueco en la lucha de los buscadores y de los servicios/productos de valor añadido; cada vez ha sido una lidia o pugna más intensa.  Yahoo! y MSN, están respaldados por su experiencia en productos o servicios, por su inversión más o menos racional, marketing y prestigio.  Yahoo!, al abarcar menos terreno que MSN, está más en condiciones éste último de "apretar", pero también de competir fuertemente contra Google. 4
  • 1. INTRODUCCIÓN (III)  Google: líder de audiencia gracias a la popularidad de su motor de búsqueda (su filosofía radica en tener voluntad para innovar y organizar la información mundial, aunque tienen 10 principios muy claros existentes en su web). Luego está claro que son proyectos distintos, con visiones de negocio muy diferentes.  Google se está ahora portalizando. Desde un principio conocemos la filosofía de esta empresa y sabemos que sus principios es la apuesta constante por la calidad de sus servicios y productos. Y al no ser búsquedas en bases de datos factuales sino deterministas, la búsqueda a texto completo es más compleja. 5
  • 1. INTRODUCCIÓN (IV)  Pero tampoco MSN ha estado de brazos cruzados ya que a Microsoft, tras su fracaso allá por el año ’94 con la red Microsoft Network, no está dispuesta a perder el trono en el ámbito cibernético, por la cuenta que le trae, ya que no se puede descuidar ni un momento y por eso no está conforme con la hegemonía de su navegador (que fue gracias al monopolio de Windows y la integración del navegador en dicho sistema operativo); eso pilló de sorpresa a Microsoft, pero que fue un éxito del que supo sacar jugo, si bien el tema de los navegadores ya es otra historia de lidia distinta.  El caso es que Microsoft se ha desecho de los algoritmos de su antiguo motor Inktomi y Overture para poner en marcha su propia tecnología valiéndose del perfeccionamiento de su robot-trasteador de la web, MSNBot, por haber adquirido recientemente la empresa Lookout. 6
  • 2. JUSTIFICACIÓN DE LA INVESTIGACIÓN (I)  De entre los temas propuestos, elegí éste por ser en el que más experiencia tengo y más me atrae de acuerdo a mi trayectoria académica y formativa autodidacta.  He considerado interesante -creo que era el momento idóneo e ideal- elaborar una instantánea sobre cómo está la situación a fecha de julio de 2005 en cuanto a lidia entre los buscadores más importantes: Google, Yahoo! y MSN; todo ello intentando tener el mayor rigor posible y algo de crítica.  En este sentido, he procurado esmerarme tanto en la documentación como en la fiabilidad de lo que leía (si se lee el documento original se podrá percibir algo). También en el anexo, con elementos de valor añadido que explico en la metodología y en el cuerpo del trabajo, teniendo en cuenta anécdotas de declaraciones de directivos de estos gigantes y proyectos abandonados por Google por abarcar tanto y alternativas de métodos de búsqueda o parámetros interesantes, que es algo con lo que disfruto al descubrirlo. 7
  • 2. JUSTIFICACIÓN DE LA INVESTIGACIÓN (II)  No es fácil en esta fecha encontrar una recopilación como la que he pretendido en este trabajo.  Seguramente hay trabajos similares aunque yo los desconozca y habría que ver su metodología si ha sido la misma y si son igual de exhaustivos como aquí se pretendía, con tal de acaparar más  De ahí, el tiempo que ha llevado, requiriendo una puesta al día continuada durante cuatro meses. Pero también he procurado sintetizar descripciones de servicios por motivos de espacio cuando lo requería.  Al menos, éste ha sido mi criterio que expongo, ni mejor ni peor que cualquier otro, sino más a mi manera, y concertado con mi director, pretendiendo hacer un tratamiento integral pero también pormenorizadamente cuando era estrictamente necesario, para no arriesgarse a imprecisiones.  Creo que ha merecido la pena el esfuerzo, lástima que sea algo efímero por la obsolescencia y caduque tan pronto algunos enlaces, por su corta longevidad, y no sabemos en el futuro cómo se llamarán o si existirán estos servicios visto con el mismo concepto. 8
  • 3. OBJETIVOS A. Dar cuenta de los proyectos que están floreciendo en torno a la propia función de búsqueda, debido al estado de apogeo del sector de las búsquedas en materia de características de búsqueda por la inserción de nuevas tecnologías, y todo ello para intentar que se tenga una visión pormenorizada pero a la vez sintética e integradora de lo que se está haciendo en ese sentido. B. Analizar los principales servicios que ofrecen estas empresas para competir en dicho sector y de paso, en el de los portales de Internet, que es lo que se está ahora desarrollando más y a lo que se tiende de nuevo ahora que no caen del todo en el generalismo de un portal horizontal. C. Veremos finalmente cómo los buscadores intentan con sus características de búsqueda facilitarnos en gran medida nuestras consultas informativas para tratar de mitigar el problema de la recuperación mediante texto libre (que algún día se convertirá en recuperación lenguaje natural, cuando la "web semántica" funcione y las páginas estén preparadas para ello (los navegadores ya lo están con el código estándar XML). 9
  • 4. METODOLOGÍA  1ª fase del trabajo: se hizo la descripción de los servicios de valor añadido (SVA) de cada empresa o buscador -aunque no demasiada pormenorizada-.  2ª fase del trabajo: se analizaron las características fundamentales de búsqueda (capacidades y herramientas de búsqueda) y a modo de valor añadido coloqué información tanto personal como extraida de la ayuda de los motores de búsqueda sobre el rastreo y los criterios de posicionamiento que lleva a cabo el buscador en cuestión. En una tercera y última fase integradora, más completa pero sintética, se construyó la tabla comparativa de evaluación de los aspectos tratados en cada una de las dos fases anteriores. − Anexo: para dotar de algo de "frescura" al trabajo, he considerado conveniente indicar algunas curiosidades y agregar una selección de noticias de la prensa de Internet sobre todo, respecto a lo que se avecina a día de hoy en este ámbito tan competitivo. Nota: la sintaxis del lenguaje de búsqueda a la hora de establecer los parámetros aparece en el documento original de la Tesis. 10
  • 5. DESARROLLO. 5.1. SERVICIOS DE VALOR AÑADIDO • GOOGLE XHTML (WAP 2.0) • GOOGLE DESKBAR • GOOGLE LOCAL • GOOGLE NEWS • ORKUT • GOOGLE EARTH • GOOGLE PERSONALIZED SEARCH • GOOGLE HOME PERSONALIZED • GOOGLE VIDEO VIEWER • GOOGLE VIDEO SEARCH • GOOGLE DESKTOP SEARCH • GOOGLE GROUPS (v. 2) • GOOGLE ACCOUNTS • GOOGLE SUGGEST (beta) • PICASA • GOOGLE SITEMAPS • BLOGGER • GMAIL • GOOGLE SEARCH APPLIANCE (+ mini) • GOOGLE BROWSER BUTTONS • GOOGLE ACCOUNTS • BÚSQUEDAS TEMÁTICAS ESPECIALES • GOOGLE PRINT • GOOGLE ALERTS (beta) 11
  • 5. DESARROLLO. 5.1. SERVICIOS DE VALOR AÑADIDO OTROS SVA (DESCRITOS SOMERAMENTE): • GOOGLE TOOLBAR • Site-Flavored Google Search (beta) • FROOGLE (y sus variantes) • Versión WAP de Google • GOOGLE COMPUTE • Google-Friends Newsletter • GOOGLE WEB APIs • Google Store • GOOGLE CATALOGUE SEARCH • Google Web Accelerator • GOOGLE ANSWERS • Google Sets • GOOGLE DOWNLOADS • Google Scholar - Más en la web del Laboratorio de Google - 12
  • 5. DESARROLLO. 5.1. SERVICIOS DE VALOR AÑADIDO • YAHOO! NEWS • YAHOO! 360º (beta, integrado) • FLICKR • YAHOO! MAIL • MY YAHOO! SEARCH • YAHOO! LOCAL • YAHOO! MOBILE • YAHOO! MESSENGER • MY YAHOO! • ASK YAHOO! • YAHOO! DEVELOPER OTROS SVA (DESCRITOS SOMERAMENTE): • MYWEB • MY WEB 2.0 (no es de lo mismo) • YAHOO! MAPS • SHOPPING YAHOO! • YAHOO! SMALL BUSINESS • YAHOO! TOOLBAR 6.0 • YAHOO! DESKTOP SEARCH • YAHOO! MÚSICA • YAHOO! MUSIC ENGINE • YAHOO! CINE • YAHOO! SEARCH SUBSCRIPTIONS • YAHOO! BUZZ GAME • YAHOO! FARECHASE 13
  • 5. DESARROLLO. 5.1. SERVICIOS DE VALOR AÑADIDO OTROS SVA SECUNDARIOS (continuación): • YAHOO! MÚSICA • YAHOO! MUSIC ENGINE • YAHOO! CINE • YAHOO! SEARCH SUBSCRIPTIONS - Más en la web del Laboratorio de Yahoo! - • YAHOO! BUZZ GAME • YAHOO! FARECHASE • YAHOO! MINDSET (beta) • MY YAHOO! TICKER (beta) • YAHOO! ANTI-SPAM RESOURCE CENTERDOMAINKEYS • SERVICIO ‘FOTOCORREO’ • YAHOO! MESSAGE BOARDS 14
  • 5. DESARROLLO. 5.1. SERVICIOS DE VALOR AÑADIDO - Más en la web del Laboratorio de MSN - • MSN HOTMAIL • MY MSN • MSN MAPAS Y DIRECCIONES (comienzo de gestación del proyecto MSN VIRTUAL EARTH, hoy BING MAPS). • START.COM • MSN GRUPOS • MSN NEWSBOT • MSN SPACES • MSR NETSCAN - USENET SOCIAL ACCOUNTING SEARCH ENGINE • MSN Toolbar • MSN Mobile • MSN Messenger 15
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO INTRODUCCIÓN  ¿Qué considero “características de búsqueda?  Resultados de búsquedas numerados con plugin para el navegador Mozilla Firefox en el caso de Google.  Código de hipervínculo con los enlaces patrocinados.  Servidores con versiones del portal no sincronizadas tanto en Herramientas de idioma como con el filtro Google Safe.  Búsqueda Avanzada.  Cada buscador tiene sus recomendaciones en su ayuda para fomentar el posicionamiento en la indexación de cara al rastreo. 16
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO CARACTERÍSTICAS DE BÚSQUEDA • • • • • • • • • • • • • • Búsqueda de sinónimos Búsquedas de libros Información meteorológica Q&A Información bursátil (stock quotes) Results Prefetching Mapas de calles Titulares de noticias Conversor de divisas Calculadora Traducción de páginas web Búsqueda de archivos en diferentes formatos Vínculos en caché Páginas similares • • • • • • 17 • • • • • • • Trackback (o vínculos recibidos) Restricción de dominio Voy a tener suerte (búsqueda "con confianza" o de lanzamiento automático) Exclusión de palabras Búsqueda de frases literales Consultas automáticas que incluyen "and" Términos de búsqueda en contexto Definiciones (Google Glossary) Corrector ortográfico Búsquedas múltiples Búsqueda por rangos numéricos Uso de comodines Directorio: búsqueda por categorías
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • inurl: link: location: (sólo funciona en Google News) msgid: (sólo funciona en Google Groups) movie: phonebook: related: rphonebook: site: source: (sólo funciona en Google News) stocks: store: (sólo funciona en Froogle) Operadores especiales: allinanchor: allintext: allintitle: allinurl: author: (sólo funciona en Google Groups) bphonebook: cache: datarange: define: filetype: (= ext) group: (sólo funciona en Google Groups. Nota: Google no distingue mayúsculas de minúsculas, ni las tildes, ni realiza búsquedas con operadores de truncamiento (parciales). funciona también como groups) inanchor: info: id: insubject: (sólo funciona en Google Groups) intext: intitle: 18
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO RASTREO GoogleBot • Es el robot principal que utiliza Google para 'rastrear' los sitios de Internet. No solamente indexa páginas web (HTML), sino que también extrae información de ficheros PDF, PS, XLS, DOC y algunos otros más. • Su capacidad de rastreo influye mucho. Basado en servidores Linux y con una arquitectura tecnológica de Intel y altas cantidades de memoria RAM, además de hacer uso de caché en la mayor parte del índice para evitar escrituras innecesarias en discos duros, es capaz de admitir tantas búsquedas simultáneas a nivel mundial. 19
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO GoogleBot • Sus algoritmos están implementados por multitud de criterios o factores (Google tiene unos 100 y es un secreto que mantienen bastante bien guardado pues no les interesa dar pistas a los spammers). • De cualquier manera, podemos intuir que pueden ser factores o indicadores de relevancia: la frecuencia de actualización, webs que no contengan residuos para tratar de engañar a un buscador, el peso de la página, los metadatos o metaetiquetas (cuantos más se tengan, mejor indexada estará la página en su directorio u otro en teoría, al estar más completa la descripción y detallada, sobre todo si ellos la dan por válida) y el PageRank que se mide por el número de enlaces que se reciben de otras páginas, o lo que es lo mismo, la que apuntan a una determinada web, para que suba más alto en la escala de cara al posicionamiento. 20
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO CARACTERÍSTICAS DE BÚSQUEDA • • • • • • • Feeds para las noticias, pero sin el icono como en MSN. Búsqueda contextual o relacionada (Y!Q Search Beta), de lo que no dispone aún Google ni MSN. Directorio Yahoo!: un clásico renovado, con dos modalidades: una gratuita que no garantiza la inclusión, y otra que sí lo hace a cambio de 299 dólares). Página de resultados de búsqueda Incluir palabras/Excluir palabras Cualquiera/OR: Si una persona está interesada por igual en dos o más alternativas, debe usar el operador booleano OR. Por ejemplo, podemos querer buscar "rock alternativo OR progresivo". Orden de las palabras Para buscar una frase exacta, sólo hay que poner entre comillas dos o más palabras. Por ejemplo, "No por mucho madrugar" (escribiendo las comillas en el cajetín de búsqueda). 21
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Búsquedas relacionadas A veces también se reciben sugerencias. Si otros usuarios de Yahoo! han buscado algo parecido, los enlaces a estas búsquedas relacionadas aparecerán bajo el cajetín en la parte superior de la página de resultados. • Atajos Yahoo! Los atajos de Yahoo! ayudan a encontrar lo que se busca instantáneamente. Cuando se usan, la información buscada aparece de inmediato en la página de resultados. Para el conversor de divisas, la palabra clave es cambio de divisas. Para móviles, la palabra clave es melodías (seguida del nombre de un artista). Para noticias, la palabra es noticias (seguida de un tema). Para noticias deportivas, debes introducir el 'nombre de un equipo de fútbol'. • Categorías relacionadas/Categorías del Directorio Las Categorías son conjuntos de sitios que nuestros editores han revisado y organizado por temas en el Directorio Yahoo! Te pueden ser útiles a la hora de definir una búsqueda o de encontrar algo en lo que no se había pensado previamente. 22
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Todo Internet Estos resultados son una combinación de páginas y sitios webs relevantes provistos por Yahoo!, no controlan su contenido lógicamente. • Preferencias de Búsqueda: Nueva Ventana, Filtro de Búsqueda Segura e Idioma. · Estricto • Yahoo! Búsqueda Segura · Moderado (predeteminado) · Desactivado • Búsqueda avanzada: La Búsqueda Avanzada nos ayuda a encontrar sitios que responden a criterios muy específicos. Las opciones que elijas se aplicarán sólo a la búsqueda que realices en ese momento. 23
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Fecha • Dominio • País • Idioma • Número de resultados • Buscar por URL • Podemos restringir la búsqueda según el tipo de documento que necesitas. Buscar por Formato Los formatos que que aceptan este filtro son: • .htm, .html - HTML estándar •. pdf - Adobe PDF •. xls - Microsoft Excel •. ppt - Microsoft PowerPoint • .doc - Microsoft Word • .xml, .rdf, .rss - Feeds de RSS o XML • .txt - Formato de texto 24
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Búsqueda de Imágenes La Búsqueda de Imágenes de Yahoo! funciona con un motor de búsqueda externo que nos permite buscar entre millones de imágenes en la Web. Búsqueda Avanzada de Imágenes: • • • • • Tamaño Tipo de archivo Color Dominio Contenido adulto 25
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Yahoo! Search Vídeo (http://video.search.yahoo.com) Yahoo! Search Vídeo permite buscar entre millones de archivos de vídeo en toda la Web. Para comenzar a usar Yahoo! Search Vídeo, se acude a la URL de arriba para después introducir la descripción de lo que quieres encontrar en el cajetín de búsquedas. Por ejemplo, si se necesitan vídeos de gatos, teclea "gatos" en el cajetín y pulsa el botón de "Búsquedas". Para limitar la búsqueda a vídeos de un determinado tamaño o formato, usa la Búsqueda Avanzada de Vídeo. Las páginas de resultados mostrarán 20 miniaturas (imágenes reducidas) por página. 26
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Yahoo! Search Vídeo (http://video.search.yahoo.com) Búsqueda Avanzada de Vídeo: Las opciones elegidas sólo se aplicarán a la búsqueda que se realizan en ese momento. Describo el primer campo y enumero los demás:  Buscar Para obtener resultados más precisos, este cajetín de texto permite darle a Yahoo! Search Vídeo instrucciones precisas sobre los términos que introduces. Podemos usar símbolos como +, - y " " (comillas) para definir mejor nuestra búsqueda. Por ejemplo: Quieres ver vídeos de Jennifer Aniston sin Brad Pitt. Escribe +"Jennifer Aniston" -"Brad Pitt" en el cajetín "Buscar". El resto de campos son: Formato Tamaño Duración Filtro de Búsqueda Segura Sitio/Dominio 27
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO RASTREO • Yahoo! dispone desde no hace muchos meses de un nuevo rastreador, llamado Slurp, que literalmente significa 'absorber ruidosamente'. Al igual que Google tiene un PageRank, Yahoo! tiene un webrank. • Los webmasters pueden activar el 'If-Modified-Since' en las opciones de su servidor web. De esta manera, le podrán decir a los robots de los buscadores y a los navegadores si su contenido se ha modificado desde la última vez que visitaron una determinada página. Si no es así, estas aplicaciones utilizarán su caché y no gastarán ancho de banda del servidor Web. • Por último, Yahoo! también recomienda utilizar la directiva 'crawl-delay' dentro del fichero 'robots.txt' del servidor web. Esta directiva solo está soportada por los buscadores de Yahoo! y de MSN, y recuerda al robot que debe volver a visitar un determinado sitio web al cabo de un cierto número de segundos como mínimo. 28
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO CARACTERÍSTICAS DE BÚSQUEDA • Consultas enciclopédicas dadas por su producto Encarta. Cuando esto ocurre, aparece el icono “ ”. lo puedo saber, luego por eso lo indico) para consultarla, que por cierto han incluido un enlace dentro de su interfaz. • Otra novedad (y que no tiene ni Google ni Yahoo!) es el operador contains: lo que hace es buscar sitios Web que contengan vínculos a la extensión del nombre del archivo que se ha especificado. • MSN Search Local, en fase beta. • Búsquedas agrupadas (o Search Result Clustering): es un proyecto del laboratorio de investigación de Asia, según indica la barra de título de la dirección http://rwsm.directtaps.net, que en realidad también funciona con una barra de herramientas). Se trata como es lógico de un proyecto en fase beta o preliminar. 29
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • La sindicación RSS es otra aportación que ofrece este renovado buscador, con el popular icono “ ”, a diferencia de Yahoo!, que requeriría el uso de un script para su visualización. • Otra novedad es un 'busca-imágenes', localizable en www.picsearch.com, gracias a la adquisición de esa empresa. Se verá con el tiempo cómo lo integran. • Interfaz agradable y para refinar resultados contiene un menú desplegable que hay en el botón "Generador de búsqueda" (que equivale a la búsqueda avanzada). • Lo superficial está cubierto con un diseño mediocre pero bien accesible y usable; las novedades superaron las expectativas que se tenían puestas. 30
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO * INTEGRACIÓN: – Las novedades que trae en su interfaz y en los resultados, los pierde en su punto fuerte: La "integración" con las "propiedades" de Microsoft. Digo, integra los resultados con el "Desktop" pero para eso hay que instalar la MSN Toolbar; integra resultados en el MSN Messenger, pero para eso hay que configurarlo, etc. – Pero lo realmente interesante es que por ejemplo, se busca, What is Michelangelos known for? y sí, algunas cosas hay que probarlas en ingles y la primer respuesta es: Por pintar la capilla sixtina. – MSN Search lleva a cabo la ideología EEE (embrace, extend and extinguish), tan característica de ellos y llevada a su máxima expresión. – Al menos la conversión a CSS y XHTML de MSN sirve como un argumento sólido para intentar fomentar los estándares, pues todavía hay mucha resistencia entre los usuarios. 31
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO RASTREO • En la web del portal MSN existe una ayuda bastante interesante a tener en cuenta de cara al posicionamiento, y en la que se invita a aplicar unas sugerencias que podrán ayudar a MSNBot (que es lógicamente como se llama el rastreador de Microsoft) y a otros rastreadores Web para indizar y clasificar tu sitio eficazmente. Además, proporcionan una lista de elementos y técnicas recomendados por MSN Search, como hace también Yahoo! y Google. • No hay mucha información sobre cada cuánto tiempo rastrea MSN la Web, hay mucha contradicción al respecto, pero todo parece indicar que lo están haciendo últimamente con bastante cierta frecuencia. • De todas formas, según hemos podido ver en las prácticas de la asignatura troncal "Técnicas y métodos avanzados en recuperación de información", MSN sale mal parado tanto en valor medio aproximado de la efectividad de la recuperación de información (medida de Borko, aplicando I0=E + P) como en la similitud, con un 74% de resultados iguales aplicando en el mismo motor una búsqueda con 'intersección' y otra con 'intersección+frase literal'. 32
  • 5. DESARROLLO 5.2. CARACTERÍSTICAS DE BÚSQUEDA Y RASTREO • Según indica su ayuda, "no existe la posibilidad de pagar para aumentar la relevancia de tu sitio en la clasificación", sino que se realiza de forma totalmente automatizada. • El algoritmo de clasificación de MSN Search analiza factores como el contenido de las páginas, la cantidad y calidad de los sitios que tienen vínculos con nuestras páginas y la relevancia del contenido de tu sitio con respecto a palabras clave. Se trata de un algoritmo complejo y sin intervención humana. • Para más información sobre posicionamiento visitar su sitio de ayuda en español en http://search.msn.es/docs/default.aspx? FORM=HLHP. 33
  • 5. DESARROLLO 5.3. COMPARATIVA DE S.V.A. Nota: Datos a fecha de julio de 2005. LEYENDA: E-mail (1), barra de herramientas (2), directorio de catálogos de pedidos (3), servicio de alertas de páginas afines a un criterio de búsqueda (4), noticias de actualidad en tiempo real (5), gestor de grupos -o listas de correo- (6), traductor multilingüe (7), servicio de bitácoras (8), gestor de historiales de búsquedas (9), servicio de expertos -consultoría de recursos digitales- (10), códigos abiertos API (11), sistema (programa) de mensajería instantánea (12), barra en escritorio de búsqueda de contenido (13), representación de callejeros y mapas (14), búsqueda local (15), búsqueda en libros (16), acelerador web (17), servicios online desde móvil, PDA o PocketPC (18), buscador de productos comerciales con comparación de precios para cada tienda virtual (19), personalización del portal (20), búsqueda personalizada según perfiles de interés (21), generador de términos de búsqueda taxonómicos (22) y sugerencias de búsqueda en tiempo real (23). 34
  • 5. DESARROLLO 5.4. COMPARATIVA DE CARACTERÍSTICAS DE BÚSQUEDA Nota: Datos a fecha de julio de 2005. LEYENDA: Búsqueda agrupada -clustering- (1), búsqueda por frase literal (2), páginas caché (3), búsqueda de imágenes (4), búsqueda de vídeos (5), búsqueda por formato (6), búsqueda por truncamiento -o de exactitud- (7), búsquedas por operadores posicionales y/o por campos (8), influencia o sensibilidad en los resultados a las tildes (9), directorio Web (10), soporte parcial de indexación SWF o tecnología multimedia Flash (11), calculadora (12), búsqueda contextual (13), sugerencias de búsquedas alternativas o relacionadas (14), búsqueda estilo glosario, de diccionario o enciclopedia (15), búsqueda por códigos especiales de patentes (16), páginas similares (17), refinamiento -búsqueda sobre resultados- (18), esquema jerárquico (19), búsquedas numeradas (20), búsqueda por expresiones regulares (o por patrones) (21), corrector ortográfico (22), soporte o implementación de RSS (23), filtro de búsqueda segura (24), clasificación de resultados por diferentes criterios combinados (25), búsquedas de sinónimos (26) y URL's adicionales de un dominio (27). 35
  • 6. CONCLUSIONES (I)  Las empresas de Internet se encuentran en un mundo muy dinámico y un mercado muy cambiante, con la imparable adquisición de nuevas empresas y más con la salida a Bolsa del gigante Google, que es de las que más cotizan. Ya se sabe, si no se puede con el enemigo, lo mejor es unirse a él (si se deja).  Trayectora de crecimiento de la empresa determina muchas veces que se vea mermada la calidad de muchos productos/servicios.  La competencia beneficia al usuario final, salvo cuando no se establecen los límites y se descontrola la adquisición de empresas. Todo tiene un límite.  Tendencia a la integración de servicios en un solo portal; plataformas engloban a otras.  Pese a la competencia, aunque admitan sugerencias de los usuarios, las estadísticas “ciegan”: no dejan ver la realidad de las cosas, se centran más en el mercado que en los propios usuarios.  Tecnología incierta, pendiente de madurar.  En indexación queda aún mucho camino por recorrer, debido a la amplia variedad de formatos existentes y tecnologías con protección, que es el caballo de la batalla y el quid de la cuestión. 36
  • 6. CONCLUSIONES (II)  Los buscadores deben prepararse para la Web semántica -como de hecho ya lo están haciendo, aunque sin prisa, por haber tecnologías que primero deben madurar, como ya señalaba-, el futuro de la actual Web, pero aún queda mucho camino por recorrer.  Portalización de los buscadores, gran transformación experimentada en los últimos años. Necesidad de poner orden y concierto a las APIs creadas.  Cada empresa improvisa su prioridad lanzando o respondiendo enfoques de ideas, aunque no sean originales y tardías por centrarse en otras parcelas.  Juegan con la ley de la ventaja e intentan cubrirse huecos y complementarse para intentar ganar terreno a corto plazo constituyendo para el usuario un valor añadido.  Preferencia del internauta del “buscador” frente al ‘directorio’.  Proliferación en cadena de los laboratorios de investigación de estas empresas a disposición del usuario para productos/servicios en fase beta. 37
  • 6. CONCLUSIONES (III)  Exceso de lanzamientos de nuevos servicios en versiones beta. Lanzamientos apresurados con tal de no quedarse atrás y ser el pionero en Nuevas Tecnologías. Yahoo subcontrata para no llamar beta a sus productos pero Google no aplica tanto el “outsourcing” y echa manos de recursos propios; de ahí, su tardanza muchas veces. Aunque Google cuenta con un gran equipo.  Necesidad de dotación de mayor infraestructura y personal debido al aumento de número de internautas y poder satisfacer demandas de los usuarios a través de canales de comunicación.  Blogs para divulgar sus avances de laboratorio y lanzamientos experimentales o no.  Yahoo y Microsoft se lo piensan más a la hora de ofertar nuevos servicios y lanzan versiones de nuevas funcionalidades en varios idiomas. El idioma influye en el grado de desarrollo respecto a la prestación de servicios y en la actualización de contenidos, que es discontinua por no sincronizarse las versiones de distintos idiomas de un mismo portal. Y no olvidemos el tema de la censura en China.  Se van acortando distancias entre los tres gigantes. Supremacía clara de Google cada vez menos evidente, aunque siendo el rey indiscutible. 38
  • 6. CONCLUSIONES (IV)  Surgen motores de búsqueda revolucionarios, alternativos a Google con algoritmos innovadores, con criterios de valoración diferentes al Page Rank. Veremos lo que duran estas páginas como Ask Jeeves y Clusty, por citar sólo unos ejemplos.  Resultados de búsqueda procedentes de diferentes bases de datos en algunos casos, como Altavista, debido a la compra de empresas, patentes y tecnologías.  La Web 2.0 va a ocasionar un terrible duelo entre estos tres titanes. Y esto sólo acaba de empezar, ¿quién sabe cómo acabará, si las tecnologías se interconectarán o no, o simplemente cambiará de nombre y filosofía? Por ejemplo Flickr de Yahoo! está ganando terreno claramente en número de registros a Orkut de Google.  El espionaje e intereses ocultos son posibles, pese a muchas cláusulas que leamos y demás letra pequeña. Somos marionetas frente a esas empresas.  Se percibe claramente las intenciones de hacerse con el control de la Web (anárquica hasta ahora y esperemos que dure), cuando la Web no pertenece a nadie, al mismo tiempo que no debe ser censurada. Finalmente, se observa que todo sea hace por número de registros, visitas y por su propio beneficio; de ahí que afilen sus armas y cada vez hayan menos diferencias en las características de búsqueda. 39
  • 6. CONCLUSIONES (V) En fin, de momento, que no se tambalee Google (que su aparición ya de por sí ha supuesto una auténtica revolución en la Red y para nuestras vidas), porque nos tambalearemos todos, pero que tampoco se lo crean, que no es bueno para que prospere la calidad de su índice, que todavía puede mejorar y mucho. Eso sí, temblemos porque Google amenaza con seguir acaparándolo todo, y sobre todo las editoriales y sociedades de autores. En definitiva, que si es bueno, perdure, ya habrá tiempo de ver lo que nos depara el futuro. Unas cuantas citas (las tres últimas personales) para finalizar: 1. En la Internet empresarial quien golpea primero, por lo general, golpea dos veces. 2. Si el príncipe esclarecido y el general competente derrotan al enemigo cada vez que pasan a la acción, si sus hazañas se salen fuera de lo común es gracias a la información previa. Sun Tzu. ‘El arte de la Guerra’, s. VI a.C. 3. Como regla general la persona más exitosa en la vida es aquella que tiene la mejor información. Benjamín Disraeli. 4. La mejor fuente de información son las personas que juran no contarlo a nadie. Anónimo. 5. En un futuro la sociedad se dividirá en dos partes: las que están informatizadas y las que no. 6. Internet es la Tercera Revolución Industrial y tan sólo depende de ti formar parte de la historia. (fin del mensaje). 40
  • 7. REFERENCIAS (I) Nota: Las referencias se han realizado siguiendo la norma internacional ISO 690-2 para publicaciones electrónicas, que constituyen el tipo de fuentes de información empleadas en este trabajo. He hecho una selección de las fuentes más consultadas, aunque no sea del todo exhaustiva.  Google [en línea]. EEUU. <http://www.google.com/options/> [Consulta: 14 abril 2005].  Labs Google [en línea]. EEUU. <http://labs.google.com> [Consulta: 5 mayo 2005].  Yahoo! [en línea]. EEUU. <http://www.yahoo.com> [Consulta: 14 abril 2005].  MSN Sandbox [en línea]. EEUU. <http://sandbox.msn.com> [Consulta: 11 junio 2005].  Google Blog [en línea]. EEUU. <http://googleblog.blogspot.com> [Consulta: 8 mayo 2005].  Yahoo! Search blog [en línea]. EEUU. <http://www.ysearchblog.com> [Consulta: 8 mayo 2005].  msnsearch's WebLog [en línea]. EEUU. <http://blogs.msdn.com/msnsearch/> [Consulta: 8 mayo 2005]. 41
  • 7. REFERENCIAS (II)  Search Engine Watch: Tips About Internet Search Engines & Search Engine Submission [en línea]. EEUU. <http://searchenginewatch.com> [Consulta: 14 abril 2005].  Search Engine Optimization (SEO) Resources in the Yahoo! Directory [en línea]. EEUU. <http://dir.yahoo.com/Computers_and_Internet/Internet/ World_Wide_Web/Site_Announcement_and_Promotion/Search_Engine_Optimi zation__SEO_> [Consulta: 4 febrero 2005].  Googledirson [en línea]. España. <http://google.dirson.com> [Consulta: 5 marzo 2005].  Tramullas.com [en línea]. España. <http://www.tramullas.com> [Consulta: 2 julio 2005].  Posicionamiento en buscadores: guía básica [en línea]. EEUU. <http://www.guia-buscadores.com/posicionamiento/> [Consulta: 12 mayo 2005].  Recuperación de Información en la Web [en línea]. España. <http://irsweb.blogspot.com> [Consulta: 30 mayo 2005].  Google Blogoscoped [en línea]. EEUU. <http://blog.outer-court.com> [Consulta: 12 mayo 2005]. 42
  • 7. REFERENCIAS (III)  Barrapunto: La información que te interesa [en línea]. España. <http://www.barrapunto.com> [Consulta: 10 mayo 2005].  El Blog de Enrique Dans [en línea]. España. <http://www.enriquedans.com> [Consulta: 12 junio 2005].  Google Community [en línea]. EEUU. <http://www.googlecommunity.com> [Consulta: 17 mayo 2005].  Deakialli DocuMental [en línea]. España. <http://deakialli.bitacoras.com> [Consulta: 30 mayo 2005].  Métodos de busca: Cómo buscar información en Internet [en línea]. España. <http://www.metodosdebusca.com> [Consulta: 1 junio 2005].  Error500 [en línea]. España. <http://www.error500.net> [Consulta: 3 abril 2005].  Trucos de Google - buscadores y gestión documental [en línea]. España. <http://trucosdegoogle.blogspot.com> [Consulta: 17 mayo 2005].  Denken Über [en línea]. España. <http://www.uberbin.net> [Consulta: 4 marzo 2005]. 43
  • «Batalla entre los majors: análisis de la lucha por la primacía en la Web» Proyecto Fin de Carrera dirigido por el Dr. D. Francisco Javier Martínez Méndez Universidad de Murcia, 2005 Departamento de Información y Documentación Facultad de Comunicación y Documentación Muchas Gracias a todos