• Like
  • Save
Buscador google google imagenes
Upcoming SlideShare
Loading in...5
×
 

Buscador google google imagenes

on

  • 325 views

trabajo de google

trabajo de google

Statistics

Views

Total Views
325
Views on SlideShare
325
Embed Views
0

Actions

Likes
0
Downloads
2
Comments
0

0 Embeds 0

No embeds

Accessibility

Categories

Upload Details

Uploaded via as Microsoft Word

Usage Rights

© All Rights Reserved

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Processing…
Post Comment
Edit your comment

    Buscador google google imagenes Buscador google google imagenes Document Transcript

    • BUSCADOR DE GOOGLE GOOGLE IMÁGENES
    • GOOGLE ALEXANDRA CHACON HERNANDEZ OMAIRA MAMPOTES MONTES LUZ VIVIANA HERRERA SANDRA CABRERA PENCUE SERVICIO NACIONAL DE APRENDIZAJE (SENA) TECNOLOGO ANÁLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIÓN INGENIERIA Y DISEÑO DE SOFTWARE PITAL-HUILA 2012
    • GOOGLE ALEXANDRA CHACON HERNANDEZ OMAIRA MAMPOTES MONTES LUZ VIVIANA HERRERA SANDRA CABRERA PENCUE DIRECTOR: PAULO ANDRES RINCON VIEDA SERVICIO NACIONAL DE APRENDIZAJE (SENA) TECNOLOGO ANÁLISIS Y DESARROLLO DE SISTEMAS DE INFORMACIÓN INGENIERIA Y DISEÑO DE SOFTWARE PITAL-HUILA 2012
    • OBJETIVO GENERAL Ofrecer conocimiento como un proceso multidireccional mediante el cual se transmita información, conciencia y formas de aprender. La educación no sólo se produce a través de la palabra, pues está presente en todas nuestras acciones, vista y actitudes. ESPECIFICOS Dar a conocer un poco de la historia que abarca una de las herramientas más utilizadas de internet, ya que a simple vista no se obtiene un conocimiento a fondo sobre su concepto. Aprender el significado de las palabras que genera una consulta de búsqueda con miles de significados.
    • JUSTIFICACION
    • EL BUSCADOR DE GOOGLE O BUSCADOR WEB DE GOOGLE (en inglés:Google Search) es un motor de búsqueda en la web propiedad de Google Inc., es el motor de búsqueda más utilizado en la Web,1 recibe cientos de millones de consultas cada día a través de sus diferentes servicios.2 El objetivo principal del buscador de Google es buscar texto en las páginas web, en lugar de otro tipo de datos, fue desarrollado originalmente porLarry Page y Sergey Brin en 1997.3 El buscador de Google proporciona al menos 22 características especiales más allá de la palabra original. Estas incluyen sinónimos, previsiones meteorológicas, zonas horarias, cotizaciones de bolsa, mapas, datos sobre terremotos, cartelera de cine, información de aeropuertos, listas de inicio y resultados deportivos. Hay funciones especiales para los números, incluyendo intervalos (70 .. 73), precios, temperaturas, conversiones de unidades y de monedas ("10,5 cm en pulgadas"), cálculos ("3 * 4 + sqrt (6)-pi / 2"), seguimiento de paquetes, patentes, códigos de área telefónico, y traducción de páginas mostradas. El 12 de mayo de 2009, Google anunció que analizaría los micro formatos de hCard, hReview y hProduct para incrementar las páginas de resultados de búsqueda con lo que llamaron "Rich Snippets".6 En junio de 2011, Google introdujo "Google VoiceSearch" y "Google Images", características que permiten a los usuarios buscar palabras al hablar y por imágenes.7 A finales de junio de 2011, Google cambió el diseño de su página principal con el fin de impulsar el uso de herramientas sociales.8 Los enlaces de publicidad, socios de negocios e información de empresas fue llevada al borde inferior del navegador. Uno de los cambios principales fue reemplazar la barra de navegación clásica con una negra. El director creativo digital de Google Chris Wiggins explica: "Estamos trabajando en un proyecto para proporcionarle una experiencia de Google nueva y mejorada y en los próximos meses, seguirán viendo más cambios de nuestra apariencia."9 La nueva barra de navegación fue recibida negativamente por la mayoría.10
    • Al llegar a la página principal del buscador destaca la simplicidad de su interfaz, donde se puede distinguir principalmente su logotipo (cambiante según diversos eventos de distinta índole que puedan ser relevantes) las distintas categorías, el cuadro, los botones y el ámbito de la búsqueda, además de un pequeño menú de opciones. El botón “voy a tener suerte” remite directamente al primer resultado, útil cuando se busca cosas muy populares („Microsoft‟, „Renault‟, „Google‟, etc.) y un botón “búsqueda avanzada” que permite concretar las búsquedas sin necesidad de conocer todos los operadores que ofrece Google. Además de la búsqueda básica, Google tiene múltiples funciones de búsqueda avanzada para refinar las consultas. Búsquedas y operadores simples Las páginas web mantenidas por el Centro de Ayuda de Google tienen textos que describen más de 15 diferentes opciones de búsqueda. Los operadores de Google: Uso de comillas: puede especificar al motor de Google que desea buscar una expresión compuesta de dos o más palabras literalmente, escribiendo los términos a buscar entre comillas. “coches de ocasión” buscará todos los sitios que contengan la expresión "coches de ocasión" textualmente. AND: de forma predeterminada Google se lanza en busca de resultados uniendo las palabras introducidas por el usuario utilizando este operador. Así el resultado final de una búsqueda sin especificar nada o utilizando el operador AND serán los resultados que contengan a la vez la lista de palabras especificada. Las búsquedas "coches AND ocasión" o "coches ocasión" obtendrán los mismos resultados, una lista de los sitios web que contengan la palabra coches y la palabra ocasión. OR o símbolo “|”: Si se desea especificar que no es necesaria la aparición de las dos palabras en cada resultado de la búsqueda, sino cada una de ellas por separado, se deberá especificar el operador OR entre los términos que deban cumplir este criterio. "coches OR ocasión" ahora se obtendrá como resultado una lista de los sitios web que contengan el término coches u ocasión.
    • El operador +: Inclusión forzosa de una palabra, como "Nombre + de + el juego" para forzar que las palabras "de" y "el" aparezcan en la búsqueda. El operador –: permite excluir resultados de la búsqueda. Debe especificarse antes del término a obviar para que se busquen los resultados que no contengan la palabra especificada. "coches –ocasión" buscara los sitios web que contengan la palabra coche pero no ocasión. El operador *: Busca cualquier palabra entre otras palabras específicas. Se pueden asignar distintos ámbitos a los operadores delimitándolos con paréntesis: "(coches OR motos) AND ocasión" buscará todas las webs que contengan la palabra coches o motos y con cualquiera de estas dos es indispensable que aparezca ocasión. Comandos especiales: Definición: El prefijo de consulta "define:" va a dar una definición de las palabras que aparecen después de ella. Stocks: Después de "stocks" los términos de consulta son tratados como símbolos de cotización de valores para la búsqueda. Site: Restringir los resultados con los sitios web en el dominio dado, como por ejemplo, site: www.acmeacme.com.La opción de "site:com" buscará todas las direcciones URL con el nombre de dominio "com". (Sin espacio después de "site:"). Allintitle: Sólo los títulos de páginas serán buscados (no el resto del texto en cada página web). Intitle: Prefijo para buscar en un título de página web, como "intitle:búsqueda de google", aparecerá una lista páginas con la palabra "google" en el título, y la palabra "búsqueda" en cualquier lugar (sin espacio después de "intitle:"). Allinurl: Sólo la dirección URL de las páginas serán buscadas (no el texto dentro de cada página web). Inurl: Prefijo para cada palabra que se encuentra en la URL, es decir que otros son encontrados en cualquier lugar, tales como "inurl:búsqueda cumbre" coincide con
    • "cumbre" en un URL, pero "búsqueda" coincide en cualquier lugar (sin espacio después de "inurl:"). Las opciones de visualización de la página (o tipos de consulta) son los siguientes: Cache: Destaca la búsqueda de palabras dentro del documento en el caché, como "cache:www.google.com xxx" muestra el contenido del caché con la palabra "xxx" sobresaltada. Link: El prefijo "link:" mostrará una lista de páginas web que tienen enlaces a la página web especificada, como por ejemplo "link:www.google.com" listas de páginas web que enlazan con la página principal de Google. Related: El prefijo "related:" mostrará una lista de páginas web que son "similares" a una página web especificada. Info: El prefijo "info:" mostrará alguna información sobre una página web especificada, como por ejemplo, info:www.google.com. Por lo general, la información es el primer texto (160 bytes, cerca de 23 palabras) que figura en la página, se muestra en el formato de resultados. Filetype: los resultados sólo muestran los archivos del tipo deseado (por ejemplo: filetype:pdf volverá archivos pdf) Tenga en cuenta que Google busca en el código HTML dentro de una página web, no la apariencia de la pantalla: las palabras que aparecen en una pantalla no necesariamente tienen que estar en el mismo orden que en el código HTML. Características especiales Además de la principal función de motores de búsqueda de texto, el Buscador de Google tiene más de 22 "características especiales" (que se activa al escribir cualquiera de las docenas de palabras de activación)en la búsqueda: El clima: Las condiciones climáticas, temperatura, viento, humedad y pronóstico, para muchas ciudades, se puede ver escribiendo "clima", junto con una ciudad para las grandes ciudades o ciudad y estado, código postal EE.UU. o de la ciudad y el país de las ciudades más pequeñas (como por ejemplo: clima Lawrence, Kansas, clima de París, clima Bremen, Alemania). Cotizaciones de la bolsa: Los datos del mercado para una compañía específica o fondo se puede ver, escribiendo el símbolo (o incluir "acciones"), tales como: CSCO ; MSFT ; las acciones de IBM; acciones F (listas de Ford Motor Co.), o AIVSX (fondo).Los resultados muestran cambios día a día, o un gráfico de 5 años,
    • etc. Esto no funciona para los nombres de archivo que tienen una sola letra como abreviación, como Citigroup (C) o Macy (M) (Ford es una excepción), o palabras comunes, como por ejemplo Diamond Offshore (DO) o Majesco (COOL). Hora: La hora actual en muchas ciudades (en todo el mundo), pueden ser vistos escribiendo "hora" y el nombre de la ciudad (tales como: hora de El Cairo, hora de Pratt, KS). Resultados deportivos: Las puntuaciones y los horarios, para los equipos deportivos, se pueden mostrar escribiendo el nombre del equipo o nombre de la liga en el cuadro de búsqueda. Conversión de unidades: Las medidas pueden ser convertidas mediante la introducción de cada frase, como por ejemplo: 10,5 cm en pulgadas, o 90 km en millas Conversión de moneda: Un conversor de dinero o moneda puede ser seleccionado, escribiendo los nombres o códigos de moneda (que se enumeran en la norma ISO 4217): 6.789 euros en USD, 150 libras esterlinas en dólares, 5.000 yenes en dólares, 5.000 yuanes en lira (el dólar de EE.UU. puede de USD, o "US$" o "$", mientras que el canadiense es CAD, etc.) Calculadora: Cálculo de los resultados se puede determinar, según los cálculos en vivo, mediante la introducción de una fórmula de números o palabras, como por ejemplo: 6 * 77 + pi + sqrt(e^3)/888 más 0,45.El usuario tiene la opción de buscar por la fórmula después del cálculo. La calculadora también utiliza la unidad y las funciones de conversión de divisas para permitir cálculos de unidad. Por ejemplo, "(3 euros/litro) / (40 millas/galón) en USD / millas", calcula el costo en dólares por milla para un coche de 40 millas por galón de gasolina que cuesta 3 euros por litro. El acento circunflejo "^" plantea un número a un exponente de potencia. También, los porcentajes son permitidos ("40% de los 300"). Existen ciertos debates en cuanto al cálculo de Google de 0 ^ 0. Muchos matemáticos creen que 0 ^ 0 no está definido, pero la calculadora de Google muestra el resultado como 1.30 Rangos numéricos: Un conjunto de números se puede adaptar con un doble de puntos entre los números de serie (70..73 ó 90..100) para adaptarse a cualquier número positivo en el rango. Los números negativos son tratados como el uso de la exclusión del guion para no coincidir con el número. Negative numbers are treated as using exclusion-dash to not match the number.
    • Diccionario de búsqueda: Una definición de una palabra o frase se puede encontrar, mediante la introducción de "definir" seguido de dos puntos y la(s) palabra(s) de búsqueda (por ejemplo, "define: la filosofía") Mapas: Algunos mapas relacionados se pueden mostrar, simplemente introduciendo el nombre o el código postal de los EE.UU. y la palabra "mapa" (tales como: mapa de Nueva York, mapa de Kansas o mapa de París). Sin embargo, actualmente es imposible encontrar ciudades, calles o direcciones que correspondan a un negocio. Cartelera de cine: Comentarios u horarios de películas pueden ser listados para cualquier película que esté en el cine, si escribe "películas" o el nombre de una película en el cuadro de búsqueda. Si un sitio específico se guarda en una búsqueda anterior, el resultado de la búsqueda mostrará horarios de los cines cercanos para esa película. Datos públicos: Tendencias de la población (o las tasas de desempleo) se pueden encontrar para los estados de EE.UU. y los condados, al escribir "población" o "tasa de desempleo", seguido de un nombre de estado o condado. Bienes raíces y viviendas: los listados de un área determinada se puede mostrar usando las palabras "vivienda", "casa" o "bienes inmuebles" seguido del nombre de una ciudad o código postal EE.UU. Datos de viaje / aeropuertos: El estado de los vuelos de llegadas y salidas de vuelos EE.UU. se puede mostrar, simplemente introduciendo el nombre de la aerolínea y el número de vuelo en el cuadro de búsqueda (como por ejemplo: American Airlines 18).Las demoras en un aeropuerto determinado también se puede ver (al escribir el nombre de la ciudad o el código de tres letras del aeropuerto más palabra "aeropuerto"). Seguimiento de paquetes: el correo enviado puede ser rastreado al escribir el número de seguimiento de un correo de Royal Mail, UPS, FedEx o USPS directamente en el cuadro de búsqueda. Los resultados incluirán enlaces para el seguimiento del estado de cada envío. Números de patente: las patentes estadounidenses pueden ser buscadas mediante la introducción de la palabra "patente", seguido por el número de patente en el cuadro de búsqueda (como por ejemplo: Patente 5123123).
    • Código de área: La ubicación geográfica (por cualquier código de área telefónico en los estados unidos) se pueden mostrar escribiendo un código de área de 3 dígitos (por ejemplo: 650). Sinónimo de búsqueda: La búsqueda puede coincidir con palabras similares a las especificadas poniendo el signo "~" inmediatamente delante de un término de búsqueda, tales como: ~ comida rápida. Búsqueda cifrada En mayo de 2010 Google lanzó su sistema de cifrado SSL de búsqueda web.31 La búsqueda cifrada puede ser accedida por encrypted.google.com32 Características El buscador de Google consiste de una serie de sitios web. El más grande de ellos, el sitio google.com, es la página web más visitada del mundo.33 Algunas de sus características incluyen un enlace que proporciona la definición para la mayoría de las búsquedas incluyendo palabras del diccionario, el número de resultados que obtuvo en su búsqueda, enlaces a otras búsquedas (por ejemplo, palabras que Google cree que son incorrectas, le proporciona al usuario un enlace a los resultados de búsqueda utilizando la ortografía propuesta por Google), y muchos más. Google +1 Google +1 ayuda a las personas a descubrir contenido relevante y cuya meta es incrementar los resultados de búsqueda de Google, ofreciendo un estado para mostrarles a las personas si la página es confiable. Cuando un usuario de Google utiliza los resultados de búsqueda de Google mostrará un botón +1 para recomendar la página y una anotación con los nombres de las conexiones de los usuarios que han recomendado su página. Características de la interfaz Fondo blanco y sencillo con cambios de vez en cuando en el título, este cambio ocurre en días con significado histórico o días determinados. La barra superior tiene: Web, imágenes, videos, mapas, noticias, compras, gmail, etc. Búsqueda por voz, permite una búsqueda más rápida que escribiendo, o si la escritura correcta no se conoce.
    • Cuando utilizas tu cuenta de Google, el historial de búsqueda se registra automáticamente. Google Instant, que rápidamente genera búsquedas posibles que contengan los caracteres escritos. Por ejemplo, si escribes Goo, mostraría Google, Google maps, Google Translate... Funciones para comunicación Comparte tus fotos con el mundo. Es posible subir a la web tus fotos. Búsquedas de imágenes con ajustes opcionales, tales como tamaño, color, tipo y clasificación. Búsquedas de vídeos que se conectan a YouTube. También con ajustes opcionales tales como la duración, tiempo, calidad, además de otras fuentes que se relaciona con el tema que usted está buscando. Google bomb A raíz de su importante posición de liderazgo en el mercado, Google es objetivo principal del así llamado spamming contra buscadores. En este sentido se intenta posicionar la mayor cantidad posible de palabras de búsqueda entre los primeros resultados. Estas palabras claves muchas veces no tienen ninguna relación con el contenido real de las páginas. Se utilizan técnicas como Páginas-Doorway, Farm- Links o Page-Cloacking. Esta posibilidad se comprobó por vez primera a la luz de la opinión pública en relación con una Bomba-Google, que estaba orientada al presidente de los Estados Unidos George W. Bush. La palabra de búsqueda "miserable failure" (en castellano: "fracaso miserable") fue enlazada por los adversarios de Bush a la página oficial con la biografía de Bush en la Casa Blanca.34 Como contrapartida intentaron los partidarios de Bush hacer lo mismo contra Michael Moore (director del documental Fahrenheit 9/11). Desde ese momento los primeros puestos varían frecuentemente entre ambos. Las manipulaciones que tienen como objetivo mejorar el ranking de websites especialmente en Google, son consideradas desde ese momento Google- Spamming. Para evitar el abuso, Google cambia su algoritmo con frecuencia.
    • Logotipo (Doodle) En ciertas ocasiones, el logotipo en la página web de Google va a cambiar a una versión especial, conocido como "Google Doodle".Al hacer clic en Doodle, llevará al usuario a una cadena de resultados de búsqueda de Google sobre el tema. El primero fue una referencia al Festival BurningMan en 199835 36 y otros han sido producidos para el cumpleaños de personas notables como Albert Einstein, los acontecimientos históricos como el 50 aniversario del bloque de Lego y días festivos como el Día de San Valentín.37 Consumo de energía Google afirma que cada consulta requiere de alrededor de 1 kJ o 0,0003 kW h.38 Optimización de Google Artículo principal: Posicionamiento en buscadores. Puesto que Google es el buscador más popular, muchos webmasters desean influenciar la clasificación de su sitio web en Google. Una industria de consultores ha surgido para ayudar a los sitios web a aumentar su ranking en Google y en otros motores de búsqueda. Este campo, llamado optimización de motores de búsqueda (SEO en inglés), trata de discernir patrones en los listados de motores de búsqueda y luego desarrollar una metodología para mejorar la clasificación y atraer a más usuarios a los sitios de sus clientes. La optimización de motores de búsqueda abarca tanto factores en la página (como el cuerpo del texto, los elementos del título, los elementos del título y la imagen de los valores del atributo alt) y factores de optimización fuera de la página (como texto de anclaje y el PageRank).La idea general es afectar el algoritmo de relevancia de Google mediante la incorporación de las palabras claves en la página, en particular el título y el cuerpo del texto (nota: mientras más arriba esté en la página, mayor son las posibilidades de la prominencia de palabras clave y por lo tanto, su clasificación). Sin embargo, demasiadas repeticiones de la palabra clave causan que la página para buscar luzca sospechosa para el algoritmo de control Google que evita spam. Google ha publicado una guía para propietarios de sitios web que deseen mejorar su clasificación en el uso de consultores legítimos de optimización
    • Sistema Distribuido Un sistema distribuido es un conjunto de computadoras separadas físicamente y conectadas entre sí por una red de comunicaciones distribuida. Google es uno de los sistemas distribuidos más complejos en uso. Su infraestructura ha satisfecho requisitos necesarios como: escalabilidad, rendimiento, fiabilidad y carácter abierto. Escalabilidad: Google necesita perfeccionar la escalabilidad ya que es un sistema distribuido con varios subsistemas, dando servicio a millones de usuarios. Se encuentra con problemas de escalabilidad en las siguientes dimensiones: Tiene que ir lidiando cada vez con más datos. Lidiar con más peticiones con el crecimiento de usuarios. Busca mejores resultados. Fiabilidad: el sistema debe funcionar en todo momento, sobre todo la funcionalidad de búsqueda que debe estar disponible las 24 horas. Google ofrece un acuerdo de nivel de servicios del 99,9%. Rendimiento: el rendimiento general del sistema es crítico para Google, especialmente para conseguir una latencia baja en las interacciones de usuarios. Cuanto mejor sea el rendimiento, hay más probabilidades de que el usuario vuelva a hacer más búsquedas. Transparencia: hay una gran necesidad de transparencia para soportar el desarrollo de nuevas aplicaciones y la extensibilidad del servicio web. Aspectos del motor de búsqueda Rastreo (crawling) La tarea de un crawler es localizar y obtener los contenidos de la Web y pasar el contenido a subsistemas de indexado. Para ello se utiliza el software Googlebot que, recursivamente, lee una página web dada obteniendo los enlaces y planificando nuevas operaciones de rastreo. La frecuencia de las visitas depende de cuánto cambia la página. Google Caffeine: En agosto de 2009, Google anunció el lanzamiento de una arquitectura de búsqueda nueva, con nombre código "cafeína". La nueva arquitectura fue diseñada para obtener resultados más rápido y funcionar mejor
    • con la información actualizada continuamente de servicios como Facebook y Twitter. Los desarrolladores de Google señalaron que la mayoría de los usuarios no notarían un cambio inmediato, pero invitaron desarrolladores a probar su nuevo motor de búsqueda de manera aislada para proteger el programa. Las diferencias notadas por su impacto en la optimización del motor de búsqueda incluye más ponderación de palabras claves y toma en consideración los años que tiene el dominio. Esta medida fue interpretada por algunos como una respuesta al lanzamiento al mercado de una versión mejorada de un servicio de búsqueda de Microsoft, renombrado a Bing. Google anunció la culminación de "cafeína" el 8 de junio de 2010, declarando que tenían resultados 50% más recientes debido a la continua actualización de su índice. Con "cafeína", Google cambió su plataforma de indexación back-end de MapReduce a BigTable."Cafeína" también se basa en Coloso, o GFS2, una reforma del sistema de distribución de archivos EFP. Con la introducción de Caffeine en 2010, Google pasa a una aproximación más continua con la intención de ofrecer más frescura en términos de resultados de búsqueda. Caffeine utiliza un nuevo servicio de infraestructura llamada Percolator que admite actualización incremental de grandes conjuntos de datos. Indexación Produce un índice de contenidos similar al de un libro. Técnicamente se denomina indexado inverso de palabras que aparecen en páginas web y otros recursos textuales como documentos en .pdf, .doc y otros formatos. No solo guarda la posición, también almacena otra información relevante como el tamaño de fuente y capitalización. Utilizando este índice, se reduce el número de páginas candidatas de miles de millones a unas decenas de miles, según el poder discriminativo de las palabras buscadas. La indexación también mantiene un índice de enlaces, llevando un seguimiento de qué páginas apuntan a una página web. Datos no indexables: A pesar de su índice inmenso, también existe una considerable cantidad de información disponible en bases de datos en línea que se puede acceder por medio de consultas, pero no por enlaces. Esta "Internet profunda" o "Internet invisible" está mínimamente cubierta por Google y otros motores de búsqueda.40 La Internet profunda contiene catálogos de bibliotecas, documentos oficiales legislativos de los gobiernos, guías telefónicas y otros contenidos que son dinámicamente preparados para responder a una consulta.
    • Clasificación (Ranking)El problema con el indexado es que no proporciona información sobre la importancia relativa de las páginas web que contienen un conjunto de palabras clave. Todos los motores de búsqueda modernos tienen una clasificación que indica la importancia de la página y asegura que las más importantes aparecen en los primeros puestos de la lista de resultados. Google utiliza el algoritmo PageRank para decidir la importancia de la página web. Está basado en los sistemas de ranking de las publicaciones científicas, un artículo es importante si ha sido citado por otros colegas del área. El ranking en Google también tiene en cuenta factores relacionados con la proximidad de la búsqueda a las palabras clave de la página obtenidas en el indexado inverso. PageRank: La llegada de Google al éxito fue en gran parte debido a un algoritmo patentado llamado PageRank que ayuda a clasificar las páginas web que coincidan con una cadena de búsqueda.41 Cuando Google era un proyecto de investigación de Stanford, fue apodado BackRub, porque la tecnología comprueba los vínculos para determinar la importancia de un sitio. Los anteriores métodos basados en palabras claves utilizados por muchos motores de búsqueda que fueron una vez más popular que Google, clasificaban las páginas por la frecuencia con que los términos de búsqueda ocurrían en la página o qué tan frecuentemente fueron asociados los términos de búsqueda en cada página de resultados. El algoritmo de PageRank analiza los enlaces generados por el usuario asumiendo que las páginas web enlazadas desde muchas páginas importantes tienen probablemente la misma importancia. El algoritmo calcula una puntuación recursiva de páginas, basado en la suma ponderada del PageRank de las páginas con enlaces a ellos. Se cree que PageRank se correlaciona bien con los conceptos de importancia para las personas. Además de PageRank, Google ha añadido muchos otros criterios no mencionados para determinar la clasificación de las páginas de las listas de resultados, se reportó que hay más de 200 indicadores diferentes.42 43 Los detalles específicos de los cuales se mantienen en secreto para permitirle a Google mantener una ventaja sobre sus competidores a nivel mundial. Arquitectura física adoptada por Google La filosofía de Google en términos de infraestructura física es el uso de un gran número de PCs como base para producir un entorno para computación y
    • almacenamiento distribuido. Típicamente un PC tendrá 2 TB de disco, 16 GB de DRAM y utiliza una versión reducida del kernel de Linux. Estrategias contra fallo: al utilizar PCs de bajo coste, Google reconoce que partes de su infraestructura fallan, y por tanto se han diseñado unas estrategias para tolerar dichos fallos. El origen de fallos más común es debido a software, con unas 20 máquinas que necesitan ser reiniciadas al día manualmente por problemas de software. Los problemas de hardware representan 1/10 de los fallos. El 95% son fallos de disco o de DRAM. Esta información confirma la decisión de utilizar PCs de bajo coste dado el gran número de fallos debidos al software. No merece la pena invertir en PCs más caros. Arquitectura física: está compuesta por los siguientes componentes Los PCs están organizados en racks de entre 40 y 80 equipos. Cada rack tiene un switch de Ethernet que provee conexión en el rack y hacia el exterior. Los racks están organizados en clusters formados por 30 racks o más. Un cluster es una unidad básica de gestión que tiene determinado, por ejemplo, la localización y replicación de servicios. Cada rack está conectado a dos switches de banda ancha para que haya redundancia. Los clusters se encuentran en centros de datos de Google que están repartidos por el mundo. En el 2000 Google tenía dos centros de datos en Silicon Valley y uno en Virgina. Desde entonces el húmero ha aumentado significantemente y hay centros de datos en Estados Unidos, Irlanda, Bélgica, Japón, China, etc. Capacidad de almacenamiento: si cada PC ofrece 2 TB de almacenamiento, entonces un rack de 80 PCs ofrece 160 TB, con un cluster de 30 racks se ofrecen 4,8 petabytes. No se conoce exactamente el número de máquinas que tiene la compañía pero podemos asumir que cuentan con unos 200 clusters, que ofrecen 960 petabytes de almacenamiento, casi 1 exabyte (10^18 bytes). Middleware Artículo principal: Middleware.
    • El sistema está compuesto por un grupo de servicios distribuidos que ofrecen funcionalidad a los desarrolladores. Están divididos en las siguientes categorías: Paradigmas de comunicación, que incluyen servicios para comunicaciones tanto remotas como multicast. Protocol buffers: ofrecen un formato de serialización común. Publish-subscribe: servicio para la diseminación de eventos. Datos y coordinación, porporciona almacenamiento y acceso coordinado a datos. GFS: ofrece un sistema de ficheros optimizado para las necesidades de Google, incluyendo el almacenamiento de ficheros de gran tamaño. Chubby: soporta la coordinación de servicios y el almacenamiento de volúmenes pequeños de datos. Bigtable: base de datos distribuida construida sobre GFS/Chubby. Computación distribuida, proporciona servicios para el uso de computación paralela y distribuida sobre la arquitectura física. MapReduce: soporta computación distribuida sobre conjuntos de datos grandes. Sawzall: es un lenguaje de alto nivel para la ejecución de computaciones distribuidas. Mensajes de error Algunas búsquedas dará el error "403 Forbidden error" con el texto "Lo sentimos... ... pero tu consulta se parece a las solicitudes automatizadas de un virus informático o aplicación de spyware. Para proteger a nuestros usuarios, no podemos procesar su solicitud por los momentos. Vamos a restaurar su acceso tan pronto como sea posible, inténtelo de nuevo en unos minutos. Mientras tanto, si usted sospecha que su computadora o red ha sido infectada, es posible que desee ejecutar un antivirus o eliminador de spyware para asegurarse de que sus sistemas estén libres de virus y otras aplicaciones malignas. Pedimos disculpas por las molestias, y esperamos su pronto regreso a nuestra plataforma de Google." A veces, seguido de un sistema CAPTCHA.
    • La pantalla fue reportada por primera vez en 2005 y fue una respuesta a la fuerte utilización de Google por empresas de optimización de búsquedas para verificar el rango de los sitios que optimiza. El mensaje es provocado por un gran volumen de solicitudes a partir de una única dirección IP. Google al parecer utiliza cookies como parte de su protocolo para determinar si rechaza el servicio o no. En junio de 2009, después de la muerte de la superestrella del pop Michael Jackson, apareció este mensaje a muchos usuarios de internet que estaba buscando en Google las noticias relacionadas con el cantante y fue asumido por Google que fue un ataque DDoS, aunque muchas preguntas fueron presentadas por buscadores legítimos. Error de software en enero de 2009 Google etiqueta resultados de búsqueda con el mensaje "Este sitio puede dañar tu equipo" si el sitio es conocido por instalar software malicioso. Google hace esto para proteger a los usuarios que visiten este tipo de sitios web. Por aproximadamente 40 minutos el 31 de enero de 2009, todos los resultados de búsquedas fueron clasificados erróneamente como malware y por lo tanto, no se podía hacer clic en él. En su lugar, aparecía un mensaje de aviso al usuario y era requerido que el usuario introdujera la dirección URL solicitada de forma manual. Este problema fue causado por un error humano.46 47 48 49 La dirección URL de "/" (que se expande a todas las URLs) fue agregado por error en el fichero de patrones de malware. Google está disponible en muchos idiomas y ha sido modificado por completo o en parte, para muchos países.50
    • Google Imágenes Es una especialización del buscador principal para imágenes, que fue implementado en el año 2001. Contiene en su interfaz distintas herramientas de búsqueda, que sirven para filtrar los resultados de las imágenes. Estos pueden ser según su tamaño (en pequeñas, medianas y grandes), tipo, formatos (JPG, GIF y PNG), por coloración (Blanco y negro, escala de grises y en color), por color (rojo, naranja, amarillo, verde, verde azulado, azul, púrpura, rosa, blanco, gris, negro y marrón), por fecha, y por imágenes similares. El 20 de julio del 2010 fue lanzado un nuevo diseño cuya principal característica consiste en que cuando el usuario pasa el cursor sobre encima de la fotografía, sin necesidad de hacer clic, la foto se amplía y debajo de la imagen en miniatura se muestra un detalle de la información. Otra función que ha sido lanzada en 2011 es que, arrastrando una imagen hasta la barra del buscador, es posible buscar información sobre dicha imagen en la web. Además, contiene una herramienta llamada Safe Search,1 que evita que aparezca contenido para adultos en los resultados de búsqueda. Google utiliza métodos automatizados para identificar contenido ofensivo y basándose en los comentarios de los usuarios. En el caso de contenido sexualmente explícito, el filtro se basa principalmente en algoritmos que tienen en cuenta diversos factores, incluidos enlaces, palabras clave e imágenes. Aunque ningún filtro es fiable al 100%, SafeSearch ayuda a excluir la mayor parte de este tipo de contenido. El objetivo que persigue Google con la búsqueda de imágenes es el mismo que aplicamos a la búsqueda web: ofrecer a los usuarios los resultados de búsqueda mejor y más relevante. Si sigue las prácticas recomendadas que indicamos a continuación (así como nuestras directrices habituales para webmasters), la probabilidad de que sus imágenes aparezcan en los resultados de búsqueda será mayor. No inserte texto importante en imágenes Evite insertar texto importante en imágenes de elementos como, por ejemplo, encabezados de páginas y elementos del menú, ya que no todos los usuarios pueden acceder a ellos. Para garantizar la máxima accesibilidad de su texto importante en función del contenido, utilice el formato HTML habitual.
    • Proporciónenos la mayor cantidad posible de información sobre la imagen Utilice nombres de archivo informativos y detallados para las imágenes El nombre de archivo proporcionará a Google información sobre el tema de la imagen. Procure que el nombre de archivo ofrezca una buena descripción del tema de la imagen. Por ejemplo, mi-nuevo-gatito-negro.jpg es un nombre de archivo más informativo que IMG00023.JPG. Los nombres de archivo descriptivos también pueden ser útiles para los usuarios: si no podemos encontrar un texto adecuado en la página en la que encontramos la imagen, utilizaremos el nombre de archivo como fragmento de la imagen en los resultados de búsqueda.
    • CONCLUSION Google es un motor de búsqueda que utiliza enlaces para determinar la importancia de páginas web concretas, ofreciendo viabilidad y solución a nuestras preguntas de una manera eficaz y concreta, gracias a esta plataforma, encontramos una biblioteca organizada a nuestra disposición y de aquí la importancia de conocer sus trucos y consejos a la hora de utilizarla.