Careaga en busca del conocimiento encuentraolo con knowledge graph jun2012

  • 393 views
Uploaded on

 

More in: Technology
  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
393
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
3
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. “En Busca del Conocimiento: Encuéntralo con Knowledge Graph”Ana Lilia Careaga Mercadillo, Junio de 2012AbstractWhen you search, you’re not just looking for a webpage. You’re looking to getanswers, understand concepts and explore knowledge. Google has unveiled the“Knowledge Graph” search engine, which they’re calling the “first step in the nextgeneration of search.” The initial release was launched on May 16 th 2012 and it isgradually rolling out to U.S. English users and consists of three elements: Links to different sets of results based on contextual meanings for anygiven search term Topic summaries with key facts visible in the sidebar of the SERPs(Search Engine Results Page) “Information boxes” that offer additional information in the SERPssidebar based on popular related queries.---------------------------------------------------------------------------------------------------------IntroducciónLa única vez que tuve la oportunidad de ver y escuchar a Carlos Fuentes 1enpersona fue en el homenaje que se le hizo por su 80 aniversario en la SalaNezahualcóyotl del Centro Cultural Universitario (Noviembre 2008) con el coloquio“El arte de narrar” . En medio del tumulto y expectación, la Sala Nezahualcóyotlse vio rodeada de jóvenes entusiasmados y ansiosos por ver de cerca a dos delos escritores más importantes de la lengua española: Carlos Fuentes y GabrielGarcía Márquez (Premio Nobel Literatura, 1982). Afuera la espera de los jóvenespor conseguir un lugar no alteró su ánimo y algunos llevaban consigo a Aura y laedición especial de Cien Años de Soledad con la esperanza de ser autografiadosen algún momento a pesar de confesar, algunos, nunca haberlos leído. Ante lainsistencia de los jóvenes se abrieron las puertas, pero no pasó mucho tiempocuando los gritos de emoción se cortaron de tajo porque no había cabida paratodos y fue necesario cerrarlas. El rector de la UNAM, José Narro, salió paracalmarlos y agradecer su presencia e interés por los escritores y unos cuantossegundos después, regresó al recinto para dar inicio al evento. El programa del1Carlos Fuentes Macías (Panamá, 11 de Noviembre 1928- † México DF, 15 de mayo 2012 fue uno delos escritores más conocidos de finales del siglo XX , candidato al Premio Nobel de Literatura en reiteradas ocasiones yautor de novelas y ensayos, entre los que destacan Aura, La muerte de Artemio Cruz, La región más transparente yTerra Nostra
  • 2. coloquio “El arte de narrar” inscrito por los 80 años de vida y 50 de la primeraedición de su novela “La región más transparente” anunciaba originalmente laparticipación de Gabriel García Márquez como Presidente Honorario y a SealtielAlatriste como presidente de la mesa. Sin embargo, de última hora invirtieron lospapeles y Alatriste tomó la palabra. En la mesa también participaron los escritoresNélida Piñón, Tomás Eloy Martínez, Sergio Ramírez, Juan Goytisolo y la Nobel deLiteratura sudafricana Nadine Gordimer. Después de la apertura fue CarlosFuentes, quien con su notable elegancia y sonrisa en el rostro, subió al podiodesde las butacas de las primeras filas de esta sala para hablar del arte denarrar. Se veía contento y agradecido y dirigió sus palabras especialmente a losjóvenes. Con la fuerza característica con la que solía enhebrar sus palabras y sumagisterio en el arte de narrar nos hizo sentir la belleza de la escritura y elplacer para el que la lee. Su entusiasmo no solo por la vida sino por la literaturanos encendió y la elegancia estilística de sus palabras narrando nos hizo ver cómola literatura nos puede servir para ir “en contra de toda oligarquía económica,para defendernos de los atropellos que día a día nos machacan”. Recuerdoque me sentí pletórica y dichosa al escuchar estas palabras que ahora, alrecordarlas, he vuelto a saborear. Él ya no está aquí pero sus pensamientostrazados e hilvanados cuidadosamente están engarzados en toda su obra literaria.Su escritura fue un regalo y leerla es el mejor homenaje que se le puede dar.Desde muy joven, Carlos Fuentes se dio cuenta que leer y escribir eran tareasindispensables para quienes estaban decididos a comprender el mundo. Ellenguaje junto con el arte, afirmaba Fuentes en numerables ocasiones, son losinstrumentos idóneos para saber quiénes somos y quienes queremos ser. Élinsistía que un lenguaje deficiente y un mal manejo de las palabras nos generavacío e improductividad. Carlos Fuentes no sólo nos dejó su gran literatura sinoque nos mostró con su ejemplo que la lectura y la escritura son fuentes delconocimiento y de acción. Libros como “Las buenas consciencias” o “Laregión más transparente” nos hacen una invitación a no quedarnos en la orillade las realidades dadas sino abrir nuestro pensamiento a nuevas perspectivas.Porque, de acuerdo al pensamiento de Fuentes, la literatura es siempre “unmanantial del que brota transparencia y en el que la música de las palabrasnos muestra que el mundo está cargado de sorpresas” y es, sin duda alguna,más excepcional y rica de lo que pensamos . A través de sus novelas, Fuentesnos describió un nuevo universo del saber donde el conocimiento es capaz demultiplicarse a través de la imaginación literaria. Al acercarse a un libro comoAura, los lectores pueden recorrer un profundo sendero donde se acompaña a unpersonaje pasear por los caminos más oscuros para rescatar a su amada de lamuerte. "Toda literatura dice lo que no puede decirse de otra forma", y “espor ello que la novela no sólo refleja realidad, sino que crea una realidadnueva, una realidad que antes no estaba allí… “22Fuentes, Carlos “En esto creo” pp 90-94 2002
  • 3. Carlos Fuentes afirmó varias veces que serán los jóvenes quienes tendrán queenmendar los errores de generaciones pasadas, caracterizadas por un enormeindividualismo y ambición. Indudablemente la tecnología tendrá un papel esencial ,no solo en la comunicación sino en la movilización social que nos traerán loscambios, pero no obstante, decía Fuentes, que además de tecnología, serequiere tener una comprensión y conocimiento del mundo para poderloentonces transformar. Y esa comprensión indispensable para la transformaciónpodía iniciarse a partir de la novela porque “a través de la imaginación y ellenguaje, la novela convierte el pasado, en memoria, y el futuro, en deseo.Pero ambos ocurren hoy, en el presente del lector que, leyendo, recuerda ydesea. A través de las novelas, nuestras almas se sumergen dentro lo real através de lo imaginario para descubrir lo que maravillosamente se escondeen las peripecias de lo cotidiano. La novela constituye un tipo concreto deconocimiento social sobre el mundo al mismo tiempo que es capaz dereinventarlo dentro de nuestros sueños”3Pero para tener ese concreto conocimiento social del mundo al que nosintroduce no solo la novela sino la realidad misma es imprescindible primero teneracceso a la información. Sin información NO hay conocimiento, peroinformación no es conocimiento. El conocimiento es reflexión sobre lainformación, es capacidad de discernimiento y de discriminación, esjerarquizar y ordenar. Pero esta capacidad no se recibe como información y esnecesario desarrollarla porque todo es información menos el conocimiento quenos permite aprovechar esa información.El último cuarto del Siglo XX quedó en la historia como un punto de referencia enla transformación de la sociedad y la economía porque aquí se dieron grandesavances tecnológicos, entre los más importantes está la llegada de Internet, lacual, como todos sabemos, abrió opciones no sólo en la generación,almacenamiento e intercambio de la información, sino también en la generaciónde conocimiento .La información es , entonces, el insumo más importanteen la sociedad basada en ese conocimiento capaz de transformar. Y paraobtener información actualmente accedemos a la web mediante el uso de losmotores de búsqueda como Google , los cuales en realidad aún son pocointeligentes porque en lugar de contestar una pregunta nos muestran una lista casiinterminable de links con documentos a veces muy lejanos de la información queestamos buscando. Lo que la mayoría de las personas quieren son respuestas yno largas listas de documentos. Lo anterior se debe a que los motores debúsqueda operan bajo el criterio de la sintaxis y no tienen la inteligencia paracomprender la semántica4de las palabras claves que inscribimos en el buscador.Los motores de búsqueda funcionan enviando hordas de “arañas robóticas”(web spiders) que se desplazan a través de la red indexando las palabras claveen cada pagina que encuentran a su paso y en realidad, el resultado de la3Fuentes, Carlos “En esto creo” pp 90-94 20024El término semántica se refiere a los aspectos del significado, sentido o interpretación de una palabra, expresión oinclusive de algún símbolo o representación formal. Dentro de la lingüística, la semántica, junto con la sintaxis (forma) yla pragmática (contexto) son los aspectos que intervienen en una expresión con significado
  • 4. búsqueda nos muestra un índice de dichas páginas en base al ordenamiento queestá establecido por un algoritmo desarrollado por Google llamado Page Rank.Sin embargo, estos motores de búsqueda han ido evolucionando paracomprender el significado de nuestras palabras, es decir, para convertirse enverdaderos buscadores semánticos que sean capaces de devolvernosresultados que realmente respondan al significado de nuestra pregunta.Knowledge Graph, es uno de varios buscadores semánticos que fue anunciado elpasado Mayo 16, 2012, casi coincidiendo con la partida de Carlos Fuentes.Knowledge Graph nos facilitará las búsquedas para la obtención de lainformación que analizará objetos y no sólo líneas de texto. Esta nuevafuncionalidad, se ha empezado a probar en Estados Unidos y se irá extendiendoa otros países.¿Quieres saber más de Knowledge Graph?Continua leyendo…..La Web SemánticaHoy casi todo está representado de una u otra forma en la web, y con la ayuda deun buen buscador, podemos encontrar información sobre casi cualquier cosa quenecesitemos. La web está cerca de convertirse en una enciclopedia universaldel conocimiento humano. Por otra parte la web nos permite realizar diferentesactividades de nuestra vida diaria con una comodidad, economía y eficiencia sinprecedentes: sin movernos de casa podemos comprar todo tipo de productos yservicios, gestionar una cuenta bancaria, buscar un restaurante, consultar lacartelera, leer la prensa, localizar a una persona, inscribirnos en la universidad otrabajar desde casa .No obstante, en este panorama tan favorable hay espaciopara mejoras. Por ejemplo, el enorme tamaño que ha alcanzado la web, a la vezque es una de las claves de su éxito, hace que algunas veces la búsqueda deinformación sea una tarea compleja. La asombrosa eficacia de los buscadoresactuales tiene también sus límites. Por ejemplo, si buscamos un “artículo sobreCarlos Fuentes”, el resultado de la búsqueda nos arroja un sin número de artículosde Carlos Fuentes pero ninguno que se trate del escritor. Este ejemplo es elsíntoma de una causa común: la falta de capacidad de las representaciones enque se basa la web actual para expresar significados. Los contenidos y servicios
  • 5. en la web se presentan en formatos (p.ejem. HTML) e interfaces (p.ejem.formularios) comprensibles por personas, pero no por máquinas.5La Web Semántica ( Berners-Lee, 2001) propone superar las limitaciones de laweb actual mediante la introducción de descripciones explícitas del significado, laestructura interna y la estructura global de los contenidos y servicios disponiblesen la WWW. Frente a la semántica implícita, el crecimiento caótico de recursos yla ausencia de una organización clara de la web actual, la web semántica abogapor clasificar, dotar de estructura y anotar los recursos con semántica explícitaprocesable por máquinas.Entonces la Web Semántica puede ser entendida como una web extendida,dotada de un mayor significado. Se desarrolla con lenguajes universales quepermitirán a los usuarios encontrar respuestas a sus preguntas de una forma másrápida y sencilla gracias a la mejor estructuración de la información. Pero paraque las máquinas puedan llevar a cabo esta función necesitan acceder acolecciones estructuradas de información y a formalismos actualmente basadosen lógica matemática que les permitan tener un cierto grado de razonamientoautomático. Estas necesidades pueden cubrirse utilizando “ontologías”6y“metadatos” 7para anotar y organizar los recursos Web. Para lograr lo anterior,es necesario hacer toda una restructuración de las páginas Web y emplear nuevoslenguajes y herramientas. Algunos lenguajes desarrollados para la WebSemántica son el lenguaje estructurado XML (Extensible Markup Language) yel lenguaje RDF (Resource Description Framework) que dotan a cada página,a cada archivo y a cada recurso o contenido de la red, de una lógica y unsignificado permitiendo así a las computadoras y buscadores conocer elsignificado de la información que manejan con el fin de que ésta pueda no sólo serpresentada en pantalla, sino también que pueda ser integrada y reutilizada. Estoslenguajes deben ser estandarizados y formalizados para que su uso sea universal,reutilizable y compartido a lo largo y ancho de la web. Adicionalmente, se necesitaotro lenguaje común basado en web, con suficiente capacidad expresiva y derazonamiento para representar la semántica de las ontologías. De esta forma, lautilización de lenguajes tales como OWL (Ontology Web Language) son un pasomás en la consecución de la Web Semántica. Mediante este lenguaje es posiblecrear una ontología o biblioteca de vocabularios descriptivos/semánticos,definidos en formato RDF y ubicados en la Web para determinar elsignificado contextual de una palabra por medio de la consulta a la ontologíaapropiada.5Castells, Pablo. “La Web Semántica”6El término ‘ontología’ (utilizado en filosofía para hablar acerca de una ‘teoría sobre la existencia’) ha sido adoptado por lacomunidad de investigadores de inteligencia artificial para definir una categorización y las relaciones entre sus términos7Debido a la gran diversidad y volumen de las fuentes y recursos en Internet, se hizo necesario establecer un mecanismopara etiquetar, catalogar, describir y clasificar los recursos de la Web con el fin de facilitar la posterior búsqueda yrecuperación de la información. Este mecanismo los constituyen los llamados metadatos (datos de datos).Un metadato noes más que un dato estructurado sobre la información que hay en la Web
  • 6. Consecuentemente, mediante el empleo de todos estos lenguajes y algunasherramientas más, los agentes inteligentes y programas autónomos puedenrastrear la web de forma automática y localizar, exclusivamente, las páginas quese refieran a la palabra buscada con el significado y concepto precisos con el queinterpretemos ese término. Por lo tanto, para potenciar el uso de ontologías enla web, se necesitan aplicaciones específicas de búsqueda de ontologías(buscadores semánticos), que permitan realizar una búsqueda específica ycontextual.8Resumiendo, la tecnología anteriormente descrita se ha creado para hacer posiblela Web Semántica y ésta incluye lenguajes para la representación de ontologías,lenguajes de consulta, entornos de desarrollo, módulos de gestión(almacenamiento, acceso, actualización) de ontologías, módulos de visualización,conversión de ontologías, librerías y otras herramientas que a continuación semuestran esquemáticamente:Fuente: The Semantic Web “layer cake” as presented by Tim Berners-Lee UNICODE: Es un estándar cuyo objetivo es proporcionar el medio por el cual untexto en cualquier forma e idioma pueda ser codificado para el uso informático. URI: Son cadenas que permiten acceder a cualquier recurso de la web. En la WebSemántica las URIs son las encargadas de identificar objetos. XML: Provee una sintaxis elemental para las estructuras de contenidos dentro dedocumentos. XMLSchema: Es un lenguaje para proporcionar y restringir la estructura y elcontenido de los elementos contenidos dentro de documentos XML. RDF: Es un lenguaje simple para expresar modelos de los datos, que refieren a losobjetos “recursos” y a sus relaciones. RDFSchema: Es un vocabulario para describir propiedades y clases de recursosRDF-based, con semántica para generalizar jerarquías de las propiedades y clases. OWL: Es un mecanismo para desarrollar temas o vocabularios específicos en losque podamos asociar esos recursos. Logic: Además de ontologías se precisan reglas de inferencia. Proof: Se intercambiarán “pruebas” escritas en el lenguaje unificador de la WebSemántica. Trust: Comprobación de forma exhaustiva la confianza de las fuentes de información Digital Signature: Se emplea para verificación de la confianza de fuentes8Careaga, Ana Lilia “ Web 3.0: Más allá de Lucy y la Web Semántica ”INGENET. Enero , 2010
  • 7. Qué es un buscador semánticoUn buscador semántico es aquel que realiza el rastreo atendiendoal significado del grupo de palabras que ha introducido el usuario al realizar subúsqueda, para devolverle resultados que realmente respondan al significado desu pregunta. ¿Cómo? Rastreando en las etiquetas que se han estructurado deun modo semántico y no en los campos habituales que tienen en cuenta losalgoritmos de los buscadores tradicionales (como Google o Yahoo) basados encadenas de palabras introducidas en las etiquetas de encabezamientos (h1, h2…),o en la etiqueta título, en los links apuntan hacia esa web.Knowledge GraphGoogle presentó, de nueva cuenta, un cambio a su motor de búsqueda, con loque espera hacer más eficiente su sistema de entrega de resultados a sususuarios. La nueva función se deriva de una base de datos creada por Googlesobre más de 500 millones de personas, lugares y cosas solicitadasfrecuentemente para proveer un sumario de información sustancial que acompañelos resultados principales de la búsqueda. El cúmulo de información, al queGoogle denomina Knowledge Graph, tiene como fin proveer respuestas tanrápida y concisamente como sea posible, a fin de que los usuarios no tengan quehacer una selección de entre los vínculos presentados como resultados.Google pasó los últimos dos años analizando minuciosamente la enciclopediavirtual Wikipedia, el mapa de datos de la CIA y otras fuentes para expandir unabase de datos de 12 millones de entradas que obtuvo como parte de la compra deMetaweb en 2010.La presentación de Knowledge Graph se dio una semana después de que lasegunda máquina de búsqueda más grande, Bing de Microsoft Corp., anuncióun ajuste que destacará más información extraída de Facebook, algo que por logeneral no surge en los resultados de Google.Knowledge Graph mejora el buscador de Google en 3 formas9: Encontrar lo que buscamos (Find the right thing) : Ahora podremosindicarle a Google los resultados que más nos interesen en función denuestra búsqueda. Porque a veces el lenguaje puede ser muy confuso ymostrarnos más de lo que necesitamos. Ahora podremos elegir de quéqueremos ver los resultados exactamente. Y lo veremos en la partederecha de la pantalla.9Citado en http://www.google.com/insidesearch/features/search/knowledge.html y enhttp://searchenginewatch.com/article/2175783/Google-Launches-Knowledge-Graph-First-Step-in-Next-Generation-Search
  • 8.  Encontrar un contenido más resumido (Get the best summary): estafunción permite tener resultados muy concretos y resumidos de búsquedasdel tipo personajes, actores, etc. Podremos ver en la columna derechacontenido tipo artículo de wikipedia . Mostrar contenido más allá (Go deeper and broader): podremos disponerde más datos adicionales relacionados con la búsqueda que hicimosmediante los “information boxes”. Por ejemplo, si buscas por MattGroening, creador de los Simpsons, podrás saber en qué se inspiró parasacar los nombres de los personajes. Google intenta adaptarse yadelantarse a lo que posiblemente buscarás después.Si deseas saber más detalles sobre el funcionamiento de Knowledge Graph, terecomiendo ver este video:http://www.youtube.com/watch?v=mmQl6VGvX-c&feature=youtu.be
  • 9. Otros Buscadores Semánticos:1. Bing: Buscador semántico de Microsoft con cambios notables que incluyenla lista de sugerencias de búsqueda en tiempo real y una lista de lasbúsquedas relacionadas (llamado "Panel de explorador" en el lado izquierdode los resultados de búsqueda), basado en tecnología semántica dePowerset2. Swoogle: Desarrollado por la Universidad de Maryland, es un sistema deindización , recuperación y organización de la información para Documentosde la Web Semántica, lo que se denomina en Swoogle (SWDs, SemanticWeb Documents), o lo que es lo mismo documentos escritos básicamente enRDF y OWL3. Kngine: introduce la herramienta “Conceptos”. Lo primero que muestra albuscar una palabra es la información que tiene sobre esta. Por ejemplo: sibuscas iPhone 4 te mostrará sus especificaciones, si buscas una ciudad tedirá los datos que tiene sobre ésta. Actualmente tiene en su base de datosmás de 8 millones de conceptos.4. Hakia: divide sus resultados en Webs, News, Blogs, Twitter, Image y Video.A menudo puede ofrecer una definición de tu búsqueda directamenteextraída de Wikipedia.5. Kosmix: su portada es mucho más elaborada (tiene cierto parecido aYahoo). Se diferencia por la manera de ofrecer los resultados de búsqueda:directamente con artículos de blogs o imágenes.6. DuckDuckGO: lo más curioso es que cuando buscas una palabra quepueda tener doble sentido te permite elegir con qué sentido la quieresbuscar. Ejemplo: buscas Apple y te pregunta quieres decir la empresa ola fruta.7. Evri: tiene cierto parecido a Kosmix. Puedes filtrar los resultados porartículos, citas, imágenes y tweets. Además se integra con redes socialescomo Facebook o Twitter. También cuenta con una versión para iPhone.8. Powerset: este buscador fue adquirido por Microsoft y básicamente permitebuscar en Wikipedia mejor que nadie. Ahora es empleado en Bing9. Truevert; este buscador encuentra cualquier término que le pidas en uncontexto relacionado temas de medioambiente. Se llama a sí mismo el“buscador verde”.…………………………………………………………………………………………...ConclusionesCuando hacemos una búsqueda por Internet, no sólo estamos buscando unapágina web sino estamos buscando respuestas para obtener datos ocomprender conceptos y entonces explorar el conocimiento. Las búsquedassemánticas han conseguido que podamos encontrar respuestas más parecidas acómo las personas comprendemos el mundo y sin duda alguna nos facilitará esta
  • 10. tarea indispensable para la obtención del conocimiento, pero no podemossoslayar a la lectura , recordemos siempre que la novela constituye un tipoconcreto de conocimiento social sobre el mundo necesario para podertransformarlo.De frente ante la historia, Fuentes, junto con otros escritores del “boomlatinoamericano” 10de la talla de Gabriel García Márquez, Julio Cortázar yMario Vargas Llosa, nos han dejado la letra no solo para conocer nuestro entornosino para inventar el mundo desde nuestros sueños. Todos ellos han sidoescritores convencidos que, por encima de la razón, somos el territorio quehabitan nuestras pasiones y anhelos.….porque una sílaba pronunciada, una palabra dicha o una palabra inmersa en unbuscador, se pierden para siempre en el pasado que acoge impasiblemente todoslos presentes que constituyen el tiempo y sólo duran el instante preciso de sufugaz articulación, pero la letra queda y permanece no solo como anhelo sinocomo conocimiento.La tarea aquí, como predice Carlos Fuentes, es utilizar la información, elconocimiento, el uso de la tecnología y el despertar de las ideas para elencuentro del bien. Para transformar, para innovar…para aportar a la sociedaddel conocimiento y hacerla más accesible a todos, más llevadera y no permanecermás con los brazos cruzados .Utilicemos esta ráfaga de viento a favor del biendel mundo que nos tocó vivir.“En los jóvenes está no "un futuro" para México, sino "todo el futuro" de esta nación”. "Este es unpaís donde 50 por ciento de la población tiene 30 años o menos, que no corresponde al sistemapolítico, ni al económico y lo van a cambiar, de manera pacífica, progresiva y para bien".Carlos Fuentes, Diciembre 201110El Boom latinoamericano fue un fenómeno editorial que surgió entre los años 1960 y 1970 , cuando el trabajo de ungrupo de novelistas latinoamericanos relativamente joven fue ampliamente distribuido en Europa y en todo el mundo.El Boom está más relacionado con los autores Gabriel García Márquez de Colombia, Julio Cortázar de Argentina, CarlosFuentes de México, Mario Vargas Llosa de Perú y José Donoso de Chile. Por el movimiento de América Latina de laVanguardia, estos escritores desafiaron las convenciones establecidas de la literatura latinoamericana.