Your SlideShare is downloading. ×
Watson
Watson
Watson
Watson
Watson
Upcoming SlideShare
Loading in...5
×

Thanks for flagging this SlideShare!

Oops! An error has occurred.

×
Saving this for later? Get the SlideShare app to save on your phone or tablet. Read anywhere, anytime – even offline.
Text the download link to your phone
Standard text messaging rates apply

Watson

267

Published on

Published in: Technology
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
267
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

Report content
Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
No notes for slide

Transcript

  • 1. Watson (inteligencia artificial)Watson es un sistema informático de inteligencia artificial que es capaz de responder a preguntas formuladasen lenguaje natural,1desarrollado por la corporación estadounidense IBM. Forma parte del proyecto delequipo de investigación DeepQA, liderado por el investigador principal David Ferrucci. Lleva su nombre enhonor del fundador y primer presidente de IBM, Thomas J. Watson.2 3Watson responde a las preguntas gracias a una base de datos almacenada localmente.4Información contenidaen ese base de datos proviene de un multitud de fuentes, incluyendo enciclopedias, diccionarios, tesauros,artículos de noticias, y obras literarias, al igual que bases de datos externos, taxonomías, y ontologías(específicamenteDBpedia, WordNet, y Yago).5A lo largo de tres días en febrero de 2011, para probar sus capacidades reales, participó un partido especial dedos juegos en el concurso de televisión estadounidense Jeopardy!, derrotando a sus dos oponenteshumanos: Brad Rutter, el mayor ganador de dinero en toda la historia del programa, y Ken Jennings, elposeedor del récord por la racha más larga de campeonatos (después de haber ganado 75 partidos).6 7Watsonrecibió el primer premio de $1.000.000, mientras Ken Jennings y Brad Rutter recibieron $300.000 y$200.000, respectivamente. Tanto Jennings y Rutter prometieron donar la mitad de sus ganancias respectivasa sus caridades seleccionadas (Jennings elegió VillageReach, y Rutter elegió Lancaster County CommunityFoundation),8mientras IBM dividió las ganancias de Watson entre dos caridades (World Vision y WorldCommunity Grid).9Watson consistentemente superó sus oponentes humanos en el dispositivo de señalización empleado por eljuego, pero tuvo problemas en responder a pocas categorías, notablemente ellas compuestas de pistas cortascon pocas palabras. Para cada pista, las respuestas más probables de Watson fueron mostradas por la pantallade televisión. Watson tuvo acceso a 200.000.000 páginas de contenido, estructurado y no estructurado, queconsumó cuatro terabytes de almacenamiento en disco,10incluyendo el texto completo dela Wikipedia en inglés.11Watson no fue conectado al Internet durante el juego.12 13Arquitectura del sistemaWatson es un sistema informático para búsqueda de respuestas (question answering en inglés), desarrolladoporIBM.1La corporación lo describe como "una aplicación de tecnologías avanzadas diseñadas paraelprocesamiento de lenguajes naturales, la recuperación de información, la representación del conocimiento,elrazonamiento automático, y el aprendizaje automático al campo abierto de búsquedas de respuestas," que es"construido en la tecnología DeepQA de IBM por fines de la generación de hipótesis, la recopilación depruebas masivas, el análisis, y la calificación."1Según IBM, Watson es un sistema optimizado para trabajo que se diseña para analítica compleja, que se haceposible por la integración de procesadores masivamente paralelos de POWER7 y elsoftware DeepQAdesarrollado por la corporación. Su soporte del hardware para la competiciónen Jeopardy! comprendía dos unidades con 5 bastidores de nodos controladores, con noventa servidores IBMPOWER 750, cada servidor utilizando un procesador de 3.5 GHz con 8 núcleos, donde cada núcleo soportapor hardware 4 hilos de ejecución (threads en inglés). El sistema cuenta con un total de 2880 núcleos deprocesamiento POWER7, y un total de 16Terabytes de RAM.15El hecho de que el procesador POWER7 escapaz de procesar en una manera masivamente paralela lo convierte en un complemento ideal para el
  • 2. software DeepQA integrado en Watson por IBM, que es embarazosamente paralelo (es decir, un trabajo quees fácilmente dividido en múltiples tareas paralelas.)16Según John Rennie, Watson puede procesar 500 giga bytes por segundo (el equivalente de un millón delibros).17El inventor principal y consultor senior para IBM, Tony Pearson, estimó que el costo total delhardware para Watson fue acerca de $3.000.000.18Rennie ha declarado que el contenido de Watson fuealmacenado en su RAM para el juego, porque los datos almacenados en discos duros son demasiado lentospara acceder.17El software incorporado en Watson fue escrito de acuerdo con dos secuencias de comandos (Java y C++), yusa dos estructuras empleadas por la Apache Software Foundation — la estructura Hadoop para computacióndistribuida, y el sistema UIMA (Unstructured Information Management Architecture) para análisis demateriales impresos — así como el software DeepQA desarrollado por IBM y el sistema operativo SUSELinux Enterprise Server 11.10 19 20Según IBM, Watson usa más que 100 técnicas diferentes para analizarlenguaje natural, identificar fuentes, encontrar y generar hipótesis, buscar y puntuar evidencia, combinar yclasificar hipótesis.21OperaciónPara cumplir con el requisito principal para todos los concursantes de Jeopardy!, Watson estaba obligado aesperar hasta que el presentador, Alex Trebek, leyera cada pista en su totalidad, y en ese momento, una luz seencendía como una señal para indicar que el sistema está listo. El primer concursante que activa el botón ensu zumbador gana la oportunidad para responder.13 22Watson recibió las pistas en forma de textoselectrónicos al mismo tiempo en que las mismas fueron puestas a la disposición de los participanteshumanos.13Luego analizaría las pistas en diferentes palabras clave y fragmentos de oración para encontrarfrases estadísticamente relacionadas.13La innovación principal de Watson no fue en la creación de un nuevoalgoritmo para esta operación, sino más bien en su capacidad de ejecutar rápidamente miles de algoritmosprobados para análisis del lenguaje natural al mismo tiempo para encontrar la respuesta correcta.13 23Laprobabilidad de la corrección de Watson se mide por el número de algoritmos que encuentran la mismarespuesta independientemente.13Una vez que Watson tiene un número pequeño de soluciones posibles, escapaz de hacer comparaciones con su base de datos para determinar si la solución tiene sentido.13En unasecuencia de 20 simulacros, los participantes humanos fueron capaces de usar el tiempo medio de seis o sietesegundos que Watson necesitó para escuchar la pista y decidir si querían señalar para una respuesta.13Duranteese tiempo, Watson también debe evaluar la respuesta y determinar si el resultado es correcto de una manerasuficiente para señalar.13Una parte del sistema usado por Watson para ganar el concurso fueron los circuitoselectrónicos que recibieron la señal "listo" y luego examinaron si el nivel de confidencia de Watson fuesuficientemente grande para activar el zumbador. Debido a la velocidad de estos circuitos en comparación conla velocidad de los tiempos en que los seres humanos son capaces de responder, el tiempo de reacción paraWatson fue más rápido que el de los concursantes humanos excepto cuando los humanos anticiparon (en vezde reaccionar a) la señal "listo."24Después de la señalización, Watson habló con una voz electrónica,sintetizada a partir de grabaciones hechos por Jeff Woodman para un programa de texto a voz desarrolladopor IBM en 2004,25dando las respuestas en el formato de "respuesta y pregunta" asociado con Jeopardy!13HistoriaLas circunstancias que condujeron al desarrollo de Watson se remontan a la victoria de la computadora DeepBlue sobre Gari Kaspárov, un Gran Maestro Internacional del ajedrez, en el 11 de mayo de 1997. Desdeentonces, IBM se encontraba en la búsqueda de un desafío nuevo, y en 2004, Charles Lickel, el gerente deinvestigaciones para IBM, había encontrado uno cuando vio la racha ganadora de KenJennings en Jeopardy! mientras cenaba en un restaurante con sus compañeros de trabajo. Intrigado por laposibilidad para la utilización del concurso como un desafío para IBM, Lickel presentó la idea, yen 2005 Paul Horn, el ejecutivo de investigación para IBM, apoyó a Lickel en persuadir a uno de losmiembros de su departamento a asumir el desafío de jugarJeopardy! con un sistema de IBM. A pesar de queinicialmente tuvo problemas en encontrar miembros de su equipo de investigación quienes fueron dispuestosa asumir lo que parecía ser un desafío mucho más complejo que el juego de ajedrez, eventualmente DavidFerrucci aceptó la oferta.26Watson fue precedido por un sistema llamado "Piquant," que participó encompeticiones logradas por el gobierno de los Estados Unidos, donde fue capaz de responder correctamentesólo 35 por ciento de la cantidad total de pistas en el juego, y generalmente requerió varios minutos para
  • 3. responder.27 28 29Para competir en Jeopardy!con éxito, Watson necesitaría responder en un máximo de pocossegundos, y en ese tiempo, las problemas planteados en el concurso fueron consideradas como imposibles deresolver.13En pruebas iniciales conducidas durante el año 2006 por David Ferucci, gerente del Departamento de Análisise Integración Semántica de IBM, se le proporcionó a Watson 500 pistas de episodios pasadosde Jeopardy! Aunque los mejores concursantes humanos fueron capaces de responder correctamente a unmáximo de 95 por ciento de las pistas, en su primera prueba Watson fue capaz de responder correctamente asólo 15 por ciento de las pistas. Durante 2007, el equipo se dio tres a cinco años y un equipo de 15 personaspara resolver las problemas.13En 2008, los desarrolladores habían avanzado tanto, hasta el punto dondeWatson fue capaz de competir con campeones de Jeopardy!.13En febrero de 2010, Watson derrotaba acampeones de Jeopardy! de manera regular.30Watson era principalmente un esfuerzo de IBM, pero su equipo de desarrollo incluye profesores y estudiantesde la Universidad Carnegie Mellon, la Universidad de Massachusetts en Amherst, el Instituto para Ciencias deInformación de la Universidad del Sur de California, la Universidad de Texas en Austin, el InstitutoTecnológico de Massachusetts, laUniversidad de Trento, y el Instituto Politécnico Rensselaer.14En 2008, los representantes de IBM se comunicaron con Harry Friedman, el productor ejecutivode Jeopardy!, sobre la posibilidad de una competición entre Watson y dos de los concursantes más exitososdel programa (Ken Jennings y Brad Rutter). Friedman estaba de acuerdo con esa decisión.13 31Las diferenciasentre Watson y los concursantes humanos habían generados conflictos entre IBM y el personalde Jeopardy! durante la planificación de la competición.32IBM repetidamente expresó preocupacionesconcernientes a que los guionistas del programa explotarían las deficiencias cognitivas de Watson cuandoescribir las pistas, y de este modo, convirtiendo el concurso en un test de Turing. Para soslayar este reclamo,un tercero eligió aleatoriamente las pistas de programas previamente escritos que no habían sidoemitidos.32El personal de Jeopardy! también expresó preocupaciones sobre el tiempo de reacción con elzumbador. Watson originalmente señaló por vía electrónica, pero el personal del programa pidió que elsistema pulse el botón físicamente, como los concursantes humanos.33Sin embargo, Watson fue capaz de sermás rápido que sus competidores humanos, aún con su dedo robótico.Para preparar Watson para su competición, IBM construyó un simulacro del plató de Jeopardy! en una sala deconferencias en uno de sus sitios de tecnología. Concursantes humanos, incluyendo concursantes anterioresde Jeopardy!, también participaron en simulacros del concurso, presentados por Todd Alan Crain de TheOnion.13Alrededor de 100 simulacros fueron conducidos, con Watson ganando un 65 por ciento de lospartidos.34Los partidos oficiales fueron grabados en enero de 2011, y emitidos el siguiente mes.Usos en el futuroSegún IBM, el objetivo para Watson es permitir que las computadoras comiencen a interactuar de formanatural con humanos a través de una amplia gama de aplicaciones y procesos, comprendiendo las preguntasde los seres humanos y dando respuestas que los seres humanos pueden comprender y justificar.30IBM y Nuance Communications Inc. se han unido para el proyecto de investigación para desarrollar unproducto comercial durante los próximos 18 a 24 meses que explotará las capacidades de Watson comoun sistema de apoyo para decisiones clínicas para ayudar al diagnóstico y tratamiento médico de pacientes.Los médicos en la Universidad de Columbia están ayudando a identificar problemas críticos en la práctica demedicina donde la tecnología de Watson puede ser capaz de contribuir, y los médicos de la Universidad deMaryland están trabajando para identificar la mejor manera en que un sistema tecnológico como Watsonpodría interactuar con los médicos para proporcionar la máxima asistencia.35También se ha sugerido porRobert C. Weber, el consejero general de IBM, que Watson se puede utilizar para investigaciones legales.36Watson se basa en servidores comercialmente disponibles con la marca "IBM Power 750" comercializadosdesde febrero de 2010. IBM también tiene la intención de comercializar el software DeepQA a corporacionesgrandes, a un precio de millones de dólares, lo cual refleja el precio necesario de un millón de dólares paraadquirir un servidor que cumple con los requisitos mínimos para operar Watson. IBM espera que el preciodisminuirá considerablemente dentro de una década cuando la tecnología mejore.13
  • 4. Implicaciones para inteligencia artificialEl filósofo Tomás BernausJohn Searle sostiene que Watson, a pesar de las capacidades impresionantes, nopuede pensar en realidad.37A partir de su famoso experimento de pensamiento "habitación china," Searleafirma que Watson, al igual que otras máquinas de computación, sólo es capaz de manipular símbolos, perono tiene capacidad para entender el significado de esos símbolos.37IBM quiere darle nuevos usos a la súper-computadora Watson para podervenderlaWatson es el nombre de la súper-computadora creada por IBM, capaz de reconocer el lenguaje humano –hablado o escrito– y recibir información en su base de datos para luego procesar preguntas y entregarrespuestas, todo de manera casi natural y por su puesto, muy inteligente. Durante el par de años desde quesalió a la luz pública, este invento ha sido probado en varias áreas de desarrollo humano: lamedicina, economía y hasta como contestador telefónico.Ahora, IBM cree que su máquina está lista para todo y busca expandir los campos a los que puede dedicarse,principalmente motivados por la idea de comercializar este producto y transformarlo en algo que sea parte dela vida cotidiana en pocos años más. La compañía cree, por ejemplo, que Watson puede aprender a cocinar ysugerir recetas culinarias nuevas, además de servir en el área predictiva industrial para saber cuándo unamáquina va a fallar o bien ayudar al desarrollo de drogas para tratar enfermedades.Este último punto es bastante interesante, ya que la empresa GlaxoSmithKline, dedicada al desarrollo deproductos farmacéuticos, realizó junto a IBM un experimento para probar las capacidades de Watson en dichocampo: se le entregaron a la computadora todos los textos que encontraron sobre la malaria, junto ainformación sobre drogas contra la malaria que se conocen hoy e información sobre compuestos químicos.Como resultado, Watson ―inventó‖ varias drogas contra la malaria que ya se conocen, además de otras quincealternativas que podrían servir como potenciales soluciones.Esto ayudó a IBM a entender que Watson quizás sea una de las mejores herramientas disponibles paramanejar grandes flujos de datos, pudiendo entrar a un campo llamado ―Big Data‖, encargado de ayudar acorporaciones y gobiernos a encontrar los puntos útiles a partir de muchísimas fuentes, lo que sería una tareade procesamiento y selección de datos masiva hecha a la medida para Watson.El supercómputo es un área fascinante con varios momentos clave en la historia de lacomputación. Uno de ellos nos ocupa hoy porque Watson, la supercomputadora creada por IBM,participará en Jeopardy! los días 14, 15 y 16 de febrero. Después de una impresionante etapaprevia de entrenamiento --ver vídeo más adelante-- Watson medirá su "inteligencia" en vivo y encadena nacional frente los dos campeones más importantes del concurso: un hecho mediático sinprecedentes.¿Cómo funciona Watson? ¿Por qué es capaz de enfrentar a un par de seres humanos en unconcurso de preguntas abiertas sobre conocimiento general? ¿Qué sistema operativo le hacefuncionar? Vamos a ver.AlgoritmosWatson es una supercomputadora especializada en el procesamiento de lenguaje natural, elnuestro. En particular, es una implementación de DeepQA, un sistema de inteligencia artificialcreado por IBM pararesponder preguntas abiertas acerca de cualquier dominio delconocimiento humano. Esto es complicado al extremo. La computadora debería ser capaz deentregar respuestas precisas e inteligibles, sintetizadas de una forma rápida y natural para un serhumano. Estamos hablando de un sistema eficiente en términos humanos, más quecomputacionales. No por nada los algoritmos implementados en Watson están enfocados en Análisis y procesamiento de preguntas. Análisis semántico para mejorar el desempeño del sistema.
  • 5.  Aprendizaje Maquinal para evaluar qué tan confiables son las respuestas. Reconocimiento, relación y aprendizaje de las respuestas a lo largo del tiempo. Reconocimiento del sentido y el contexto de las preguntas.Para participar en Jeopardy!, IBM ha reunido un equipo de especialistas para crear otros algoritmosque ayuden a Watson a ganar a sus rivales. Algoritmos de Estrategia para encontrar y evaluar posibles respuestas. Valorar y estimar la certeza de las posibles respuestas con técnicas de AprendizajeMaquinal. Análisis y categorización de preguntas típicas de los juegos de palabras. Estrategia para competir específicamente en las instancias finales de Jeopardy!, creados porGerry Tesauro, experto mundial en juegos de computadora contratado por IBM.Además, IBM ha creado un equipo para la síntesis de voz y reconocimiento del habla para queparticipe de forma natural en el concurso.Ahora bien, vistos de manera muy general, estos son los pasos que van desde la pregunta a larespuesta:1. Pregunta2. Análisis de la pregunta.3. Descomposición de la pregunta en una consulta a la bases de datos.4. Generación de hipótesis Búsqueda en las fuentes Generación de respuestas candidatas5. Filtrado suave para las mejores respuestas (unas 100 en promedio)6. Calificación de las hipótesis en función de la evidencia.7. Síntesis de la posible respuesta.8. Respuesta.InfraestructuraEsto es lo que sostiene a Watson: 10 racks con 90 servidores IBM POWER 750 con 32 cores cada uno, es decir 2.880unidades de procesamiento a 3.55 GHz cada una, lo que equivale a unos 80 teraflops. Sistema operativo Novell SUSE Linux Enterprise Sever 11 (SLES). Almacena más de 200 millones de páginas de información en un disco de 4 Terabytes. 16 Terabytes de memoria RAM.Así es, Watson está operado por Linux. Y si corriera sobre un sólo CPU, le llevaría unas dos horascontestar una pregunta, por eso necesita un cluster de esas dimensiones para responder rápida ycorrectamente. La gente de IBM, menciona queestamos en un momento muy especial [...] Estamos en un momento en el que las computadoras ysu tecnología han alcanzado a los humanos. Hemos creado un sistema computacional con lahabilidad para entender el lenguaje natural, lo cual es algo muy difícil de conseguir para lascomputadoras.Watson será probado en Jeopardy! para que el mundo entero la admiré --con la boca abierta--como un magnífico monumento dedicado como pocos a las ciencias de la computación y enespecial a la inteligencia artificial. Su futuro no estará en Jeopardy!, sino en la administración yanálisis de datos para diferentes áreas de la industria y el gobierno: salud, finanzas, servicio aclientes, ciencia. IBM verá subir sus bonos y quizá venda más máquinas.

×