Your SlideShare is downloading. ×
0
Sistemas de Información Avanzados (Comercio electrónico)          Máster de estudios avanzados en dirección de empresasInn...
Preliminares  •   ¿Cuándo innovar?                       Contenido  •   Información en Internet y en la      Web 2.0      ...
InnovaciónLa ciencia es el pilar deldesarrollo tecnológico y dela innovación......Y la ciencia se basa en lateoría, en la ...
¿Cuándo innovar?Arriesgada, pero de alto valor si tiene éxitoIdeal, pero conocida por muchosSegura, pero mucha competencia
(Gartner, 1995)
Curva de Gartner (2006)
Curva en el 2008
Curva en el 2010¡!
∫¡!         e      em ion    tr at ?  Ex m ing ¿ r   fo cess in o   pr
Información en Internethttp://www.good.is/post/the-world-of-data-we-re-creating-on-the-internet/
¿Dónde fluye esa información?Libre de escala,mundo pequeño
Flujos de   informaciónWeb 1.0, Web 2.0 y Semantic Web
•   Everyday, we create 2.5 quintillion bytes of  Big Data                      data–so much that 90% of the data in the  ...
Implicaciones   (World Economic Forum 2012)                     •   Can human behaviour be understood,                    ...
Problemas• Privacidad• Datos pueden estar    distorsionados•   Potencian el aprendizaje    automático•   Extraer comportam...
Six Provocations for Big Data      (Boyd & Crawford, 2011)             http://papers.ssrn.com/sol3/papers.cfm?abstract_id=...
Big data como evidenciade un sistema complejo
Sistemas complejos•   “...there is no universally accepted definition of a    complex system. Most researchers would descri...
Niveles de organización•   In general terms, a “complex system” is any system    comprised of a great number of heterogene...
Comportamiento racional (humano)              ante la información•   Comportamiento humano ante la falta o exceso de infor...
Sistemas complejos,observaciones (big data) y razonamiento con AFC
Open Data         •   Poner a disposición pública datos de instituciones, organizaciones,             etc.             •  ...
Públicos, privados                                  Transparencia                                   InstitucionalEstandari...
Múltiples iniciativas    Open Data
Common Crawl • Common Crawl is a non-profit   foundation dedicated to building and   maintaining an open crawl of the   web...
Linked Data•   Los Datos Enlazados es la forma    que tiene la Web Semántica de    vincular los distintos datos que están ...
Linked Data Canalización débil del conocimiento                          •   Proponer semantizaciones                     ...
Ejemplos de proyectos   aprobados sobre    linked/open data  Ejemplos de potencial innovación
Sistemas   semánticos;    captura y explotación de       los conocimientosincorporados acontenidos web  y multimedia
Sistemas semánticos; captura y explotación de losconocimientos incorporados a los contenidos web
Nuevas formas de procesosempresarialescooperativos   en red y  dinámicos                Gestión inteligente               ...
Accesibilidad y utilización a lo largo del tiempo derecursos y bienes culturales y científicos digitales con   inclusión de...
Parte I: Modelos de negocio     basados en información         i cs    n om  eeFr
Nuevo modelo de          negocio:big data trading    & processing
Ejemplo I
Ejemplo II•   Mensajería gratuita entre smartphones    •   Muerte del SMS•   Es una empresa con muy pocos gastos y un pote...
Ejemplo III: Open Graph
Buzz de empresas y Big Data
Movimientos/visibilidad:         compra de empresas en el universo Big Datahttp://ge.geglobalresearch.com/blog/the-birds-e...
Parte II:   Minería deconocimiento
Análisis Formal de      ConceptosExtracción automatizada de jerarquías de conceptos a                  partir de datos
Cuestión: Extraer automáticamente        conceptualizaciones a partir de datos•   Problema: Cómo obtener, a               ...
Concepto:                   Intención y extensión•   Operación básica en contextos formales: derivación    •   Si X conjun...
Contención entre conceptos•       Un par (X,Y) es un concepto si:    •    X es un conjunto de objetos (la extensión del co...
El retículo de los    conceptos
Conceptos: dos puntos de         vista
Ejemplo          •   ({g,s,r,m,p},{N})              [seres vivos]          •   ({s,r,p},{N,A,M})              [animales ac...
Aplicaciones•   Bioinformática•   Diseño de nuevos medicamentos•   Data mining•   Conceptualización de las búsquedas en la...
Aplicación: Personalizando la WWW
Implicaciones entre atributos •   Objetivo: Obtener un conjunto de relaciones entre los     objetos y/o atributos •   Util...
Bases de conocimiento                                       •   Base de conocimiento para el ejemplo:•   Un conjunto compl...
Extensiones del Análisis Formal de Conceptos•   Dependencias funcionales entre    atributos•   Representaciones gráficas de...
Especialización del AFC a etiquetados• Opciones interesantes: Delicious, flickr, etc. • Objetos: lo que etiquetamos • Atrib...
Aplicaciones en servicios de etiquetado•   Extracción de ontologías (retículos de conceptos) de    sistemas de etiquetació...
Conciliación     delconocimiento
Conciliación
Experimentos                         de conciliación                         automática en                         Delicio...
Sistemas de Información Avanzados (Comercio electrónico)          Máster de estudios avanzados en dirección de empresasInn...
Innovación en el tratamiento de la información desde la  Ingeniería del Conocimiento Parte (I)
Innovación en el tratamiento de la información desde la  Ingeniería del Conocimiento Parte (I)
Upcoming SlideShare
Loading in...5
×

Innovación en el tratamiento de la información desde la Ingeniería del Conocimiento Parte (I)

355

Published on

1ª parte de la charla que impartí en el Sistemas de Información Avanzados (Comercio electrónico)
Máster de estudios avanzados en dirección de empresas de la U. de Sevilla en Febrero de 2012

Published in: Education
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total Views
355
On Slideshare
0
From Embeds
0
Number of Embeds
0
Actions
Shares
0
Downloads
11
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide

Transcript of "Innovación en el tratamiento de la información desde la Ingeniería del Conocimiento Parte (I)"

  1. 1. Sistemas de Información Avanzados (Comercio electrónico) Máster de estudios avanzados en dirección de empresasInnovación en el tratamiento de la información desde la Ingeniería del Conocimiento Parte (I) Joaquín Borrego Díaz Grupo Lógica, Computación e Ingeniería del Conocimiento PAIDI TIC-137 Departamento de Ciencias de la Computación e Inteligencia Artificial jborrego@us.es, Twitter:jborrego
  2. 2. Preliminares • ¿Cuándo innovar? Contenido • Información en Internet y en la Web 2.0 Parte III: Casos de estudio de • Big data tratamiento de la información • Big data como evidencia de un • Caso I: Minería de opiniones y sistema complejo sentimientos • Open data y Linked data. Proyectos • Caso II: Predicción bajoParte I: Modelos de negocio basados en racionalidad acotadainformación • Freenomics versus data • Caso III: Complejidad económica • Nuevo modelo de negocio: big data trading & processing • Caso IV: Interoperabilidad Semántica para la empresa • Ejemplos • Caso V: Informática urbana.Parte II: Minería de conocimiento SmartCities • Análisis Formal de Conceptos • Caso VI: Servicios en movilidad • Servicios de etiquetado basados en conocimiento
  3. 3. InnovaciónLa ciencia es el pilar deldesarrollo tecnológico y dela innovación......Y la ciencia se basa en lateoría, en la investigación • Innovación: • Aplicación de nuevos resultados • Adopción de nuevas tecnologías • I+D+i
  4. 4. ¿Cuándo innovar?Arriesgada, pero de alto valor si tiene éxitoIdeal, pero conocida por muchosSegura, pero mucha competencia
  5. 5. (Gartner, 1995)
  6. 6. Curva de Gartner (2006)
  7. 7. Curva en el 2008
  8. 8. Curva en el 2010¡!
  9. 9. ∫¡! e em ion tr at ? Ex m ing ¿ r fo cess in o pr
  10. 10. Información en Internethttp://www.good.is/post/the-world-of-data-we-re-creating-on-the-internet/
  11. 11. ¿Dónde fluye esa información?Libre de escala,mundo pequeño
  12. 12. Flujos de informaciónWeb 1.0, Web 2.0 y Semantic Web
  13. 13. • Everyday, we create 2.5 quintillion bytes of Big Data data–so much that 90% of the data in the world today has been created in the last two years alone. This data comes from everywhere:Tratamiento y análisis deenormes • from sensors used to gather climate information,repositorios de datosque resulta imposible • posts to social media sites,tratarlos con las • digital pictures and videos posted online,herramientas debases de datos y • transaction records of online purchases,analíticas • from cell phone GPS signalsconvencionales • etc. • This data is big data. http://www-01.ibm.com/software/data/bigdata/
  14. 14. Implicaciones (World Economic Forum 2012) • Can human behaviour be understood, predicted and controlled? • The advent of “big data” – enormous datasets now being harvested from records from websites (including social media sites), mobile phones, GPSs and banking transactions are giving physicists, social scientists and complex system experts powerful new tools to understand and predict human behaviour. • This development likely will have profound impacts on politics, marketing, infrastructure design and many other spheres.http://www.weforum.org/sessions/summary/human-network-dynamics
  15. 15. Problemas• Privacidad• Datos pueden estar distorsionados• Potencian el aprendizaje automático• Extraer comportamientos personales• Identificaciónhttp://www.technologyreview.com/printer_friendly_article.aspx?id=38775
  16. 16. Six Provocations for Big Data (Boyd & Crawford, 2011) http://papers.ssrn.com/sol3/papers.cfm?abstract_id=1926431• Automating Research Changes the Definition of Knowledge• Claims to Objectivity and Accuracy are Misleading• Bigger Data are Not Always Better Data• Not All Data Are Equivalent• Just Because it is Accessible Doesn’t Make it Ethical• Limited Access to Big Data Creates New Digital Divides
  17. 17. Big data como evidenciade un sistema complejo
  18. 18. Sistemas complejos• “...there is no universally accepted definition of a complex system. Most researchers would describe a system of connected agents that exhibits an emergent global behavior not imposed by a central controller, but resulting from the interactions between the agents.” • N. Boccara, Modeling Complex Systems• Colonias de animales (hormigueros), redes sociales, ciudades, Internet, sistemas políticos, sociedades humanas, mercados financieros, ecosistemas, etc.• Multidisciplinariedad en el tratamiento de la información disponible• EMERGENCIA
  19. 19. Niveles de organización• In general terms, a “complex system” is any system comprised of a great number of heterogeneous entities, where local interactions among entities create multiple levels of collective structure and organization.• The specificity of complex systems, generally underinvestigated or simply not addressed by traditional science, resides in the emergence of non-trivial superstructures that often dominate the system’s behavior and cannot be easily traced back to the properties of the constituent entities. http://www.assystcomplexity.eu/db/assyst/ASSYST_roadmap2009_2.pdf
  20. 20. Comportamiento racional (humano) ante la información• Comportamiento humano ante la falta o exceso de información (infoxicación)• Colectivo: Trust-based computing• Individual: Racionalidad acotada • Heurística de reconocimiento • Fast & frugal methods• Razonamiento no monótono• Otro método: Reglas de asociación • Reglas generales que no son 100% válidas • Razonamiento deductivo basado confianza• Representación y razonamiento visual
  21. 21. Sistemas complejos,observaciones (big data) y razonamiento con AFC
  22. 22. Open Data • Poner a disposición pública datos de instituciones, organizaciones, etc. • Privacidad, protección de datos • No descarga de bases de datos. Consulta en forma de APIs • Construcción de Mashups Tecnologías para la transparencia• Data visualisation and navigation• Data collection• Connecting and engaging citizens via social media networks• Going mobile• Traditional media http://www.transparency-initiative.org/reports/global-mapping-of-technology-for-transparency-and-accountability http://es.scribd.com/doc/61030999/Open-data-study-New-technologies
  23. 23. Públicos, privados Transparencia InstitucionalEstandarización de formatos Transparencia corporativa
  24. 24. Múltiples iniciativas Open Data
  25. 25. Common Crawl • Common Crawl is a non-profit foundation dedicated to building and maintaining an open crawl of the web, thereby enabling a new wave of innovation, education and research.
  26. 26. Linked Data• Los Datos Enlazados es la forma que tiene la Web Semántica de vincular los distintos datos que están BBC: distribuidos en la Web BBC music BBC programs• “Linked data: datos sin ontologías” BBC WildLife Finder• Los datos enlazan cosas arbitrarias que se describen en RDF.• Se vinculan a recursos de otros sitios de la WWW• Se calcula combinando/agregando datos enlazados de distintos recursos• Se ponen a disposición de la comunidad los resultados• Open Linked Data
  27. 27. Linked Data Canalización débil del conocimiento • Proponer semantizaciones débiles en forma de clientes para proyectos existentes • Linked data versus open data • Sistemas para extraer conocimiento de la empresaEjemplo:Empresa farmacéutica
  28. 28. Ejemplos de proyectos aprobados sobre linked/open data Ejemplos de potencial innovación
  29. 29. Sistemas semánticos; captura y explotación de los conocimientosincorporados acontenidos web y multimedia
  30. 30. Sistemas semánticos; captura y explotación de losconocimientos incorporados a los contenidos web
  31. 31. Nuevas formas de procesosempresarialescooperativos en red y dinámicos Gestión inteligente del conocimiento en la empresa
  32. 32. Accesibilidad y utilización a lo largo del tiempo derecursos y bienes culturales y científicos digitales con inclusión de lo que afecta al patrimonio cultural.
  33. 33. Parte I: Modelos de negocio basados en información i cs n om eeFr
  34. 34. Nuevo modelo de negocio:big data trading & processing
  35. 35. Ejemplo I
  36. 36. Ejemplo II• Mensajería gratuita entre smartphones • Muerte del SMS• Es una empresa con muy pocos gastos y un potencial de venta muy grande • Valoración actual altísima• ¿Modelo de negocio? • Es propiedad de WhatsApp: • Creación de una gran base de datos de mensajes (marca temporal). No borrable desde el terminal • Red social (contactos) • Geolocalización de los mensajes (si está activado) • Diferencia con Facebook: la comunicación por WhatsApp es ubicua y apremiante • Puede vender datos • Puede contextualizar publicidad • Ahora está en fase de crear la necesidad• ¿Cuánto vale WhatsApp?
  37. 37. Ejemplo III: Open Graph
  38. 38. Buzz de empresas y Big Data
  39. 39. Movimientos/visibilidad: compra de empresas en el universo Big Datahttp://ge.geglobalresearch.com/blog/the-birds-eye-view-of-big-data/
  40. 40. Parte II: Minería deconocimiento
  41. 41. Análisis Formal de ConceptosExtracción automatizada de jerarquías de conceptos a partir de datos
  42. 42. Cuestión: Extraer automáticamente conceptualizaciones a partir de datos• Problema: Cómo obtener, a Fluvial Litoral Océano partir de observaciones, una Carpa X primera ontología (conceptos y relaciones entre los conceptos) Escatófagus X X Sargo X X• Ejemplo: Estudiar propiedades Dorada X X de los peces carpa, escatófagus, sargo, dorada y anguila Anguila X X X • Contexto formal (O,A,I): • O={c,e,s,d,a} • Un conjunto O de objetos • A={fluvial, litoral, océano} • Un conjunto A de atributos • I está representada en la tabla (dos elementos relacionados • Una relación I entre marcados con X) objetos y atributos
  43. 43. Concepto: Intención y extensión• Operación básica en contextos formales: derivación • Si X conjunto de objetos, la intención de X es: • X’={ a : oIa para todo o objeto del conjunto X} • (los atributos comunes a todos los objetos de X) • Si Y conjunto de atributos, la extensión de Y es: • Y’={o : oIa para todo atributo del conjunto Y} • (los objetos que tienen todos los atributos de Y)• En nuestro ejemplo: • {fluvial, océano}’={anguila} • {carpa, sargo}’ es el conjunto vacío • {escatófagus, sargo}’={litoral}
  44. 44. Contención entre conceptos• Un par (X,Y) es un concepto si: • X es un conjunto de objetos (la extensión del concepto) • Y es un conjunto de atributos (la intensión del concepto) • Y’=X y X’=Y
  45. 45. El retículo de los conceptos
  46. 46. Conceptos: dos puntos de vista
  47. 47. Ejemplo • ({g,s,r,m,p},{N}) [seres vivos] • ({s,r,p},{N,A,M}) [animales acuáticos] • ({g,s,r,p},{N,M}) [animales] • ({g,r},{N,M,P}) [anim. con patas] • ({r},{N,A,M,P}) [anfibios]
  48. 48. Aplicaciones• Bioinformática• Diseño de nuevos medicamentos• Data mining• Conceptualización de las búsquedas en la Web• Web Semántica móvil• Conciliación de conocimiento• Pronóstico de apuestas deportivas
  49. 49. Aplicación: Personalizando la WWW
  50. 50. Implicaciones entre atributos • Objetivo: Obtener un conjunto de relaciones entre los objetos y/o atributos • Utilizamos implicaciones entre atributos: Lógica de atributos • Una implicación entre atributos es una expresión del tipo Y1→Y2 • donde Y1,Y2 ⊆A • Y1→Y2 es válida en un contexto (O,A,I) si para todo o∈O, el conjunto {o}’ respeta la implicación
  51. 51. Bases de conocimiento • Base de conocimiento para el ejemplo:• Un conjunto completo e • ∅→{N} irredundante de implicaciones se denomina Base • {N,A}→{M} • {N,P}→{M}} • Se puede obtener una base para un contexto dado
  52. 52. Extensiones del Análisis Formal de Conceptos• Dependencias funcionales entre atributos• Representaciones gráficas de los retículos• Comparaciones entre contextos• Contextos multivaluados• Retículos de tipo iceberg: análisis de conceptos con soporte suficientemente grande: conceptos (X,Y) con soporte • |X|/|M|≥m para cierto m∈[0,1]
  53. 53. Especialización del AFC a etiquetados• Opciones interesantes: Delicious, flickr, etc. • Objetos: lo que etiquetamos • Atributos: etiquetas• Historial de búsqueda en un sitio• Uso de recursos de la Web profunda• Nuevos navegadores conceptuales
  54. 54. Aplicaciones en servicios de etiquetado• Extracción de ontologías (retículos de conceptos) de sistemas de etiquetación colaborativa• Aplicación intensiva de las ontologías sobre tags para tratar el conocimiento etiquetado con el AFC.• Extensión de la lógica de atributos (implicaciones) a lógicas más ricas.• Navegadores conceptuales • Conciliación del conocimiento implícito en etiquetados • Razonamiento automático en la navegación conceptual• Inteligencia Artificial para potenciar el razonamiento.
  55. 55. Conciliación delconocimiento
  56. 56. Conciliación
  57. 57. Experimentos de conciliación automática en Delicious PoseerAtributos comunes es mejor queobjetos (urls) comunes
  58. 58. Sistemas de Información Avanzados (Comercio electrónico) Máster de estudios avanzados en dirección de empresasInnovación en el tratamiento de la información desde la Ingeniería del Conocimiento Fin de la parte I Joaquín Borrego Díaz Grupo Lógica, Computación e Ingeniería del Conocimiento PAIDI TIC-137 Departamento de Ciencias de la Computación e Inteligencia Artificial jborrego@us.es, Twitter:jborrego
  1. A particular slide catching your eye?

    Clipping is a handy way to collect important slides you want to go back to later.

×