Ponencia impartida en el Curso de Ingeniería del Conocimiento y del Producto, organizado por AINVEX y Techné Research Group, en la Facultad de Ciencias de la Universidad de Granada, los días 12 y 14 de abril de 2012.
Enlace del curso:
http://secretariageneral.ugr.es/pages/tablon/*/noticias-canal-ugr/2012/04/01/la-ugr-organiza-un-curso-sobre-aingenieria-del-conocimiento-y-del-productoa-para-el-desarrollo-de-productos-comerciales-innovadores
Enlace a página de Techné:
http://www.ugr.es/~tep028/eventos/curso_IC_IP_2012/curso_IC_IP_2012.php
Enlace a página de AINVEX:
http://ainvex.blogspot.com.es/2012/04/curso-ingenieria-del-conocimiento-y-del.html
1. Ingeniería del Conocimiento
y del Producto
Granada, 12 de Abril de 2012
Prof. Dr. José Pino Díaz
Departamento de Filología Griega, Estudios Árabes, Lingüística General y Documentación.
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
2. La Ingeniería y la Cartografía del Conocimiento,
herramientas para la I+D+i.
INGENIERÍA Y
CARTOGRAFÍA DEL
CONOCIMIENTO
VISUALIZACIÓN DE LA
INFORMACIÓN
Ingeniería del conocimiento (Knowledgwe engineering): “Ingeniería que tiene por
objetivo la creación de indicadores, métodos e instrumentos - (sistemas de
conocimiento) - de naturaleza matemática, informática y lingüística, para el análisis y
la representación cartográfica de la información científica y técnica -(cartografía del
conocimiento)”. (POLANCO, 1996).
3. Ingeniería y Cartografía del Conocimiento
y Toma de Decisiones
Toma de Decisiones
Cartografía del Conocimiento
(Visualización del nuevo conocimiento)
Ingeniería del Conocimiento
(Creación de nuevo conocimiento, KDD)
Informetría, Cienciometría
(Estudios cuantitativos)
Bases Bibliográficas
Fuentes de datos
5. Sociedad del Conocimiento
Prof. Dr. José Pino Díaz
Departamento de Filología Griega, Estudios Árabes, Lingüística General y Documentación.
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
6. El Conocimiento
The Knowledge
La Connaissance
• 2012-04-02, La UGR organiza un curso sobre
“Ingeniería del conocimiento y
del producto” para el desarrollo de productos
comerciales innovadores
• 2012-03-30, Andalucía y Corea se unen en
investigación y transferencia de
conocimiento
• 2012-03-15, El conocimiento y la
competitividad, claves para desarrollar
actividades emprendedoras
• 2012-03-13, La UMA organiza un foro sobre el desarrollo de
empresas basadas en el
conocimiento
• 2012-02-03, La rectora anima a los estudiantes a
innovar para progresar y
transferir conocimiento
7. Empresas basadas en el Conocimiento
“Nuestra
ventaja
competitiva
es la clave
para su éxito”
9. Empresas basadas en el Conocimiento
El informe
tecnológico …
… va más allá del
proyecto
individual,
proporciona una
descripción
detallada de un
segmento
tecnológico
especializado
13. Trilogía DIC
Datos, Información y Conocimiento. ¿Son la misma cosa? Veamos que existen diferencias:
Los datos son los resultados de observaciones humanas sobre el estado del mundo y están asociados a un objeto o hecho concreto. Por ejemplo:
la temperatura de una habitación, un número de teléfono, el resultado de un partido de fútbol, etc. Los datos son expresiones mínimas de
información, que aisladas no tienen sentido en sí mismas, pero que adquieren valor dentro de un contexto determinado. Los datos, en definitiva,
son hechos, imágenes o sonidos representados mediante números o símbolos estructurados.
La información está compuesta de datos organizados, agrupados o clasificados en categorías que les dotan de significado. Por ejemplo: una lista
de teléfonos de un organismo público, un catálogo de los servicios de un ayuntamiento, etc. Además, la información está asociada a un contexto
que facilita su interpretación. Por tanto, información son datos elaborados con un significado para el receptor.
El conocimiento es la información interpretada, personalizada, que tiene valor y que está orientada a la acción, esto es, que propicia la toma
adecuada de decisiones. Por ejemplo: un procedimiento para transferir las llamadas de un departamento a otro, un documento informativo sobre
cómo atender a los usuarios con algún tipo de discapacidad, etc. El conocimiento está asociado al individuo y a la acción, constituyendo un
instrumento para la toma de decisiones en el marco de una organización
Ejemplo:
• La organización de las notas musicales (datos=objeto)
• En forma de partitura (información=contexto) constituyen
información que puede ser interpretada por muchos
músicos.
• La destreza particular de un músico
(conocimiento=acción) para interpretar la partitura se
refiere al concepto de conocimiento.
14. Sociedad de la Información y Sociedad del
Conocimiento
La Sociedad de la Información es un estadio de desarrollo social caracterizado por
la capacidad de sus miembros (los ciudadanos, las empresas y las Administraciones
Públicas) para obtener, compartir y procesar cualquier información por medios de
las Tecnologías de Información y Comunicación, desde cualquier lugar y en la forma
que se prefiera.
A partir del año 2000, se popularizó un concepto considerado más genérico por su
amplitud de acciones, adoptando la denominación “Sociedad del Conocimiento"
para referirse a la situación social, económica y tecnológica basada en la utilización
del conocimiento. El motor central de la sociedad actual es el conocimiento, las
actividades relacionadas con la producción de conocimiento.
En la actualidad las organizaciones se enfrentan a dos problemas importantes
relacionados con la información:
Infoxicación
• Por una parte, la sobreabundancia de información, ya que las
organizaciones acumulan gran cantidad de información de todo tipo.
• Por otra parte, la escasez de información útil para tomar decisiones, esto
es, la dificultad de encontrar la información que se necesita entre la maraña
de información y documentos que existen en la organización .
15.
16. Proceso de creación del conocimiento
(Nonaka-Takeuchi, 1995)
• La Socialización, es el proceso de adquirir conocimiento tácito a través de compartir experiencias por medio de exposiciones
orales, documentos, manuales y tradiciones y que añade el conocimiento novedoso a la base colectiva que posee la
organización.
• La Exteriorización, es el proceso de convertir conocimiento tácito en conceptos explícitos que supone hacer tangible
mediante el uso de metáforas conocimiento de por sí difícil de comunicar, integrándolo en la cultura de la organización; es la
actividad esencial en la creación del conocimiento.
• La Combinación, es el proceso de crear conocimiento explícito al reunir conocimiento explícito proveniente de cierto
número de fuentes, mediante el intercambio de conversaciones telefónicas, reuniones, correos, etc., y se puede categorizar,
confrontar y clasificar para formas bases de datos para producir conocimiento explícito.
• La Interiorización, es un proceso de incorporación de conocimiento explícito en conocimiento tácito, que analiza las
experiencias adquiridas en la puesta en práctica de los nuevos conocimientos y que se incorpora en las bases de conocimiento
tácito de los miembros de la organización en la forma de modelos mentales compartidos o prácticas de trabajo.
18. Gestión de la Información y
Gestión del Conocimiento.
La Gestión de la Información es la gestión de documentos de todo tipo (gestión del
conocimiento explícito contenido en documentos de todo tipo).
La Gestión del Conocimiento engloba tanto la gestión de la información
(conocimiento explícito) como la gestión del conocimiento tácito (conocimiento
interno de las personas).
Las principales herramientas que apoyan a un programa de gestión del conocimiento
son:
1. Data warehousing (Almacén de datos)
2. Data mining (Minería de datos)
3. Sistemas de soporte a la toma de decisiones
4. Groupware (Software colaborativo)
5. Sistemas de información para la dirección, todas ellas han de ser apoyadas
adecuadamente por los sistemas de gestión documental
20. Teoría Actor-Red
Actor-network theory
Théorie de l’acteur-Réseau
Prof. Dr. José Pino Díaz
Departamento de Filología Griega, Estudios Árabes, Lingüística General y Documentación.
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
21. Conocimiento Científico y Tecnológico
Teoría Actor-Red
• Filosofía de las Ciencias (Michel Serres)
• Sociología del Conocimiento (David Bloor)
• Sociología de la Ciencia y de la Técnica (Michel Callon, Bruno
Latour)
• Sociología de la Traducción
• Sociología de las Asociaciones
• Teoría Actor-Red (M. Callon, J.P. Courtial, B. Latour, etc.)
“ … en la construcción social de un hecho científico intervienen entidades humanas y no humanas y el
proceso continuo de transformación o traducción de las relaciones establecidas entre tales entidades
da como resultado una red en continuo cambio …”
22. Teoría Actor-Red
El desarrollo en los años ochenta de la
Sociología de las Ciencias y Técnicas, Sociología
de la Traducción o Sociología de las
Asociaciones por Michel Callon y Bruno Latour
(Centre de Sociologie de l’Innovation, Paris) a
partir de recursos conceptuales, entre otros, de
Michel Serres (Filosofía de las Ciencias) y de
David Bloor (Sociología del Conocimiento), tiene
su exponente en la Teoría Actor-Red (ANT en
inglés), según la cual en la construcción social
de un hecho científico intervienen entidades
humanas y no humanas y el proceso continuo
de transformación o traducción de las
relaciones establecidas entre tales entidades da
como resultado una red en continuo cambio;
entendida ésta como una malla formada por
nudos (actores) enlazados entre sí (relaciones
que establecen entre ellos).
23. Redes Tecnocientíficas
Se emplea el concepto de “red tecnocientífica” tal como fue planteado por
Latour en 1983, es decir como la forma abreviada de “red de ciencia y
tecnología”
La Teoría Actor-Red es útil para describir las complejas relaciones que se
establecen en las redes de la Ciencia y Tecnología, así como las de la Tecnociencia
(Echevarría y González, 2009), entendida ésta como una modalidad de la
actividad científica y tecnológica fruto de la hibridación entre Ciencia y
Tecnología.
Así cualquier red de la Tecnociencia (Latour, 1983) está formada por un conjunto
de actores y un conjunto de relaciones establecidas entre ellos en un periodo
temporal concreto. Con el tiempo los actores y las relaciones cambian y dan lugar
a nuevas redes y así se suceden unos a otros a lo largo del periodo de análisis.
Esta teoría también llamada Sociología de la Traducción (entendida traducción
como conversión, transformación, variación o cambio), estudia los cambios que
se producen en las redes de conocimiento tecnocientífico.
24. Análisis Estratégico
El Análisis Estratégico consiste en esencia en la identificación y tipificación de los
actores y las relaciones fuertes; se trata de una “reducción de la complejidad
conservando lo fundamental”.
La Vigilancia Estratégica Científica y Tecnológica es el conjunto de tareas que
buscan “proporcionar buena información a la persona idónea en el momento
adecuado” y en el lugar adecuado; buena información sobre el entorno científico
y tecnológico de la organización.
La Planificación Estratégica es el “principal instrumento para la gestión de una
organización a corto plazo, 2 ó 3 años”; es una herramienta para la mejora
continua y la innovación en la organización.
27. Minería de datos
Data mining
Exploration de données
Prof. Dr. José Pino Díaz
Departamento de Filología Griega, Estudios Árabes, Lingüística General y Documentación.
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
28. Databases
Una base de datos es un conjunto de información estructurada en registros y
almacenada en un soporte electrónico legible por ordenador.
• Cada registro constituye una unidad autónoma de información que puede a su vez
estar estructurada en diferentes campos o tipos de datos que se recogen en la base
de datos
• Una base de datos se crea y mantiene de forma continuada con el objetivo de
resolver necesidades de información concretas de un colectivo, una organización o el
conjunto de la sociedad.
29. Creación de nuevo conocimiento a partir de bases
de datos bibliográficas
(Knowledge Discovery in Databases, KDD)
30. Data Mining, a KDD Process
Data mining: the core of
Knowledge Discovery Pattern Evaluation
Databases process.
Data Mining
Task-relevant Data
Data Selection
Data Preprocessing
Data Warehouse
Data Cleaning
Data Integration
Databases
31. Minería de datos
La Minería de Datos es la extracción dirigida de la información existente en las bases de
datos con el fin de descubrir patrones, relaciones o asociaciones para generar nuevo
conocimiento.
Algunos tipos de DM:
- Web mining
- Web content mining (minería de contenido web)
- Web structure mining (minería de estructura web)
- Web usage mining (minería de uso web)
- Text mining (minería de datos textuales)
- Spatial data mining (minería de datos espaciales)
32. Data Mining: Confluence of Multiple Disciplines
Database
Statistics
Technology
Machine
Learning
Data Mining Visualization
Information Other
Science Disciplines
33. Data mining and Making decisions
Increasing potential
to support
making decisions End User
Making
Decisions
Data Presentation Business
Analyst
Visualization Techniques
Data Mining Data
Knowledge Databases Discovery Analyst
Data Exploration
Statistical Analysis, Querying and Reporting
Data Warehouses / Data Marts
OLAP, MDA DBA
Data Sources
Paper, Files, Information Providers, Database Systems, OLTP
34. Minería de textos
Text mining
Fouille de textes
Prof. Dr. José Pino Díaz
Departamento de Filología Griega, Estudios Árabes, Lingüística General y Documentación.
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
35. Text mining, a KDD Process
In 2001, Dow Chemicals merged with Union Carbide Corporation (UCC), requiring a massive integration of over 35,000 of UCC’s
reports into Dow’s document management system. Dow chose ClearForest, a leading developer of text-driven business solutions,
to help integrate the document collection. Using technology they had developed, ClearForest indexed the documents and
identified chemical substances, products, companies, and people. This allowed Dow to add more than 80 years’ worth of UCC’s
research to their information management system and approximately 100,000 new chemical substances to their registry. When
the project was complete, it was estimated that Dow spent almost $3 million less than what they would have if they had used
their own existing methods for indexing documents. Dow also reduced the time spent sorting documents by 50% and reduced
data errors by 10-15%.
En 2001, Dow Chemicals se unió a Union Carbide Corporation (UCC). Esta unión requirió la integración de 35.000 informes de UCC
en el sistema de gestión del documentos de Dow. Dow Chemicals eligió a la empresa ClearForest, líder en text-driven business
solutions, para realizar la integración de la colección de documentos. Usando tecnología ad-hoc se identificaron sustancias
químicas, productos, empresas, centros y personas. Esto permitió que Dow Chemicals agregara más de 80 años de investigación
de UCC a su sistema de gestión de información y aproximadamente 100.000 nuevas sustancias químicas a su registro. Cuando el
proyecto se completó, se estimó que Dow Chemicals ahorró casi 3 millones de dólares y que el tiempo empleado en clasificar los
documentos se redujo un 50% y los errores de datos entre un 10-15%.
37. A hypothetical text mining
Ejemplo hipotético de text mining para descubrir aspectos relacionados con un nuevo gen X. En la colección de textos biomédicos
se realizan tres búsquedas sobre tres genes A, B, y C; …
En la acción final sólo se seleccionarán los documentos que contengan por lo menos una de las palabras clave que aparecen en la
zona superior del ranking de palabras clave y que mencionen a los tres genes conocidos.
39. Text mining:
Concept linckage
Una aplicación muy popular del text mining es relatada en Hearst (Untangling Text Data Mining, 1999), Don Swanson intenta
extraer información derivada de coleccionesde texto. Teniendo en cuenta que los expertos sólo pueden leer una pequeña
parte de lo que se publica en su campo, por lo general no se dan cuenta de los nuevos desarrollos que se suceden en otros
campos.
Así, Swanson ha demostrado cómo cadenas de implicaciones causales dentro de la literatura médica pueden conducir a
hipótesis para enfermedades poco frecuentes, algunas de las cuales han recibido pruebas de soporte experimental.
Investigando las causas de la migraña, dicho investigador extrajo varias piezas de evidencia a partir de títulos de artículos
presentes en la literatura biomédica. Algunas de esas claves fueron:
• El estrés está asociado con la migraña.
• El estrés puede conducir a la pérdida de magnesio.
• Los bloqueadores de canales de calcio previenen algunas migrañas.
• El magnesio es un bloqueador natural del canal de calcio.
• La depresión cortical diseminada (DCD) está implicada en algunas migrañas.
• Los niveles altos de magnesio inhiben la DCD.
• Los pacientes con migraña tienen una alta agregación plaquetaria.
• El magnesio puede suprimir la agregación plaquetaria.
Estas claves sugieren que la deficiencia de magnesio podría representar un papel en algunos tipos de migraña, una hipótesis
que no existía en la literatura y que Swanson encontró mediante esas ligas. De acuerdo con Swanson (Swanson y otros,
1994), estudios posteriores han probado experimentalmente esta hipótesis obtenida por text mining con buenos
resultados.
“Data mining: torturando a los datos hasta que confiesen”.
http://www.uoc.edu/molina1102/esp/art/molina1102/molina1102.html
44. Sistemas de conocimiento
Knowledge-based systems
Système d'analyse d'information
Prof. Dr. José Pino Díaz
Departamento de Filología Griega, Estudios Árabes, Lingüística General y Documentación.
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
45. Sistemas de conocimiento
Los sistemas de conocimiento son sistemas expertos ideados para crear nuevo conocimiento a partir
del conocimiento explícito presente en los documentos de las bases de datos. Siguen el proceso KDD en sus
diferentes fases. Tienen su origen en los softwares cienciométricos desarrollados para facilitar el análisis de
grandes conjuntos documentales científicos o tecnológicos (artículos científicos, patentes, tesis doctorales, etc.).
Los sistemas de conocimiento son de gran utilidad para los equipos de inteligencia competitiva y de vigilancia
tecnológica de las organizaciones ya que proporcionan informes, diagramas, gráficos y mapas muy apreciados en
la toma de decisiones estratégicas. La evaluación de redes de conocimiento se beneficia de la existencia de
sistemas de conocimiento desarrollados para transformar la información en conocimiento, procesando de una
manera rápida y controlada ingentes conjuntos documentales y creando nuevo conocimiento a partir de ellos.
La ingeniería del conocimiento es la rama de la inteligencia artificial que tiene por objetivo la creación de
indicadores, métodos e instrumentos de naturaleza matemática, informática y lingüística, para el análisis y la
representación cartográfica de la información científica y técnica.
46. Henoch
French or English Lexicons or
text-data terminological
resources
Dataset or Corpus Clustering DBMS-R
Term Extraction
and
And
Bibliometric Mapping
Indexation
statistics WWW
Server
SDOC
MIRIAD ILC NEURODOC HENOCH
Mac PC WS
46
47. Stanalyst
Bases de datos Recursos terminológicos
1 2 3 4
CORPUS BIBLIOMETRIA INDIZACION INFOMETRIA
Interrogación Estadísticas Manual o Clasificación y
y Datos descriptivas Automática Cartografía
Proyecto
Acceso e identificación
Navigador – Interface usuario
Esquema del Sistema de Conocimiento Stanalyst (Polanco, 2006). El módulo
“Infometría” de Stanalyst es un sistema de clasificación automática basado en dos
programas alternativos, Neurodoc (redes neuronales) y Sdoc (análisis de palabras
asociadas). Tomado de:
http://www.cincel.cl/documentos/Recursos/STANALYST2006.ppt
48. CoPalRed
Copalred es un sistema de conocimiento (herramienta de Ingeniería del Conocimiento) creado en el año 2003
por Rafael Bailón-Moreno, basado en el análisis de palabras asociadas y que tiene su antecedente en Leximappe,
software desarrollado por Whittaker, Law, Courtial y Bauin. Leximappe se ha mostrado útil en el análisis
estratégico de las redes de conocimiento científico y técnico. Leximappe y Copalred han sido empleados en el
estudio de grandes conjuntos documentales de diferentes disciplinas académicas: Arqueología, Ingeniería
Química, Fisioterapia, Conjuntos Difusos o Espacios Naturales Protegidos.
49. Análisis de Palabras Asociadas
Co-Word Analysis (1)
• El investigador transmite conocimiento tácito en los textos; éstos se
constituyen en conocimiento explícito. Este nuevo conocimiento se
analiza mediante métodos matemáticos, informáticos y lingüísticos, entre
ellos el método del análisis de palabras asociadas o co-word analysis.
• Se utiliza para estudiar la estructura y la dinámica del conocimiento en un
dominio documental concreto.
• Puede ser empleado a modo retrospectivo, “a tiempo real” o de forma
prospectiva.
• Se basa en dos teorías sociológicas: la Teoría Actor-Red y la Teoría de la
Traducción.
• Es un Índice Relacional de 2ª generación en Evaluación de la Ciencia
• Método de Knowledge Discovery in Databases (KDD)
• Se utiliza para estudiar las Redes Tecnocientíficas.
50. Análisis de Palabras Asociadas (2)
• Matriz de coocurrencias o matriz de adyacencia. Matriz simétrica que
muestra en los puntos de corte entre filas y columnas, cij, las
coocurrencias de los valores que encabezan cada fila i y cada columna j.
• Índice de equivalencia o de asociación entre las palabras i y j.
donde: eij.- Indice de equivalencia o de asociación entre las palabras i y j
Cij.- Co-ocurrencia de las palabras i y j
Ci.- Ocurrencia de la palabra i
Cj.- Ocurrencia de la palabra j.
Los valores de eij oscilan entre 0 y 1. Cuando dos palabras no aparecen
nunca juntas, su coocurrencia es nula, el índice de equivalencia vale cero.
Este índice es independiente del tamaño de la muestra.
52. Sistema de conocimiento Redes 2005
(Text mining: Clustering + Information visualization)
Vídeo-captura de pantalla que muestra el funcionamiento del sistema de
conocimiento Redes 2005
53. Vigilancia tecno-científica
Inteligencia competitiva
Prospectiva
Prof. Dr. José Pino Díaz
Departamento de Filología Griega, Estudios Árabes, Lingüística General y Documentación.
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
66. E-Learning sobre Patentes y
Vigilancia Estratégica
Prof. Dr. José Pino Díaz
Departamento de Filología Griega, Estudios Árabes, Lingüística General y Documentación.
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es
71. Muchas Gracias
Prof. Dr. José Pino Díaz
Departamento de Filología Griega, Estudios Árabes, Lingüística General y Documentación.
Universidad de Málaga. Campus de Teatinos 29071-Málaga.
jpinod@uma.es