Linked data

  • 87 views
Uploaded on

 

  • Full Name Full Name Comment goes here.
    Are you sure you want to
    Your message goes here
    Be the first to comment
    Be the first to like this
No Downloads

Views

Total Views
87
On Slideshare
0
From Embeds
0
Number of Embeds
0

Actions

Shares
Downloads
1
Comments
0
Likes
0

Embeds 0

No embeds

Report content

Flagged as inappropriate Flag as inappropriate
Flag as inappropriate

Select your reason for flagging this presentation as inappropriate.

Cancel
    No notes for slide

Transcript

  • 1. FACULTAD DE INGENIERÍA ARQUITECTURA Y URBANISMO ESCUELA DEINGENIERÍA DE INGENIERIA INDUSTRIAL “LINKED DATA Y SU ALINEACION CON EL GOBIERNO DE TI” CURSO: REDES DE COMPUTADORAS II DOCENTE: ING. CARRIÓN BARCO GILBERTO AUTORES :  MONTEJO PIZARRO WILLIAN  PARRA SERQUEN JORGE PIMENTEL, 25Junio del 201
  • 2. LINKED DATA INTRODUCCION La revolución provocada por el fenómeno de la Web 2.0 ha hecho que ahora cualquier persona, independientemente de sus conocimientos técnicos, pueda publicar información en la Web. Como consecuencia, nos encontramos ante un escenario caracterizado por la masificación de contenidos en la Red, precisando el serhumano de algún tipo de intermediario “inteligente” capaz de extraer, procesar y localizar de forma autónoma la información requerida. La nueva “Web de los Datos”, también conocida como “Web 3.0” o “Web Semántica”, sienta los cimientos de este futuro inmediato, creando una red de nodos con información multidisciplinar que puede ser explorada por aplicaciones software sin necesidad de la intervención humana. La iniciativa Linked Open Data (LOD), impulsada por Tim Berners Lee (creador de la Web), define los mecanismos que dan forma a esta nueva Internet, en la que los datos ya no están cautivos en silos propietarios, sino que pueden ser libremente compartidos y reutilizados por agentes software. Un nodo de la red Linked Data se caracteriza porque, además de mantener losdatos propios de su dominio de interés, define enlaces a otros con información relacionada o complementaria.
  • 3. LA INICIATIVA DE LINKED OPEN DATA El modo en el que la información se publica en Internet ha sufrido una profunda evolución durante los últimos años. Desde las primeras publicaciones de datos en la Web a principios de los 90, basadas en textos estáticos, hasta los actuales modelos de publicación de la información basados en blogs, redes sociales y foros, se puede afirmar que han cambiado no solo las tecnologías sino también los paradigmas subyacentes. La Web actual se basa en un diseño sencillo, accesible e intuitivo para el ser humano. Este interpreta la información presentada en pantalla y accede a nuevos datos mediante una serie de hiperenlaces incluidos en el documento que está consultando. Resulta paradójico que la principal razón del éxito de la Web se haya convertido en uno de los principales desafíos a resolver a la hora de evolucionar cara a un nuevo modelo de acceso a la información en el que el ser humano, abrumado por la ingente cantidad de datos disponibles en la Red, precisade un intermediario (un agente software) que se encargue de explorar la Web, descubrir y procesar los datos buscados y presentarlos finalmente en un entorno amigable. La “Web de los Documentos”, accesible y entendible únicamente por el ser humano, se convierte así en la “Web de los Datos”, accesible y entendible también por las máquinas. Para hacer realidad la “Web de los Datos” es preciso definir un mecanismo que permita a los agentes software “interpretar” (manipular simbólicamente) la información disponible en Internet. La primera y más básica especificación en este sentido definida por el W3C es el modelo RDF. Una declaración RDF toma la forma de una tripla compuesta de un sujeto, un objeto, y un predicado que determina la relación que une sujeto y objeto. RDF garantiza la interoperabilidad sintáctica de los datos, queda por resolver el problema de la interoperabilidad semántica de los mismos. Para ello es preciso establecer un consenso sobre el significado concreto de los términos (nombre de conceptos y relaciones) que existen en un dominio particular.
  • 4. La Web Semántica dispone de un instrumento específico para realizar esta labor, la ontología, entendiendo como tal una “especificación explícita de una conceptualización”, que puede ser descrita formalmente mediante la especificación RDFS o bien, si la potencia semántica de esta no es suficiente, mediante OWL, ambas especificaciones basadas en RDF definidas por el W3C. Desde un punto de vista tecnológico existen básicamente dos estrategias para la publicación de la información en esta nueva Web. La primera, más continuista, pasa por enriquecer las páginas web existentes, expresadas en HTML, con anotaciones RDF (utilizando las directrices establecidas en la especificación RDF), que aportan contexto e información procesable por un ente automatizado al documento. Esta aproximación, aunque sencilla en su concepción, incrementa la complejidad en la creación y mantenimiento de las páginas web, por lo que en los últimos años ha ganado fuerza una iniciativa alternativa: Linked Open Data. La iniciativa Linked Data basa su funcionamiento en tecnologías y estándares ampliamente aceptados, cimentándose en 4 principios básicos: 1. Utiliza de URI como nombres para objeto de información. 2. Utilización del protocolo HTTP para que las personas pueda buscar esos nombres. 3. Cuando alguien busque un URL, proporcionar información útil, utilizando las normas (RDF,SPARQL). 4. Incluir enlaces a otras entidades mediante URIpara potenciar el descubrimiento de nuevos elementosde información que puedan ser relevantespara el usuario. EVOLUCION DEL CRECIMIENTO DEL LINKED DATA.
  • 5. Mayo 2007 Julio 2009 Setiembre 2011
  • 6. CREACIÓN Y PUBLICACIÓN DE UN NODO LINKED DATA En este apartado se describe el proceso de creación de un nodo Linked Data orientado a la publicación En este proceso se realizan los siguientes pasos: A. Definir la terminología (ontología) El primer paso consiste en definir la ontología que identifica los términos (en particular los nombres de los conceptos y de las relaciones) que se van a utilizar para describir la información a publicar.
  • 7. En la actualidad existen multitud de bases de datos y otro tipo de registros electrónicos que almacenan información nutricional de alimentos. Por tanto, para el desarrollo de la ontología es conveniente realizar un estudio previo de los esquemas utilizados en estos registros, basándonos en nuestro caso en la USDA (DatabaseforNutritionInformation). B. Populación Consiste en recopilar la información que se desea exponer a través del nodo Linked Data y registrarla en formato RDF haciendo uso de los términos identificados en la ontología. Para ello se ha creado un script semiautomatizado encargado de: 1. Extraerla información de interés del catálogo de la USDA. 2. Identificar potenciales conflictos. 3. expresar dichainformación en forma de triplas RDF. 4. Almacenarlos datos en un almacén RDF (en nuestro caso se ha utilizadoel Virtuoso Universal Server20). C. Configuración del nodo Linked Data no define un patrón concreto para asignar un nombre único (una URI) a los recursos, por loque cada nodo puede seleccionar el esquema que consideremás conveniente. En nuestro caso, el patrón seleccionadocombina un
  • 8. prefijo común (el espacio de nombrespropio del nodo), seguido de un sufijo queidentifica la clase del recurso y su identificador USDA. D. Vinculación con otros nodos Tras configurar nuestro nodo hemos alcanzado los tres primeros principios básicos de los cuatro establecidosen Linked Data, restando el establecimiento derelaciones con otras entidades. Uno de los procedimientosmás comunes para realizar esta labor es elrecord linkage, proceso definido en la literaturaespecializada como la “identificación y relación dediferentes registros en fuentes de datos heterogéneasque hacen referencia al mismo objeto en el mundoreal”. GOBIERNO DE TI “El gobierno de las TI es el alineamiento estratégico de las TI con la organización de forma tal que se consigue el máximo valor de negocio por medio del desarrollo y mantenimiento de un control y responsabilidades efectivas, gestión del desempeño y gestión de riesgos de las TI”. Es el conjunto de acciones que realiza el área de TI en coordinación con la alta dirección para movilizar sus recursos de la forma más eficiente en respuesta a requisitos regulatorios, operativos o del negocio. Constituye una parte esencial del gobierno de la empresa en su conjunto y aglutina la estructura organizativa y directiva necesaria para asegurar que TI soporta y facilita el desarrollo de los objetivos estratégicos definidos. Garantiza que: TI está alineada con la estrategia del negocio.
  • 9. Los servicios y funciones de TI se proporcionan con el máximo valor posible o de la forma más eficiente. Todos los riesgos relacionados con TI son conocidos y administrados y los recursos de TI están seguros. LINKED DATA ALINEADO CON EL GOBIERNO DE TI El gobierno de las TI está demostrando su efectividad y rendimiento a la hora de obtener el máximo valor de lasTI para las organizaciones. El 65% de los responsables TI que ya han implantado estos sistemas reconocen que sonefectivos o muy efectivos. La publicación de la norma ISO 38500 en 2008, ha supuesto un gran respaldo para el reconocimiento de la importanciade los sistemas de gobierno de las TI y se ha convertido en un referente y un excelente punto de partida para la implantaciónde estos sistemas. Los objetivos principales de la norma ISO 38500 son: Asegurar que, si la norma es seguida de manera adecuada, las partes implicadas (directivos, consultores, ingenieros, proveedores de hardware, auditores, etc.), puedan confiar en el gobierno corporativo de TIC. Informar y orientar a los directores que controlan el uso de las TIC en su organización. Proporcionar una base para la evaluación objetiva por parte de la alta dirección en el gobierno de las TIC. Gobierno corporativo de TI Norma ISO 38500 El Gobierno de TI y la norma ISO/IEC 38500 proporcionan un marco de principios para que la dirección de las organizaciones los utilice al evaluar, dirigir y monitorizar el uso de las tecnologías de la información y comunicaciones (TIC) con el objetivo de cumplir con los siguientes 6 principios u objetivos: Responsabilidad: Todo el mundo debe comprender y aceptar sus responsabilidades en la oferta o demanda de TI. La responsabilidad sobre una acción lleva aparejada la autoridad para su realización. Estrategia: La estrategia de negocio de la organización tiene en cuenta las capacidades actuales y futuras de TI. Los planes estratégicos de TI satisfacen las necesidades actuales y previstas derivadas de la estrategia de negocio.
  • 10. Adquisición: Las adquisiciones de TI se hacen por razones válidas, basándose en un análisis apropiado y continuo, con decisiones claras y transparentes. Hay un equilibrio adecuado entre beneficios, oportunidades, costes y riesgos. Rendimiento: Las TI están dimensionadas para dar soporte a la organización, proporcionando los servicios con la calidad adecuada para cumplir con las necesidades actuales y futuras. Conformidad: La función de TI cumple todas las legislaciones y normas aplicables. Las políticas y prácticas al respecto están claramente definidas, implementadas y exigidas. Factor Humano: Las políticas, prácticas y decisiones de TI demuestran respecto al factor humano, incluyendo las necesidades actuales y emergentes de todo el personal involucrado. Redes Temáticas del Gobierno de TI Red Temática de Linked Data de España. La red temática española de Linked Data se creó en enero del 2011 con el objetivo de facilitar el intercambio y transferencia de conocimientos en el área de la Web de Datos (también conocida como Linked Data o, en español, Red de Datos Enlazados), entre grupos de investigación nacionales asociados a Universidades, Centros Tecnológicos, administraciones públicas y empresas. La red, dirigida por Oscar Corcho del OntologyEngineeringGroup, fue financiada durante los años 2011 y 2012 por el Ministerio de Ciencia e Innovación, inicialmente, y luego por la Secretaría de Estado de Investigación, Desarrollo e Innovación, dependiente del Ministerio de Economía y Competitividad. A pesar de no contar con financiación a partir del año 2013, sus actividades se seguirán realizando con la colaboración de los miembros activos. Red Temática de Linked Data del Reino Unido Después de los problemas recientes y eventos que afectan las implementaciones piloto del Gobierno del Reino Unido Linked Data, pensé que sería útil proporcionar una actualización en nombre del Gobierno del Reino Unido Vinculado del Grupo de Trabajo de Datos - Equipo de inicio rápido, que tuvo su primera reunión el lunes.
  • 11. En primer lugar, un problema en el servidor interrumpe el acceso a los depósitos de origen de varios de los conjuntos de datos de Linked Data y los datos vinculados API páginas finales de fuente para los conjuntos de datos como http://education.data.gov.uk y http://transport.data. gov.uk . En segundo lugar, TalisSystemsLtd, que alojan varios de los data.gov.uk activos Linked Data ha anunciado el inminente cierre de su servicio de hosting. Se está trabajando para restablecer estos servicios. Estamos transfiriendo los datos y el frente API asociada termina de utilizar un conjunto de software de código abierto que se ejecutan en la infraestructura cloud de productos básicos.
  • 12. Conceptos del Tema: RDF: Es un modelo de datos para los recursos y las relaciones que se puedan establecer entre ellos. Aporta una semántica básica para la este módulo de datos que puede representarse mediante XML. TRIPLE: Es una relación entre el sujeto, propiedad y un objeto. SPARQL: Es un lenguaje de consulta sobre RDF, que permite hacer búsquedas sobre los recursos de la web Semántica utilizando fuentes de datos. URL: Es un localizador de recursos uniforme (uniformresourcelocator), es una secuencia de caracteres, de acuerdo a un formato modélico y estándar, que se usa para nombrar recursos en Internet para su localización o identificación. WEB SEMANTICA: Es una Web extendida, dotada de mayor significado en la que cualquier usuario en Internet podrá encontrar respuestas a sus preguntas de forma más rápida y sencilla gracias a una información mejor definida