Charla UCV, 15 de mayo de 2012

1,880 views

Published on

0 Comments
1 Like
Statistics
Notes
  • Be the first to comment

No Downloads
Views
Total views
1,880
On SlideShare
0
From Embeds
0
Number of Embeds
981
Actions
Shares
0
Downloads
13
Comments
0
Likes
1
Embeds 0
No embeds

No notes for slide

Charla UCV, 15 de mayo de 2012

  1. 1. XML y Web Semántica en parlamentos: Caso BCN 15 de mayo de 2012 Christian Sifaqui
  2. 2. Congreso Nacional de Chile
  3. 3. Roles de la BCN Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país
  4. 4. Roles de la BCN Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria
  5. 5. Roles de la BCN Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria Rol público, ser el espacio de conocimiento y comprensión de los ámbitos de interés social prioritarios para el país con énfasis en lo político y lo jurídico
  6. 6. Roles de la BCN Rol parlamentario, ser un instrumento relevante, a juicio de los parlamentarios y el parlamento, para el cabal cumplimiento de sus compromisos y el atisbamiento de nuevos escenarios posibles de país Rol societal, ser el repositorio del Archivo del Parlamento, en especial de la historia de la Ley y de la labor parlamentaria Rol público, ser el espacio de conocimiento y comprensión de los ámbitos de interés social prioritarios para el país con énfasis en lo político y lo jurídico
  7. 7. Atendemos y entregamos servicios
  8. 8. BCN: fábrica y repositorio decontenidos
  9. 9. Énfasis en administrar contenidos y datos: CMS
  10. 10. Énfasis en administrar contenidos y datos: CMSBúsqueda y relacionamiento de los contenidos: Autonomy
  11. 11. Énfasis en administrar contenidos y datos: CMSBúsqueda y relacionamiento de los contenidos: AutonomyRelacionamiento y apertura de los datos: web semántica
  12. 12. XML
  13. 13. XML XML (Extensible Markup Language) es un lenguaje de marcación (markup) estándar abierto promovido por el W3C adoptado ampliamente a nivel mundial para representar datos y documentos
  14. 14. XML<preface> <subdivision> <docProponent>República de Panamá</docProponent> <docProponent>Ministerio de Desarrolo Agropecuario</docProponent> <docType>Decreto Ejecutivo</docType> <docNumber>n. 223</docNumber> <docDate date="2010-06-29">(De 29 de 06 de 2010)</docDate> <docTitle>Que reglamenta la Ley 72 de 2008, que establece el procedimento especial para la adjudicación de la propiedad colectiva de tierras de los pueblo indígenas que no están dentro de las comarcas.</docTitle> </subdivision></preface>
  15. 15. No XML
  16. 16. XML
  17. 17. XML
  18. 18. XML• formato abierto para datos y documentos• independiente de la tecnología• separa la información de presentación de la de representación• comprensible para máquinas• jerárquico, riguroso, extensible, preciso y flexible• constituye una inversión a largo plazo para archivo
  19. 19. XML1. colocación de marcadores (tags) entorno al texto2. se debe definir un vocabulario de tags y reglas de cómo deben relacionarse los tags entre sí3. estas reglas se definen mediante esquemas denominados DTD (Document Type Definition) o esquemas XML
  20. 20. XML• Legible por la máquina • interconexión de los documentos • mejor búsqueda • múltiples plataformas • dialogar sistemas informáticos • aplicaciones heterogéneas (blog, wiki, redes sociales, RSS, etc.) • reutilizar la información • comparativa entre diferentes versiones
  21. 21. XML en ámbito legislativoAl representar documentos jurídicos – legislativos o parlamentarios – (proyectos de ley, leyes, debates, actos administrativos, etc.) se requieren atenciones especiales:• contiene información que contribuye a la dirección del workflow (flujo de trabajo)• apoya la redacción legislativa nacional (mejores prácticas)• interoperable con otras instituciones y otros recursos• se enriquece con las contribuciones de los ciudadanos• preserva (en el tiempo) el valor jurídico en largos intervalos de tiempo• accesible a todos por vía multi-canal (accesibilidad y brecha digital)• abierto a todo el mundo para su inspección• distribuido sin discriminación (usabilidad)• utilizable con herramientas comunes y sistemas de gestión documental
  22. 22. Algunos estándares XML en ámbito legislativoMuchos de ellos fueron creados en el pasado sólo para la publicación web y no distinguen entre representación del contenido y la presentación (Formex)Otros son específicos para una nación y difícilmente se adaptan a otros sistemas jurídicos (LexDania, NormeInRete)Otros no distinguen la parte procedural-aplicativa de la mera representación del documento (House of Representative XML standard)
  23. 23. Algunos estándares XML en ámbito legislativoEstándares que cumplen las características mencionadas más arriba: Akoma NtosoUna personalización de dicho estándar: LexML Brazil, (se utiliza en el Senado de Brasil)Chile ha adoptado en la BCN un estándar XML similar en algunos aspectos a Akoma Ntoso, pero que realiza la modelación del documento normativo ya en su fase conclusiva (promulgado) sin ocuparse de todo el íter legislativo
  24. 24. Estado del arte: XML en ámbito legislativoPrimera generación del estándar de documento legal XML , se orientó sobre todo a describir el texto legal y su estructura con un enfoque cercano a las entidades de base de datos o el procesamiento tipográfico de paradigmas
  25. 25. Estado del arte: XML en ámbito legislativoSegunda generación empleó una mayor atención en la modelización del documento y la descripción del texto, la estructura y los metadatos . Sin embargo, el carácter descriptivo de los elementos no fue precedido por un análisis abstracto de las clases de datos y el resultado es una lista demasiado larga de tags, una compleja inclusión de esquemas XML o DTD, con una frecuente superposición entre los metadatos y la definición de texto y unos instrumentos demasiado débiles para unir el texto con diferentes niveles (layers)
  26. 26. Estado del arte: XML en ámbito legislativoTercera generación se basa en el patrón (pattern). El patrón define las propiedades de la clase y su gramática, el modelo del contenido, el comportamiento y el respeto a la jerarquía de otras clases, por lo que cualquier tag adicional pertenece a una clase abstracta ya existente y de esta manera se preserva la coherencia a través del tiempo. Dedica especial atención a dividir el texto, la estructura y los metadatos. Mira a la ontología como un principio fundamental para realizar un seguimiento en firme de cualquier nuevo nivel (layer) colocado en la parte superior del texto puro. Debido a que el patrón define unas reglas generales que ya no están sujetas a limitaciones reales en la acción de mark-up, la claridad del diseño favorece su
  27. 27. Estado del arte: XML en ámbito legislativoCuarta generación utiliza el patrón (pattern) junto con una co- restricción a modo gramatical, con, entre otros, RELAX NG, Schematron, DSD, etc. para resolver el problema anteriormente mencionado de la falta de carácter prescriptivo
  28. 28. www.leychile.cl
  29. 29. Ley 22000Artículo 1. abc.Artículo 2. def.Artículo 3. ghi.Y por cuanto he tenido a bienaprobarlo y sancionarlo…
  30. 30. Ley 253451.- Modifica ley 22000 de la siguienteforma:e) reemplázase en el Artículo 1 laspalabras “a” por “xyz”.Y por cuanto he tenido a bienaprobarlo y sancionarlo…
  31. 31. t0 t1Ley 22000 Ley 22000Artículo 1. abc. Artículo 1. xyzbc.Artículo 2. def. Artículo 2. def.Artículo 3. ghi. Artículo 3. ghi.
  32. 32. Ley Chile Modelar “vida” de una norma
  33. 33. Ley Chile Modelar “estructura” de una norma
  34. 34. Ley Chile Modelar la “visualización” de una norma
  35. 35. http://www.leychile.cl 2009-“Nickname”, nombre popular
  36. 36. www.leychile.clAcceder a ley 19628 http://www.leychile.cl/Navegar?idNorma=141599 http://www.leychile.cl/Navegar?idLey=19628Obtener el XML de la norma http://www.leychile.cl/Consulta/obtxml?opt=7&idLey=19628 http://www.leychile.cl/Consulta/obtxml?opt=7&idNorma=141599
  37. 37. www.leychile.cl
  38. 38. www.leychile.clOtra opción es mediante un webservice http://www.leychile.cl/Consulta/obtxml?opt=61&cadena=[texto_a_buscar][&exacta=[1|]&cantidad=[5]]
  39. 39. www.leychile.clWeb Services Últimas leyes publicadas http://www.leychile.cl/Consulta/obtxml?opt=3 Dada una norma, obtener sus metadatos http://www.leychile.cl/Consulta/obtxml? opt=50&strBusqueda=117%23normal%23on||48%23normal%23on|| 53%23normal%23[idNorma] Vista “plana” http://www.leychile.cl/Consulta/obtxml?opt=63&idNorma=[idNorma] Para GLIN http://www.leychile.cl/Consulta/obtxml?opt=4546&idLey=[idLey] ...
  40. 40. www.leychile.cl
  41. 41. Web Semántica
  42. 42. Web SemánticaWeb Repleta de información Orientada al ser humano: para comprender el contenido de una página para relacionar contenidos dentro de una página (textos, imágenes, videos, etc.)
  43. 43. Web SemánticaWeb Dificultad en localización de la información (adaptar a una región específica, por ejemplo, traducir) Buscadores actuales funcionan bien, pero orientados al keyword Por ejemplo: “constitución” ¿la de Chile? ¿ciudad del sur?
  44. 44. Web SemánticaWeb Podría pensarse en una búsqueda semántica de información
  45. 45. Web Semánticahttp://www.hakia.com/http://www.sensebot.net/http://www.deepdyve.com/http://www.cognition.com/http://www.dogpile.com/http://www.standle.com/http://www.swingly.com/http://www.semager.com/http://www.truevert.com/http://duckduckgo.com/http://www.evri.com/http://www.mahalo.com/http://www.yebol.com/https://gfi.goldfire.com/http://kngine.com/http://www.ixquick.com/http://www.kosmix.com/http://www.exalead.com/search/http://www.lexxe.com/http://www.factbites.com/...
  46. 46. Web SemánticaPero el problema es la heterogeneidad de la información incluso en diferentes capas • Codificación (ASCII, UNICODE, etc.) • Lenguaje natural utilizado • Disposición de la información en la página web
  47. 47. Web Semántica¿Cómo integrar la información?• La información está implícita (se puede extraer de la combinación de los datos existentes)• Se requieren métodos de lógica formal Razonamiento automático
  48. 48. Web SemánticaSoluciones• ad hoc: usar métodos de IA para analizar la información no estructurada existente en la Web• a priori: estructurar la información en la Web para facilitar el análisis automático  Web Semántica
  49. 49. Web SemánticaDos condiciones esenciales para realizar lo anterior:3. Usar estándares abiertos para describir la información: • claramente definidos • flexibles • ampliables4. Métodos para extraer información de estas descripciones
  50. 50. Web SemánticaEstándares:
  51. 51. Web SemánticaOpen Data: es un idea que impulsa la publicación de datos de forma libre y asequible a cualquier persona para usar y republicar sin restricciones de ningún tipoLinked Data: es usar la web para conectar datos relacionados que no estaban enlazados previamente. Usa algunas de las mejores prácticas de la Web Semántica
  52. 52. http://datos.bcn.clOpen/Linked data Normas XML Tripletas RDF Ontologías OWL – RDF Schema LeyChile datos.bcn.cl Endpoint Sparql – Interfaz Web WS - SOAP Linked data desde consultas etc. Herramientas de generación de mashup del grafo Internet
  53. 53. Web SemánticaCaso BCN ¿Cómo definir las URI?
  54. 54. Modelo documentalCada documento bibliográfico debe ser pensado bajo tres puntos de vista siguiendo el estándar FRBR adoptado por el Grupo de Estudio IFLA sobre Requisitos Funcionales para Registros Bibliográficos: Trabajo: una creación intelectual o artística, la obra original producida por un autor, por ejemplo el Hamlet de Shakespeare Expresión: una clara realización intelectual o artística de una obra, por ejemplo la película de Hamlet en 1990 por Zeffirelli Manifestación: la encarnación física de una expresión concreta, por ejemplo, el formato DVD de la película
  55. 55. Modelo documentalEn nuestro caso, el documento legal es interpretado como una fuente bibliográfica y por esta razón tiene diferentes nombres:• Trabajo: el nombre de la ley en sí, por ejemplo, la Ley 34
  56. 56. Modelo documentalPor lo tanto, es importante definir en esta fase qué partes de todo el documento deberían ser convertidas en una manifestación XML y qué partes es mejor preservar en otros formatos (PDF, TIFF, etc.)El documento principal, los anexos y la tabla deben ser objeto de control y para cada uno de ellos se identifica una tipología de documento
  57. 57. URIPara cada uno se debe identificar el URI en cualquiera de los tres aspectos principales: Trabajo, Expresión, Manifestación.
  58. 58. URIHTML + RDFahttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.htmln3http://datos.bcn.cl/recurso/cl/LEY/20000/datos.n3RDFhttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.rdfJSONhttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.jsonntripleshttp://datos.bcn.cl/recurso/cl/LEY/20000/datos.ntriplesOtro ejemplo:http://datos.bcn.cl/recurso/cl/DTO/ministerio-de-educacion/2004-09-21/173/es@
  59. 59. URIDecreto 341 del 11 de noviembre de 2008 del Ministerio de Educación http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341Versión original http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2008-11-07Última versión http://datos.bcn.cl/recurso/cl/dto/ministerio-de-educacion/2008-11-07/341/es@2010-07-20
  60. 60. Enlaces
  61. 61. Consulta compleja Encontrar todas las normas emitidas por una municipalidad entre los años 1995 y 2000, pero que fueron modificadas después del año 2005PREFIX dc: <http://purl.org/dc/elements/1.1/>PREFIX n: <http://datos.bcn.cl/ontologies/bcn-norms#>SELECT distinct str(?normTitle) as ?Titulo str(?creatorName) as ?Municipio ?pubDate as ?Fecha_Publicacion ?pubDateOther as ?Fecha_modificacionWHERE { ?norm n:createdBy ?creator . ?creator n:hasName ?creatorName . ?norm dc:title ?normTitle . ?norm n:publishDate ?pubDate . ?norm n:isModifiedBy ?otherNorm . ?otherNorm n:publishDate ?pubDateOther . FILTER (regex(?creatorName,"MUNICIPALIDAD","i")) FILTER (?pubDate > xsd:date("1995") && ?pubDate < xsd:date("2000") && ?pubDateOther > xsd:date("2005"))}ORDER BY (?pubDate)
  62. 62. Endpoint SparqlListado de organismos:PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#>SELECT distinct ?nombreWHERE { ?org norms:creatorOf ?o . ?org norms:hasName ?nombre}
  63. 63. Endpoint SparqlVersiones de una norma: PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#> PREFIX dc: <http://purl.org/dc/elements/1.1/> PREFIX norms: <http://datos.bcn.cl/ontologies/bcn-norms#> SELECT ?n ?id_norma ?tipo ?prDate ?pbDate ?titulo ?lang ?html WHERE { ?n dc:identifier "484478"^^xsd:integer . ?n norms:hasNumber ?id_norma . ?n dc:title ?titulo . ?n dc:language ?lang . ?n norms:type ?tipo . ?n norms:promulgationDate ?prDate . ?n norms:publishDate ?pbDate . ?n norms:hasHtmlDocument ?html . }
  64. 64. Endpoint SparqlGrafo de una norma:PREFIX rdf:<http://www.w3.org/1999/02/22-rdf-syntax-ns#>PREFIX dc: <http://purl.org/dc/elements/1.1/>SELECT ?n ?p ?oWHERE { ?n ?p ?o . Filter (?n=<http://datos.bcn.cl/recurso/cl/ley/ministerio-secretaria-general-de-gobierno/2003-01-04/19846>).}
  65. 65. Endpoint SparqlGrafo de una norma:h ttp :/ d atos .b cn.cl/ cu rs o/ le y/ inis te rio-s e cre taria-ge ne ral-d e - / re cl/ m gob ie rno/ 2003-01 -04/ 9846/ atos .h tm l 1 d
  66. 66. Endpoint SparqlVinculaciones de modificatorias:P R E F IX rd f:< h ttp :/ www.w3.org/ 999/ 22-rd f-s yntax-ns #> / 1 02/P R E F IX d c: < h ttp :/ p u rl.org/ c/ le m e nts / .1 / / d e 1 >P R E F IX norm s : < h ttp :/ d atos .b cn.cl/ / ontologie s / cn-norm s #> bS E LE C T d is tinct ?n ?p ?m od ificatoriaWH E R E { ?n ?p ?m od ificatoria . ?n norm s :is M od ifie d By ?m od ificatoria .F ilte r (?n= < h ttp :/ d atos .b cn.cl/ cu rs o/ le y/ inis te rio-s e cre taria-ge ne ral-d e - / re cl/ m gob ie rno/ 2003-01 -04/ 9846> ) . 1}
  67. 67. Actualmente
  68. 68. Actualmente
  69. 69. Otra ontologíaReseñas biográficas no tenemos todos los años de nacimiento, ni fallecimiento, ni los lugares por ejemplo, Salvador de la Cavareda Trucios diputado suplente por Valparaíso 1824 a 1825 (hermano de Salvador y José Joaquín) Pero sabemos lo que nos falta PREFIX bcnbio: <http://datos.bcn.cl/ontologies/bcn-biographies#> select * where { ?a a foaf:Person . OPTIONAL {?a bcnbio:hasBorn ?ap } . FILTER (!bound(?ap)) . }
  70. 70. UsoAcceso - datos.bcn.cl - leer documentación de la ontología - acceder a endpoint sparql select ?p as ?Uri str(?n) as ?Nombre_Completo ?pa as ?Apellido_Paterno ?mo as ?Apellido_Materno where { ?p a foaf:Person . ?p rdfs:label ?n. ?p bcnbio:surnameOfFather ?pa. ?p bcnbio:surnameOfMother ?mo. }
  71. 71. Visualizaciones
  72. 72. ActualmenteExponer partes de la norma y su metadataIncorporar más datasets Reseñas biográficas Datos geográficos Transparencia Historia de la Ley Congreso y Recursos legislativos (modelan los documentos del Congreso Nacional)Nuevas visualizaciones
  73. 73. Referencias1. Carlos Iglesias (ed.), “Open Government Data: Feasibility Study in Chile”, 2011. https://public.webfoundation.org/2011/05/OGD_Chile.pdf3. Cirsfid - Università di Bologna, “XML Legislativo: Principios e instrumentos técnicos”, documento interno BID, 20115. Harth, Rudolph & ul Mehdi, “Semantic Web Technologies I”, 2010, http://semantic-web-grundlagen.de/w/images/3/3b/WS1011-1-Einleitung_und_XML.pdf

×