Introducción a CLARIN

796 views

Published on

Published in: Travel, Entertainment & Humor
0 Comments
0 Likes
Statistics
Notes
  • Be the first to comment

  • Be the first to like this

No Downloads
Views
Total views
796
On SlideShare
0
From Embeds
0
Number of Embeds
25
Actions
Shares
0
Downloads
5
Comments
0
Likes
0
Embeds 0
No embeds

No notes for slide
  • Introducción a CLARIN

    1. 1. CLARIN - ES Fase Preparatoria CLARIN en España Clarin – ES Barcelona, 19-12-2007
    2. 2. Índice <ul><li>Infraestructura CLARIN </li></ul><ul><li>Antecedentes </li></ul><ul><li>El proyecto CLARIN </li></ul><ul><li>Objetivos y plan de trabajo </li></ul>Clarin – ES Barcelona, 19-12-2007
    3. 3. INFRAESTRUCTURA CLARIN <ul><li>Basarse en tecnología grid, metadatos y servicios-web </li></ul><ul><li>- para garantizar la interoperabilidad que haga de un conjunto de elementos sin relación, diferentes y remotos, un sistema estructurado de componentes funcionales interconectados, y </li></ul><ul><li>- para facilitar la identificación, la ubicación, el acceso y la explotación de recursos lingüísticos. </li></ul>Clarin – ES Barcelona, 19-12-2007
    4. 4. Una infraestructura? Clarin – ES Barcelona, 19-12-2007
    5. 5. Recursos Lingüísticos Clarin – ES Barcelona, 19-12-2007
    6. 6. Antecedentes <ul><li>Archivo y gestión de datos lingüísticos: LAT, LAMUS, </li></ul><ul><li>Estandarización: EAGLES, ISLE, LIRICS-ISO </li></ul><ul><li>Prueba de concepto: IMDI, DAM-LR </li></ul><ul><li>Proyecto aprobado: </li></ul><ul><ul><li>ESFRI: European Strategy Forum on Research Infrastructures </li></ul></ul><ul><ul><li>7PM de la UE Capacities </li></ul></ul><ul><ul><li>AACC, Infraestructuras Científicas y Tecnológicas </li></ul></ul>Clarin – ES Barcelona, 19-12-2007
    7. 7. Proyecto CLARIN.eu <ul><li>Conseguir el apoyo de suficientes estados miembros: 22 estados en el consorcio, con apoyo expreso de sus gobiernos. </li></ul><ul><li>En España, hubo que demostrar el interés y la viabilidad. Se consiguió gracias a las cartas de apoyo recibidas. </li></ul>Clarin – ES Barcelona, 19-12-2007
    8. 8. Avales iniciales de CLARIN-ES <ul><li>Centro TALP, UPC </li></ul><ul><li>Laboratorio de Lingüística Informática , UAM </li></ul><ul><li>Dep. de Filología Española, UAB </li></ul><ul><li>Departamento de Traducción y Lingüística, UVigo </li></ul><ul><li>Departamento de Lengua Española, USantiago </li></ul><ul><li>Grupo IXA, Facultad de Informática, UPV </li></ul><ul><li>Real Academia Española </li></ul><ul><li>Institut d’Estudis Catalans </li></ul><ul><li>Dep. de Humanidades, U Castilla la Mancha </li></ul><ul><li>Dep. de Humanidades, U Carlos III </li></ul><ul><li>Dep. de Humanidades, UPF </li></ul>Clarin – ES Barcelona, 19-12-2007
    9. 9. El proyecto CLARIN-ES <ul><li>MEC: Acciones Complementarias para </li></ul><ul><li>Realización de actividades de carácter técnico de elementos o paquetes de trabajo correspondientes a la fase preparatoria de los proyectos de instalaciones científico-tecnológicas incluidas en la “Hoja de Ruta” del Foro Europeo Estratégico sobre Infraestructuras de Investigación (ESFRI). </li></ul><ul><li>Dirección General de Política Tecnológica </li></ul><ul><li>Subdirección Gral. de promoción e infraestructuras tecnológicas y grandes instalaciones. </li></ul>Clarin – ES Barcelona, 19-12-2007
    10. 10. Plan de trabajo (EU) <ul><li>WP1 – Management of the project </li></ul><ul><li>WP2 – Technical Infrastructure </li></ul><ul><li>WP3 – Humanities overview </li></ul><ul><li>WP5 – LRT overview </li></ul><ul><li>WP6 – Information gathering & dissemination </li></ul><ul><li>WP7 – Intellectual Property Rigth Issues </li></ul><ul><li>WP8 – Construction & Explotation Agreement </li></ul>Clarin – ES Barcelona, 19-12-2007
    11. 11. Objetivos de la Fase Preparatoria <ul><li>Acuerdo documentado y consensuado </li></ul><ul><li>Construcción de una maqueta: </li></ul><ul><ul><li>Evaluar el coste de construcción </li></ul></ul><ul><ul><li>Solucionar problemas técnicos </li></ul></ul><ul><ul><li>Tener en cuenta todas las lenguas de la UE </li></ul></ul><ul><li>Planificación detallada del desarrollo </li></ul>Clarin – ES Barcelona, 19-12-2007
    12. 12. Planificación Clarin <ul><li>Construcción de CLARIN 2011-2015: integración de recursos y tecnología desarrollo de aplicaciones piloto </li></ul><ul><li>Explotación del recurso 2016 - ... : </li></ul><ul><li>desarrollo de aplicaciones </li></ul><ul><li>Hay que garantizar el mantenimiento de los servicios y recursos: </li></ul><ul><li>CENTROS PERSISTENTES </li></ul>Clarin – ES Barcelona, 19-12-2007
    13. 13. Plan de trabajo (ES) <ul><li>Difusión y creación de comunidades – Recopilación de información sobre usuarios y proveedores posibles </li></ul><ul><li>Demostradores en el ámbito de humanidades: crear interés </li></ul><ul><li>Integración de RRLL españoles en la maqueta europea [de todas las lenguas del estado] </li></ul>Clarin – ES Barcelona, 19-12-2007
    14. 14. Detalles técnicos de CLARIN Clarin – ES Barcelona, 19-12-2007
    15. 15. Índice <ul><li>Integración en la Federación Clarin </li></ul><ul><li>Metadatos y estándares considerados </li></ul><ul><li>Ejemplos de herramientas posibles </li></ul>Clarin – ES Barcelona, 19-12-2007
    16. 16. Federación Clarin (1) <ul><li>Despliegue de la red “grid”: funcionalidades, identificación específica de recursos, y protocolos de sincronización, identificación y autenticación. </li></ul><ul><li>Compartir metadatos para la descripción de los recursos y las herramientas de búsqueda y localización de recursos que los utilizan </li></ul><ul><li>Compartir metadatos para describir los contenidos lingüísticos, y poder construir, gracias a la interoperabilidad, herramientas de acceso, análisis y explotación . </li></ul>Clarin – ES Barcelona, 19-12-2007
    17. 17. Funcionalidades GRID Clarin – ES Barcelona, 19-12-2007
    18. 18. Federación Clarin (2) <ul><li>Despliegue de la red “grid”: funcionalidades, identificación específica de recursos, y protocolos de sincronización, identificación y autenticación. </li></ul><ul><li>Compartir metadatos para la descripción de los recursos y las herramientas de búsqueda y localización de recursos que los utilizan. </li></ul><ul><li>Compartir metadatos para describir los contenidos lingüísticos, y poder construir, gracias a la interoperabilidad, herramientas de acceso, análisis y explotación . </li></ul>Clarin – ES Barcelona, 19-12-2007
    19. 19. Metadatos Clarin – ES Barcelona, 19-12-2007
    20. 20. Ejemplo de metadatos (2) Clarin – ES Barcelona, 19-12-2007
    21. 21. Ejemplo de metadatos (3) Clarin – ES Barcelona, 19-12-2007
    22. 22. Federación Clarin (3) <ul><li>Despliegue de la red “grid”: funcionalidades, identificación específica de recursos, y protocolos de sincronización, identificación y autenticación. </li></ul><ul><li>Compartir metadatos para la descripción de los recursos y las herramientas de búsqueda y localización de recursos que los utilizan </li></ul><ul><li>Compartir metadatos para describir los contenidos lingüísticos, y poder construir, gracias a la interoperabilidad, herramientas de acceso, análisis y explotación . </li></ul>Clarin – ES Barcelona, 19-12-2007
    23. 23. Estándares para la descripción de contenidos lingüísticos <ul><li>EAGLES, ISLE, LIRICS, ISO: </li></ul><ul><ul><li>codificación morfosintáctica, sintáctica y semántica; </li></ul></ul><ul><ul><li>Para corpus y léxico - LMF </li></ul></ul><ul><li>Data Category Registry, de ISO </li></ul><ul><li>Para descripción de voz SAMPA </li></ul><ul><li>queda trabajo, el problema es la definición!!! </li></ul>Clarin – ES Barcelona, 19-12-2007
    24. 25. Ejemplo del Lexical Markup Framework ISO TC37/SC 4 <ul><li>part of speech </li></ul><ul><li>grammatical category </li></ul><ul><li>word class </li></ul><ul><li>Category assigned to a word based on its grammatical and semantic properties </li></ul><ul><li>NOTE: ISO 12620 provides a comprehensive list of values for European languages. Examples of such values are: /noun/ and /verb/. </li></ul>
    25. 26. LMF Estructura Clarin – ES Barcelona, 19-12-2007
    26. 27. Data Category Registry Clarin – ES Barcelona, 19-12-2007
    27. 28. Federación Clarin (4) <ul><li>Posibles aplicaciones que acceden a diferentes recursos y herramientas de análisis </li></ul><ul><ul><li>Creación de un corpus de conversaciones entre personas de 16 a 18 años con ejemplos de abertura vocálica para marcar el plural en castellano peninsular </li></ul></ul><ul><ul><li>“ Query expansion” para hacer búsquedas en textos históricos </li></ul></ul>Clarin – ES Barcelona, 19-12-2007
    28. 29. Ejemplo de herramienta Clarin – ES Barcelona, 19-12-2007
    29. 30. Ejemplo de herramienta <ul><li>Pero serán herramientas de las de aquí a diez años!! </li></ul><ul><li>Los instrumentos de análisis y explotación serán herramientas basadas en tecnologías lingüísticas. </li></ul><ul><li>Analizar los artículos de opinión de un periódico X y obtener la distribución temporal de los marcadores discursivos de opinión negativa sobre el tema “educación” en los últimos diez meses. </li></ul>Clarin – ES Barcelona, 19-12-2007
    30. 31. Definición de aplicaciones básicas <ul><li>Importancia de los usuarios </li></ul><ul><li>Necesitamos saber sus procesos más repetidos y sus necesidades más futuribles!!! </li></ul><ul><li>Acceso y uso de instrumentos de explotación y análisis mediante tecnología lingüística </li></ul><ul><li>Creando la e-ciencia en humanidades y ciencias sociales </li></ul>Clarin – ES Barcelona, 19-12-2007
    31. 32. Resumiendo … Clarin – ES Barcelona, 19-12-2007
    32. 33. Tipología de centros CLARIN <ul><li>Proveedor de RRLL: datos y tecnología </li></ul><ul><li>Archivos CLARIN, que garanticen la persistencia </li></ul><ul><li>Centros de entrada al sistema (portales) </li></ul><ul><li>Creadores de aplicaciones que exploten los RRLL </li></ul>Clarin – ES Barcelona, 19-12-2007
    33. 34. Proveedores de recursos <ul><li>Describir sus recursos con los metadatos usados en CLARIN </li></ul><ul><li>Convertir sus recursos en “interoperativos”: que puedan ser input/output de procesos. </li></ul><ul><li>Convertir sus herramientas/aplicaciones para que acepten i/o CLARIN </li></ul>Clarin – ES Barcelona, 19-12-2007
    34. 35. Gracias! Clarin – ES Barcelona, 19-12-2007
    35. 36. Índice <ul><li>Objetivos de la Fase Preparatoria </li></ul><ul><li>Organización en España </li></ul><ul><li>Calendario </li></ul><ul><li>Canales de comunicación </li></ul>Clarin – ES Barcelona, 19-12-2007
    36. 37. Objetivos Fase Preparatoria <ul><li>Obtener apoyo y financiación del Estado español para la construcción de Clarin 2011-2015 </li></ul><ul><li>Obtener financiación para el mantenimiento y explotación de Clarin 2016 - .... </li></ul>Clarin – ES Barcelona, 19-12-2007
    37. 38. Necesitamos <ul><li>Suficiente respaldo para demostrar que en España hay una masa crítica de usuarios y proveedores. </li></ul><ul><li>Documentación: </li></ul><ul><ul><li>Planificación detallada de la construcción (incluya centros proveedores, aplicaciones piloto, etc.) </li></ul></ul><ul><ul><li>Evaluación económica de los costes </li></ul></ul>Clarin – ES Barcelona, 19-12-2007
    38. 39. Estructurar la colaboración de organismos españoles para: <ul><li>participación en la solicitud del proyecto español </li></ul><ul><li>evaluación del coste (económico y temporal) de la integración de los recursos/servicios </li></ul><ul><li>evaluación del coste (económico y temporal) del mantenimiento del recurso/servicio </li></ul><ul><li>desarrollo del modelo de organización español (con el modelo europeo, o no) </li></ul>Clarin – ES Barcelona, 19-12-2007
    39. 40. FP: Evaluación y planificación <ul><li>Integración: </li></ul><ul><ul><li>Evaluar el coste de la integración de un centro en la red CLARIN (autenticación, etc.) </li></ul></ul><ul><ul><li>Evaluar el coste de la integración de los recursos/servicios: descripción y estandarización. </li></ul></ul><ul><li>Garantizar la persistencia del recurso/servicio </li></ul>Clarin – ES Barcelona, 19-12-2007
    40. 41. FP: Organización de comunidades <ul><li>Invitación a proponer recursos/aplicaciones para su integración </li></ul><ul><li>Búsqueda y recopilación de datos para hacer una lista definitiva de integrables que conste en la solicitud </li></ul><ul><li>Estos recursos entrarán en la planificación y evaluación de costes </li></ul>Clarin – ES Barcelona, 19-12-2007
    41. 42. Organización en España FP: propuestas.... <ul><li>Firma de un convenio bilateral (UPF-X) que declare el compromiso de los centros en la construcción de CLARIN </li></ul><ul><ul><li>Interés en integrar recursos y/o aplicaciones </li></ul></ul><ul><ul><li>Interés en solicitar aplicaciones propias </li></ul></ul><ul><li>Acuerdo con los usuarios? </li></ul><ul><li>Para discutirlo en el coloquio ... </li></ul>Clarin – ES Barcelona, 19-12-2007
    42. 43. Calendario <ul><li>Enero 2008 – Inicio CLARIN.eu </li></ul><ul><li>Abril 2008 – 1 Lista Centros CLARIN-ES </li></ul><ul><li>Junio 2008 – CLARIN-ES (2) AACC </li></ul><ul><li>Junio 2008 - Requisitos del Registro </li></ul>Clarin – ES Barcelona, 19-12-2007
    43. 44. Canales de comunicación <ul><li>Página web </li></ul><ul><ul><li>Información y enlaces </li></ul></ul><ul><ul><li>Módulo foros </li></ul></ul><ul><ul><li>Módulo usuarios: danos una idea, dinos un posible usuario </li></ul></ul><ul><ul><li>Módulo descripción de recursos (en construcción) </li></ul></ul>Clarin – ES Barcelona, 19-12-2007

    ×