SlideShare a Scribd company logo
1 of 19
Herramientas para extracción y mejora de la
calidad de los datos a intercambiar .

Gabriel Berlicki
Administrador de Datos
División de Modernización de Infraestructuras
Procedimiento normal de generacion
de archivos de datos en Latipat
 En la mayoría de los países que Envían datos a Latipat
 EPO y Ompi, el procedimiento de extracción y mejora de
 los mismos pasa por las siguientes etapas:
     • Extracción de datos desde el sistema con un
       procedimiento de la base de datos
     • Constitución de un archivo de texto de acuerdo a
       st32 ( o directamente XML ST36)
     • Que se controla manualmente ( a veces utilizando
       la herramienta IPCONV de EPO)
     • Una vez validado es enviado ( ftp o correo)
Procesamiento de los archivos
 Una vez recibido por EPO, los archivos son validados, y
 en caso de serpasa que hay que corregir algún que otro
  Pero siempre necesario corregidos en forma
  registro.
 automática y hasta en forma manual.
 En el caso de OMPI, se las prioridades, puede pasar
  En el caso particular de esta comenzando a
  que se necesite de un operador humano para realizar la
 implementar un procedimiento similar
  validación del valor o la asignación del real
 Esto es necesario para poder tener un relacionamiento
  No es necesario explicar que es un procedimiento lento,
 valido de los registros recibidos desde los países con los
 equivalentes que pudieseen muchos casos es el que
  tedioso y costoso, y que tener a nivel internacional.
  demora la carga de los datos y su relacionamiento con
 Para los países de Latipat, y luego de todo el
  otros documentos
 entrenamiento proporcionado en los seminarios
 anteriores, se puede mencionar que:
          La calidad es muy buena.
Porque repetimos tanto relacionamiento?
   El problema a fin y al cabo es el lenguaje.
   Los sistemas de traducción automática aun esta en
   pañales.
   Si un usuario no hispano o luso parlante ( ej de US, EU o
   asiáticos ) desea enterarse que es lo que esta protegido
   en un determinado país de Latinoamérica. La puede tener
   muy complicada.
   Cualquier inversor extranjero antes de comenzar un
   proyecto, lo primero que hace es tratar de evaluar que
   protección tiene (en el país a instalarse) en su área
   especifica de trabajo
Cont.
 Nobien hay el tema de producción de genéricos,
 Si solo es algunos sistemas que permiten la
 hay que tener en cuenta que muchos de
 traducción automática de la estrategia
 procedimientos industriales están protegidos.
 búsqueda.
 Y el mismos solo tienen utilidad para el usuario no
 Los existir un documento que proteja dicho
 procedimiento, implica la negociación de una
 profesional.
 licencia de uso. O sea el precio del producto final
 BASF no va a utilizar CLIR para saber si algo lo
 va a ser mayor. no en un país determinado.
 puede afectar o
Cont.
  Lo mas probable es que el inversor procederá a verificar si
  las patentes de sus competidores se encuentran
  presentadas en el país.
  Obviamente eso pasara por una eventual solicitud de
  búsqueda en la oficina del país para tener un documento
  oficial de que no fue presentado.
  Pero inicialmente consultara que no existan registros
  equivalentes a dichos documentos en la Master Database
  (DocDB).
  A través de hacer una búsqueda en Espacenet, en otro
  proveedor privado con acceso a la misma.
  O para máximo nivel de seguridad, en una copia local de
  DocDB que haya podido obtener, particularmente para
  evitar monitoreo de sus intenciones de inversión )
  O en Patenscope (particularmente la cobertura
de países de la región es muy buena).
El punto es …. (…..por fin Gabe…)
  Al fin y al cabo, ellos buscan relacionamientos,
  equivalentes locales...

  Por lo que no es lo mismo que un documento este bien
  relacionado.
Y si se comete un pequeño error?

                                      AU2008904924
                               De    AU2008904924




A:   AU2003904924

     No es un error importante no?
AU2003904924
Problemas de la postcorreccion
 Particularmente, siun lenguaje realiza de EPO, errores en
  El español no es el inversor oficial una búsqueda
 local y el documento que le interesa no posibles
  la corrección manual de los datos son fue encontrado,
 porque el numero se prioridad por elOMPIse le están por
  Los mecanismos de corrección en cual aun busco en
  determinar, probablemente no incluirán corrección
 la base nacional fue ingresado incorrectamente
  humana con interpretación del documento.
 Particularmente si hay un informe firmado por el
  En cualquier caso, toda corrección que se realiza luego
 Director, mencionando que la invención no fue
  del envió a Latipat, difícilmente se refleje en las bases
 registrada en la Oficina...
  nacionales.
 El problema no lo va a tener el administrativo que se
 equivocopuede traer graves problemas a posteriori para
  Lo cual o el examinador que no encontró el
  la oficina nacional.
 documento, el problema es de informática:
  “Que no hizo los esfuerzos necesarios para validar la
  información contenida en la base de datos“.
Digamos que...
 El que un documento no sea relacionado en la forma
 correcta puede tener consecuencias complicadas para
 el inversor...
 Su Director...
 Y USTEDES
 Tengan en cuenta que estos ejemplos son una
 construcción hipotética, no hay casos tan marcados
 como esto....y esperemos que sigan así
Alternativas
 Inclusión de mecanismos de validación de los datos de
 prioridad que se ingresan en las interfaces de captura
 manual de datos.
 Los mismos pueden ser construidos basados en las
 reglas de números de publicación y solicitud que publica
 le EPO en el siguiente link:
 http://www.epo.org/searching/essentials/data/tables.html
 Mayormente allí se encuentran los formatos utilizados
 por los países de los solicitantes que normalmente
 registran prioridades en Latinoamérica.
 Otra alternativa es la validación de los mismos previo al
 envió, con el correspondiente registro de la información
 corregida en la base de datos.
Pucha Gabe mas trabajo....
 Bueno no tanto…

 OMPI esta adicionalmente preparando una aplicación
 para la extracción directa, validación de los datos y
 preparación de contenedor bibliográfico de acuerdo al
 ST.36:
                                  t
                   WIPO Q @ S
                            u      o
                            a      u
                            l      r
                            i      c
                            t      e
                            y
WIPOQ@S que es?
 Una aplicación externa que interroga a la base de datos
 de la oficina sobre las solicitudes que han sido
 publicadas en el mes(u otro intervalo de tiempo)
 Recupera los datos necesarios de los diferentes campos
 de la base (hasta aquí como los procedimientos
 utilizados normalmente)
 A partir de allí procede a validar los datos respecto a
 reglas predefinidas (como las mencionadas
 anteriormente para prioridades)
 Si no es posible validar, interroga al usuario sobre el
 error encontrado y le propone alternativas (brindadas
 por las reglas) y adicionalmente proveyendo la
 información que (en lo posible) se pueda disponer de un
 equivalente encontrado en Espacenet o Patentscope
Cont.
 Finalmente generaría un reporte de lo realizado y los
 archivos correspondientes en formato ST.36 ( y ST.32 si
 se debe mantener compatibilidad de envíos por un
 tiempo limitado)
 Cabria la posibilidad que cuando la información se
 valida se incluya la facilidad de escribir la base de datos.
 Pero esto debería ser discutido con cada oficina, no es
 una decisión fácil de tomar para el encargado de IT y
 tampoco es fácil de implementar( cuestiones de
 seguridad y configuración de como realizar la escritura
 de los datos).
En resumen..

 Básicamente se realizaría la interrogación de la base de
 datos mediante la ejecución de SQLs configurables en
 un archivo XML

 Las reglas de corrección validación se mantendrían en
 una base de datos, que podrían ser actualizadas e
 incluso mejoradas por la oficina( particularmente si
 saben de algún error repetitivo en la captura de los
 datos)
Estado del proyecto.

 Prototipo implementado en ONAPI desde principios de
 2011, produciendo los datos que se envían a EPO y
 Patentscope.

 Si dicho prototipo encuentra una solicitud sin
 clasificación, la cual posee un equivalente en Espacenet
 o Patentscope, descarga la clasificación del mismo y lo
 incluye en el ST.36 del registro a enviar (un beneficio
 adicional de la posibilidad de validar los datos).
Cont.
 Por el momento el prototipo esta basado en línea de
 comando y no interroga al usuario ( interface inicial a
 implementar antes de fin de año)
 En fase de construcción y mejora de las reglas a aplicar
 a las prioridades de los países que se conocen.
 Un producto secundario del proyecto es una base de
 datos con expresiones regulares para corregir los datos
 de prioridad.
 Actualmente disponibles reglas para BR, ES, EP y US.
Cont.

 Posibilidad de versión light, que no interrogue a la base
 de datos y se base en la lectura de un archivo de texto,
 a la IPCONV. Pero que incluya las validaciones.
 Panamá esta comenzando a utilizar una versión similar,
 hasta que sea posible la implementación de la versión
 con interrogación de la base de datos.
Futuro del proyecto

 Versión "funcional" e instalable para fin de año (código
 basado en Perl).

 A partir de allí, comenzaría una la reescritura y mejora
 del código por contratista externo(a la vez de convertir el
 código a Java), para tener una versión como producto
 oficial de OMPI para la segunda mitad de 2012.

More Related Content

Similar to Gb wipoq@s

Sesion 3: Método de desarrollo de proyecto
Sesion 3: Método de desarrollo de proyectoSesion 3: Método de desarrollo de proyecto
Sesion 3: Método de desarrollo de proyectoelearningCANDANE
 
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-Source
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-SourceWeb-alternativa-al-Senado-de-Espana-desarrollada-Open-Source
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-Sourcesenado-web-clon
 
Oswaldo jirones ipc
Oswaldo jirones ipcOswaldo jirones ipc
Oswaldo jirones ipcLATIPAT
 
Sesion 05 erp
Sesion 05 erpSesion 05 erp
Sesion 05 erpmydraw
 
Sistema para la gestión de interrupciones y medios informáticos en Artex S.A
Sistema para la gestión de interrupciones y medios informáticos en Artex S.ASistema para la gestión de interrupciones y medios informáticos en Artex S.A
Sistema para la gestión de interrupciones y medios informáticos en Artex S.ARodrigoGonzlezEsparz
 
Estrategia empresa virtual (punto 2 unidad 2)
Estrategia empresa virtual (punto 2 unidad 2)Estrategia empresa virtual (punto 2 unidad 2)
Estrategia empresa virtual (punto 2 unidad 2)JUAN ENRIQUE
 
Introducción a la base de datos - Taller N° 1
Introducción a la base de datos - Taller N° 1Introducción a la base de datos - Taller N° 1
Introducción a la base de datos - Taller N° 1AndreaTuta
 
Trabajo de base de datos
Trabajo de base de datosTrabajo de base de datos
Trabajo de base de datosMerlyn Peraza
 
Proseso de diseño de un (si)
Proseso de diseño de un (si)Proseso de diseño de un (si)
Proseso de diseño de un (si)marcelino garcia
 
Maria capuzzo blogdigital
Maria capuzzo blogdigitalMaria capuzzo blogdigital
Maria capuzzo blogdigitalMariaCapuzzo
 

Similar to Gb wipoq@s (20)

Taller 1 access
Taller 1 accessTaller 1 access
Taller 1 access
 
Clase 6, 5/9/2007
Clase 6, 5/9/2007Clase 6, 5/9/2007
Clase 6, 5/9/2007
 
Sesion 3: Método de desarrollo de proyecto
Sesion 3: Método de desarrollo de proyectoSesion 3: Método de desarrollo de proyecto
Sesion 3: Método de desarrollo de proyecto
 
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-Source
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-SourceWeb-alternativa-al-Senado-de-Espana-desarrollada-Open-Source
Web-alternativa-al-Senado-de-Espana-desarrollada-Open-Source
 
Oswaldo jirones ipc
Oswaldo jirones ipcOswaldo jirones ipc
Oswaldo jirones ipc
 
Sesion 05 erp
Sesion 05 erpSesion 05 erp
Sesion 05 erp
 
Dominios producto final
Dominios producto finalDominios producto final
Dominios producto final
 
Informe big data
Informe big dataInforme big data
Informe big data
 
Sistema para la gestión de interrupciones y medios informáticos en Artex S.A
Sistema para la gestión de interrupciones y medios informáticos en Artex S.ASistema para la gestión de interrupciones y medios informáticos en Artex S.A
Sistema para la gestión de interrupciones y medios informáticos en Artex S.A
 
Estrategia empresa virtual (punto 2 unidad 2)
Estrategia empresa virtual (punto 2 unidad 2)Estrategia empresa virtual (punto 2 unidad 2)
Estrategia empresa virtual (punto 2 unidad 2)
 
Empresa siste +
Empresa siste +Empresa siste +
Empresa siste +
 
Introducción a la base de datos - Taller N° 1
Introducción a la base de datos - Taller N° 1Introducción a la base de datos - Taller N° 1
Introducción a la base de datos - Taller N° 1
 
Ers calzado ferrel
Ers calzado ferrelErs calzado ferrel
Ers calzado ferrel
 
Top Bug
Top BugTop Bug
Top Bug
 
Sistema de tramite documentario ppt
Sistema de tramite documentario pptSistema de tramite documentario ppt
Sistema de tramite documentario ppt
 
METODOLOGIA EMPLEADA
METODOLOGIA EMPLEADAMETODOLOGIA EMPLEADA
METODOLOGIA EMPLEADA
 
La biblia del foot printing
La biblia del foot printingLa biblia del foot printing
La biblia del foot printing
 
Trabajo de base de datos
Trabajo de base de datosTrabajo de base de datos
Trabajo de base de datos
 
Proseso de diseño de un (si)
Proseso de diseño de un (si)Proseso de diseño de un (si)
Proseso de diseño de un (si)
 
Maria capuzzo blogdigital
Maria capuzzo blogdigitalMaria capuzzo blogdigital
Maria capuzzo blogdigital
 

More from LATIPAT

Ftp data exchange-mechanism
Ftp data exchange-mechanismFtp data exchange-mechanism
Ftp data exchange-mechanismLATIPAT
 
Citation data flow 2012 nat latipat
Citation data flow 2012 nat latipatCitation data flow 2012 nat latipat
Citation data flow 2012 nat latipatLATIPAT
 
2012 11 latipat-cpc_epo
2012 11 latipat-cpc_epo2012 11 latipat-cpc_epo
2012 11 latipat-cpc_epoLATIPAT
 
2012 11 latipat-ccd_epo
2012 11 latipat-ccd_epo2012 11 latipat-ccd_epo
2012 11 latipat-ccd_epoLATIPAT
 
03 patent families latipat the powerpoint
03 patent families latipat   the powerpoint03 patent families latipat   the powerpoint
03 patent families latipat the powerpointLATIPAT
 
Servicios de información y fuentes latest developments sept_2011
Servicios de información y fuentes latest developments sept_2011Servicios de información y fuentes latest developments sept_2011
Servicios de información y fuentes latest developments sept_2011LATIPAT
 
Intercambio electrónico 2011
Intercambio electrónico 2011Intercambio electrónico 2011
Intercambio electrónico 2011LATIPAT
 
Estadistica acceso latipat
Estadistica acceso latipatEstadistica acceso latipat
Estadistica acceso latipatLATIPAT
 
Epo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesEpo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesLATIPAT
 
Presentacion 20111019 latipat
Presentacion 20111019 latipatPresentacion 20111019 latipat
Presentacion 20111019 latipatLATIPAT
 
Presentation vm latipat2011 ver 3
Presentation vm latipat2011 ver 3Presentation vm latipat2011 ver 3
Presentation vm latipat2011 ver 3LATIPAT
 
Papel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arPapel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arLATIPAT
 
Epo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesEpo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesLATIPAT
 
Papel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arPapel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arLATIPAT
 
2011 reunión latipat alberto casado
2011  reunión latipat alberto casado2011  reunión latipat alberto casado
2011 reunión latipat alberto casadoLATIPAT
 
2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentesLATIPAT
 
2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentesLATIPAT
 
2011 alberto casado._reunión_latipat_(version_2)
2011 alberto casado._reunión_latipat_(version_2)2011 alberto casado._reunión_latipat_(version_2)
2011 alberto casado._reunión_latipat_(version_2)LATIPAT
 
Latipat2011
Latipat2011Latipat2011
Latipat2011LATIPAT
 
Latipat cuba
Latipat  cubaLatipat  cuba
Latipat cubaLATIPAT
 

More from LATIPAT (20)

Ftp data exchange-mechanism
Ftp data exchange-mechanismFtp data exchange-mechanism
Ftp data exchange-mechanism
 
Citation data flow 2012 nat latipat
Citation data flow 2012 nat latipatCitation data flow 2012 nat latipat
Citation data flow 2012 nat latipat
 
2012 11 latipat-cpc_epo
2012 11 latipat-cpc_epo2012 11 latipat-cpc_epo
2012 11 latipat-cpc_epo
 
2012 11 latipat-ccd_epo
2012 11 latipat-ccd_epo2012 11 latipat-ccd_epo
2012 11 latipat-ccd_epo
 
03 patent families latipat the powerpoint
03 patent families latipat   the powerpoint03 patent families latipat   the powerpoint
03 patent families latipat the powerpoint
 
Servicios de información y fuentes latest developments sept_2011
Servicios de información y fuentes latest developments sept_2011Servicios de información y fuentes latest developments sept_2011
Servicios de información y fuentes latest developments sept_2011
 
Intercambio electrónico 2011
Intercambio electrónico 2011Intercambio electrónico 2011
Intercambio electrónico 2011
 
Estadistica acceso latipat
Estadistica acceso latipatEstadistica acceso latipat
Estadistica acceso latipat
 
Epo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesEpo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniques
 
Presentacion 20111019 latipat
Presentacion 20111019 latipatPresentacion 20111019 latipat
Presentacion 20111019 latipat
 
Presentation vm latipat2011 ver 3
Presentation vm latipat2011 ver 3Presentation vm latipat2011 ver 3
Presentation vm latipat2011 ver 3
 
Papel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arPapel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_ar
 
Epo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniquesEpo info resources & espacenet & search techniques
Epo info resources & espacenet & search techniques
 
Papel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_arPapel de la ompi promocion innov arc_ar
Papel de la ompi promocion innov arc_ar
 
2011 reunión latipat alberto casado
2011  reunión latipat alberto casado2011  reunión latipat alberto casado
2011 reunión latipat alberto casado
 
2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes
 
2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes2011 octubre búsqueda de patentes
2011 octubre búsqueda de patentes
 
2011 alberto casado._reunión_latipat_(version_2)
2011 alberto casado._reunión_latipat_(version_2)2011 alberto casado._reunión_latipat_(version_2)
2011 alberto casado._reunión_latipat_(version_2)
 
Latipat2011
Latipat2011Latipat2011
Latipat2011
 
Latipat cuba
Latipat  cubaLatipat  cuba
Latipat cuba
 

Recently uploaded

1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...JoseMartinMalpartida1
 
Código Civil de la República Bolivariana de Venezuela
Código Civil de la República Bolivariana de VenezuelaCódigo Civil de la República Bolivariana de Venezuela
Código Civil de la República Bolivariana de Venezuelabeltranponce75
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxlclcarmen
 
Actividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docxActividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docxpaogar2178
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024IES Vicent Andres Estelles
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfapunteshistoriamarmo
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxFernando Solis
 
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdfPlan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdfcarolinamartinezsev
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Juan Martín Martín
 
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...JAVIER SOLIS NOYOLA
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxroberthirigoinvasque
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024IES Vicent Andres Estelles
 
prostitución en España: una mirada integral!
prostitución en España: una mirada integral!prostitución en España: una mirada integral!
prostitución en España: una mirada integral!CatalinaAlfaroChryso
 
FICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdf
FICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdfFICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdf
FICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdfRaulGomez822561
 
AEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptxAEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptxhenarfdez
 
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPCTRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPCCarlosEduardoSosa2
 

Recently uploaded (20)

1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
1ro Programación Anual D.P.C.C planificación anual del área para el desarroll...
 
Código Civil de la República Bolivariana de Venezuela
Código Civil de la República Bolivariana de VenezuelaCódigo Civil de la República Bolivariana de Venezuela
Código Civil de la República Bolivariana de Venezuela
 
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptxLA LITERATURA DEL BARROCO 2023-2024pptx.pptx
LA LITERATURA DEL BARROCO 2023-2024pptx.pptx
 
Tema 11. Dinámica de la hidrosfera 2024
Tema 11.  Dinámica de la hidrosfera 2024Tema 11.  Dinámica de la hidrosfera 2024
Tema 11. Dinámica de la hidrosfera 2024
 
Actividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docxActividades para el 11 de Mayo día del himno.docx
Actividades para el 11 de Mayo día del himno.docx
 
Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024Tema 17. Biología de los microorganismos 2024
Tema 17. Biología de los microorganismos 2024
 
Revista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdfRevista Apuntes de Historia. Mayo 2024.pdf
Revista Apuntes de Historia. Mayo 2024.pdf
 
Concepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptxConcepto y definición de tipos de Datos Abstractos en c++.pptx
Concepto y definición de tipos de Datos Abstractos en c++.pptx
 
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdfPlan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
Plan-de-la-Patria-2019-2025- TERCER PLAN SOCIALISTA DE LA NACIÓN.pdf
 
Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024Prueba libre de Geografía para obtención título Bachillerato - 2024
Prueba libre de Geografía para obtención título Bachillerato - 2024
 
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN  PARÍS. Por JAVIER SOL...
ACERTIJO LA RUTA DEL MARATÓN OLÍMPICO DEL NÚMERO PI EN PARÍS. Por JAVIER SOL...
 
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptxCONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
CONCURSO NACIONAL JOSE MARIA ARGUEDAS.pptx
 
Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024Tema 10. Dinámica y funciones de la Atmosfera 2024
Tema 10. Dinámica y funciones de la Atmosfera 2024
 
prostitución en España: una mirada integral!
prostitución en España: una mirada integral!prostitución en España: una mirada integral!
prostitución en España: una mirada integral!
 
FICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdf
FICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdfFICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdf
FICHA PROYECTO COIL- GLOBAL CLASSROOM.docx.pdf
 
AEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptxAEC 2. Aventura en el Antiguo Egipto.pptx
AEC 2. Aventura en el Antiguo Egipto.pptx
 
PP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomasPP_Comunicacion en Salud: Objetivación de signos y síntomas
PP_Comunicacion en Salud: Objetivación de signos y síntomas
 
Supuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docxSupuestos_prácticos_funciones.docx
Supuestos_prácticos_funciones.docx
 
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPCTRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
TRABAJO FINAL TOPOGRAFÍA COMPLETO DE LA UPC
 
Sesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdfSesión de clase APC: Los dos testigos.pdf
Sesión de clase APC: Los dos testigos.pdf
 

Gb wipoq@s

  • 1. Herramientas para extracción y mejora de la calidad de los datos a intercambiar . Gabriel Berlicki Administrador de Datos División de Modernización de Infraestructuras
  • 2. Procedimiento normal de generacion de archivos de datos en Latipat En la mayoría de los países que Envían datos a Latipat EPO y Ompi, el procedimiento de extracción y mejora de los mismos pasa por las siguientes etapas: • Extracción de datos desde el sistema con un procedimiento de la base de datos • Constitución de un archivo de texto de acuerdo a st32 ( o directamente XML ST36) • Que se controla manualmente ( a veces utilizando la herramienta IPCONV de EPO) • Una vez validado es enviado ( ftp o correo)
  • 3. Procesamiento de los archivos Una vez recibido por EPO, los archivos son validados, y en caso de serpasa que hay que corregir algún que otro Pero siempre necesario corregidos en forma registro. automática y hasta en forma manual. En el caso de OMPI, se las prioridades, puede pasar En el caso particular de esta comenzando a que se necesite de un operador humano para realizar la implementar un procedimiento similar validación del valor o la asignación del real Esto es necesario para poder tener un relacionamiento No es necesario explicar que es un procedimiento lento, valido de los registros recibidos desde los países con los equivalentes que pudieseen muchos casos es el que tedioso y costoso, y que tener a nivel internacional. demora la carga de los datos y su relacionamiento con Para los países de Latipat, y luego de todo el otros documentos entrenamiento proporcionado en los seminarios anteriores, se puede mencionar que: La calidad es muy buena.
  • 4. Porque repetimos tanto relacionamiento? El problema a fin y al cabo es el lenguaje. Los sistemas de traducción automática aun esta en pañales. Si un usuario no hispano o luso parlante ( ej de US, EU o asiáticos ) desea enterarse que es lo que esta protegido en un determinado país de Latinoamérica. La puede tener muy complicada. Cualquier inversor extranjero antes de comenzar un proyecto, lo primero que hace es tratar de evaluar que protección tiene (en el país a instalarse) en su área especifica de trabajo
  • 5. Cont. Nobien hay el tema de producción de genéricos, Si solo es algunos sistemas que permiten la hay que tener en cuenta que muchos de traducción automática de la estrategia procedimientos industriales están protegidos. búsqueda. Y el mismos solo tienen utilidad para el usuario no Los existir un documento que proteja dicho procedimiento, implica la negociación de una profesional. licencia de uso. O sea el precio del producto final BASF no va a utilizar CLIR para saber si algo lo va a ser mayor. no en un país determinado. puede afectar o
  • 6. Cont. Lo mas probable es que el inversor procederá a verificar si las patentes de sus competidores se encuentran presentadas en el país. Obviamente eso pasara por una eventual solicitud de búsqueda en la oficina del país para tener un documento oficial de que no fue presentado. Pero inicialmente consultara que no existan registros equivalentes a dichos documentos en la Master Database (DocDB). A través de hacer una búsqueda en Espacenet, en otro proveedor privado con acceso a la misma. O para máximo nivel de seguridad, en una copia local de DocDB que haya podido obtener, particularmente para evitar monitoreo de sus intenciones de inversión ) O en Patenscope (particularmente la cobertura de países de la región es muy buena).
  • 7. El punto es …. (…..por fin Gabe…) Al fin y al cabo, ellos buscan relacionamientos, equivalentes locales... Por lo que no es lo mismo que un documento este bien relacionado.
  • 8. Y si se comete un pequeño error? AU2008904924 De AU2008904924 A: AU2003904924 No es un error importante no? AU2003904924
  • 9. Problemas de la postcorreccion Particularmente, siun lenguaje realiza de EPO, errores en El español no es el inversor oficial una búsqueda local y el documento que le interesa no posibles la corrección manual de los datos son fue encontrado, porque el numero se prioridad por elOMPIse le están por Los mecanismos de corrección en cual aun busco en determinar, probablemente no incluirán corrección la base nacional fue ingresado incorrectamente humana con interpretación del documento. Particularmente si hay un informe firmado por el En cualquier caso, toda corrección que se realiza luego Director, mencionando que la invención no fue del envió a Latipat, difícilmente se refleje en las bases registrada en la Oficina... nacionales. El problema no lo va a tener el administrativo que se equivocopuede traer graves problemas a posteriori para Lo cual o el examinador que no encontró el la oficina nacional. documento, el problema es de informática: “Que no hizo los esfuerzos necesarios para validar la información contenida en la base de datos“.
  • 10. Digamos que... El que un documento no sea relacionado en la forma correcta puede tener consecuencias complicadas para el inversor... Su Director... Y USTEDES Tengan en cuenta que estos ejemplos son una construcción hipotética, no hay casos tan marcados como esto....y esperemos que sigan así
  • 11. Alternativas Inclusión de mecanismos de validación de los datos de prioridad que se ingresan en las interfaces de captura manual de datos. Los mismos pueden ser construidos basados en las reglas de números de publicación y solicitud que publica le EPO en el siguiente link: http://www.epo.org/searching/essentials/data/tables.html Mayormente allí se encuentran los formatos utilizados por los países de los solicitantes que normalmente registran prioridades en Latinoamérica. Otra alternativa es la validación de los mismos previo al envió, con el correspondiente registro de la información corregida en la base de datos.
  • 12. Pucha Gabe mas trabajo.... Bueno no tanto… OMPI esta adicionalmente preparando una aplicación para la extracción directa, validación de los datos y preparación de contenedor bibliográfico de acuerdo al ST.36: t WIPO Q @ S u o a u l r i c t e y
  • 13. WIPOQ@S que es? Una aplicación externa que interroga a la base de datos de la oficina sobre las solicitudes que han sido publicadas en el mes(u otro intervalo de tiempo) Recupera los datos necesarios de los diferentes campos de la base (hasta aquí como los procedimientos utilizados normalmente) A partir de allí procede a validar los datos respecto a reglas predefinidas (como las mencionadas anteriormente para prioridades) Si no es posible validar, interroga al usuario sobre el error encontrado y le propone alternativas (brindadas por las reglas) y adicionalmente proveyendo la información que (en lo posible) se pueda disponer de un equivalente encontrado en Espacenet o Patentscope
  • 14. Cont. Finalmente generaría un reporte de lo realizado y los archivos correspondientes en formato ST.36 ( y ST.32 si se debe mantener compatibilidad de envíos por un tiempo limitado) Cabria la posibilidad que cuando la información se valida se incluya la facilidad de escribir la base de datos. Pero esto debería ser discutido con cada oficina, no es una decisión fácil de tomar para el encargado de IT y tampoco es fácil de implementar( cuestiones de seguridad y configuración de como realizar la escritura de los datos).
  • 15. En resumen.. Básicamente se realizaría la interrogación de la base de datos mediante la ejecución de SQLs configurables en un archivo XML Las reglas de corrección validación se mantendrían en una base de datos, que podrían ser actualizadas e incluso mejoradas por la oficina( particularmente si saben de algún error repetitivo en la captura de los datos)
  • 16. Estado del proyecto. Prototipo implementado en ONAPI desde principios de 2011, produciendo los datos que se envían a EPO y Patentscope. Si dicho prototipo encuentra una solicitud sin clasificación, la cual posee un equivalente en Espacenet o Patentscope, descarga la clasificación del mismo y lo incluye en el ST.36 del registro a enviar (un beneficio adicional de la posibilidad de validar los datos).
  • 17. Cont. Por el momento el prototipo esta basado en línea de comando y no interroga al usuario ( interface inicial a implementar antes de fin de año) En fase de construcción y mejora de las reglas a aplicar a las prioridades de los países que se conocen. Un producto secundario del proyecto es una base de datos con expresiones regulares para corregir los datos de prioridad. Actualmente disponibles reglas para BR, ES, EP y US.
  • 18. Cont. Posibilidad de versión light, que no interrogue a la base de datos y se base en la lectura de un archivo de texto, a la IPCONV. Pero que incluya las validaciones. Panamá esta comenzando a utilizar una versión similar, hasta que sea posible la implementación de la versión con interrogación de la base de datos.
  • 19. Futuro del proyecto Versión "funcional" e instalable para fin de año (código basado en Perl). A partir de allí, comenzaría una la reescritura y mejora del código por contratista externo(a la vez de convertir el código a Java), para tener una versión como producto oficial de OMPI para la segunda mitad de 2012.