SlideShare a Scribd company logo
1 of 24
Download to read offline
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Herramientas de Análisis de la Información
de la AEAT: ZUJAR
Herramientas de Análisis de la Información
de la AEAT: ZUJAR
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
PROBLEMÁTICA DEL ANÁLISIS DE INFORMACIÓN EN LA AEAT
Tres factores que hacen difícil encontrar herramientas comerciales que den un
soporte integrado a toda la organización:
- La abundancia de datos, existe un gran número de entidades a analizar
(Contribuyentes, Expedientes, Vehículos, Cuentas Bancarias, cientos de Modelos
Tributarios, …)
- Un gran número de registros por entidad (en algunos casos puede llegar a
miles de millones de registros).
- Gran número de variables que se pueden analizar en el caso concreto de la
información tributaria asociada al Contribuyente (miles de variables), con origen
en declaraciones y autoliquidaciones que de forma periódica deben presentar los
obligados tributarios, así como de otra que es requerida por la Inspección
durante la instrucción de los expedientes, bien a los interesados o a terceros.
DESARROLLO PROPIO
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Zújar
Contribuy.
Zújar
Inmuebles
MOTOR ZUJAR (SERVIDOR)
Arquitectura de la herramienta Zújar
Zújar
Deudas
….
APLICACIÓN CLIENTE ZUJAR
BASE DE DATOS
Zújar
Inmuebles
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Zújar
Contribuy.
Zújar
Inmuebles
Motor
¿Qué es una entidad Zújar?
Zújar
Deudas
….
Conjunto de información asociada a una entidad del negocio
concreta:
• Zújares con información tributaria
• Contribuyente (más importante)
• Inmuebles
• Expedientes de inspección
• Deudas
• …..
• Zújares con otro tipo de información
• Nómina
• Control horario
• Actividad de los sistemas (Logs)
• ….
Zújar
Inmuebles
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Propósito de la herramienta Zújar
• Herramientas de Business Inteligence (BI) o Inteligencia de Negocio para
análisis multidimensinal de la información ajustada a las necesidades de la AEAT
y orientada a la toma de decisión y mejora de los objetivos de la organización.
• Infraestructura de acceso potente a datos para otras aplicaciones.
• Herramienta de selección (contribuyentes):
• filtrado sobre miles de variables y sobre millones de registros.
• proceso interactivo (tiempos de respuesta de pocos segundos)
Para generar el colectivo de contribuyentes sobre los que se van a tomar
determinadas acciones tanto de gestión como de inspección, ahorrando
tiempo al usuario analizando contribuyentes que no corresponden al
colectivo a tratar.
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Equipo de Desarrollo Zújar
EQUIPOS PARTICIPANTES EN EL DESARROLLO
Departamentos
(Inspectores,
gestores, …)
Especificaciones
Grupo ETC
Grupo de desarrollo
aplicaciones
cliente
Grupo de desarrollo
de Motor y Minería
Grupo de Calidad
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Participantes en la elaboración de una entidad Zújar
Departamentos
(Inspectores,
gestores, …)
Grupos de desarrollo
DIT
(Aplicaciones
de gestión)
¿Qué datos
necesitan
analizar?
Grupo ETC
Datos
ETC
DatosMetadatos Grupo de Sistemas y BBDD
Dónde está la
información Qué requisitos
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Clientes
Capa de Servidor
Arquitectura Lógica
Genio
Motor
Serv. Teseo Serv. Genio
Teseo Prometeo ZUJAR
Metadatos Datos
S. Árboles
Diccionario
ETCPandata
Mainframe
Consultas
Cargas
Accesos
Externos
Acciones
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Interfaz de usuario (Zújar)
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Interfaz de usuario (TESEO)
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Genio: generador de informes
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Subdirección General de Análisis de la Información e Investigación del Fraude (D.I.T.)
 Tablón (un Zújar una tabla):
 Desnormalización máxima (< 3.000 columnas)
 Minimizar número de cruces
 Columnas precalculadas para optimización de consultas
 Estrella (un Zújar múltiples tablas diferentes estructuras):
 En realidad es una particionado vertical (> 3.000 columnas)
 Relaciones 1:1
 Joins por clave única: Contribuyente (NIU)
 Particionado horizontal (un Zújar múltiples tablas misma estructura):
• Tablas con acceso acotado por una variable (LOG - Año)
 Tablón (un Zújar una tabla):
 Desnormalización máxima (< 3.000 columnas)
 Minimizar número de cruces
 Columnas precalculadas para optimización de consultas
 Estrella (un Zújar múltiples tablas diferentes estructuras):
 En realidad es una particionado vertical (> 3.000 columnas)
 Relaciones 1:1
 Joins por clave única: Contribuyente (NIU)
 Particionado horizontal (un Zújar múltiples tablas misma estructura):
• Tablas con acceso acotado por una variable (LOG - Año)
Modelo de datos
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Modelo de datos: particionado horizontal
Variable
División Tabla Física
V1 tabla1
V2 tabla1
V3 tabla2
V4 tabla3
V5 tabla3
Variable
División Atrib1 Atrib2
V1
V1
…
V1
V2
…
V2
Variable
División Atrib1 Atrib2
V3
V3
V3
…
V3
Variable
División Atrib1 Atrib2
V4
V4
….
V4
V5
…
V5
Tabla Índice
(Año, mes,
NIU, ….)
tabla1
tabla2
tabla3
Tablas con miles de millones de registros
Zújar total
Zújares parciales
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Modelo de datos: diccionario Zújar
VISTA MOTOR
Tabla Zújar
VISTA CLIENTE: árbol de variables
Fichero con datos del negocio
Información
desnormalizada
Evitar join
DICCIONARIO DE METADATOS: recoge
información de ficheros, tablas, árboles de
variables (vista de usuario), seguridad,
relaciones entre Zújares, …
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
FILTRADO DE REGISTROS
- Operadores lógicos: Y, O, NOT, …
- Operadores de relación (=, >, <, )
- Operadores especiales (colectivos)
Funcionalidades Zújar
OPERACIONES SOBRE LOS RESULTADOS
- Ordenación
- Estadísticos (Suma, Media, …)
- Agrupaciones
- Expresiones calculadas (v1+v2/v3….)
- Consultas (publicas y privadas)
- Reglas de formato (resaltar los
registros que …)
VISTA DE RESULTADOS
-Tabla
- Gráficos
- Vistas enlazadas
- Exportaciones (Excel, Access, …)
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Zújar
Contribuy.
Zújar
Inmuebles
Motor
Cruce de peticiones entre Zújares
Zújar
Deudores
….
Colectivos….….….
….….….
Colectivos creados en otros Zújares se pueden aplicar como
filtro.
Enlaces en cliente (local) entre Zújares.
Combinación de Zújares en próxima versión.
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Cruce de peticiones entre Zújares: colectivos
FILTROS
RESULTADOS (Zújar 2)
Contribuyente
PERTENECE A COLECTIVO
“mi colectivo” (de Zújar 1)
“mi colectivo”
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Cruce de peticiones entre Zújares: enlace
entre Zújares
RESULTADOS Petición 1 (Zújar 1)
RESULTADOS Petición 2 (Zújar 2)
Contribuyente del Zújar 2 que están a
la consulta del Zújar 1
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Cruce de peticiones entre Zújares: combinación
Peticiones (filtros, ordenaciones, …) sobre
campos de distintos Zújares (siguiente versión)
ZUJAR 1 ZUAJR 2
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
• Tablas con más de 3.000 columnas
• Más de un millón de columnas definidas en más de
7.000 tablas.
• Más de 94.000.000.000 de filas
• Alrededor de 50 TB de disco
• Tablas físicas con más de 2.000.000.000 de filas
• Tablas lógicas divididas en tablas físicas y que en total
contienen más de 19.000.000.000 de filas.
• Más de 500.000 consultas diarias, normalmente
pesadas
¿Cuántos datos? Algunos ejemplos
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Motor (Java, C++)
Metadatos
(MySQL)
Datos
(Sybase IQ)
AliaPrometeo
Cliente
Zújar
Servicios
Teseo
Windows Forms, C#
Framework .NET
DevXpress yFiles
AplicacionesAEAT
Gestordecontenidos
Arquitectura cliente ZUJAR
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
• Herramienta de desarrollo
• Microsoft Visual Studio 2010
• Frameworks 4.0
• Cliente pesado
• Windows Forms
• Lenguaje de desarrollo
• C#
• Componente de presentación de datos
• Developer Express v2011
• Componente de visualización de grafos
• yFiles .Net 4.2
Cliente Zújar
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
• Desarrollo Java (frontal) y C++ en Linux (SUSE 11)
• Interfaz SOAP con aplicaciones clientes.
• “dialecto” SQL para dar respuesta a las necesidades
específicas del negocio: zSQL.
• SGBD: MySQL y SAP Sybase IQ (futuro IMPALA).
• El Motor se encarga de transformar zSQL a SQL y
resolver las peculiaridades de cada SGBD.
Motor Zújar
Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
Uso de Zújar
0
100
200
300
400
500
600
700
800
900
1000
2.010 2.011 2.012 2.013 2.014 2.015
UsodeZújar
Número de Zújares distintos
0
100000
200000
300000
400000
500000
600000
700000
2.010 2.011 2.012 2.013 2.014 2.015
UsodeZújar
Número de peticiones del tipo
"abrir consulta“
0
1000
2000
3000
4000
5000
6000
7000
8000
9000
10000
2.010 2.011 2.012 2.013 2.014 2.015
UsodeZújar
Número de usuarios distintos
(*) 9 primeros meses
(*)
AREA DE
ADUANAS
29%
AREA DE
INSPECCION
21%
ZÚJARES COMUNES
+ INFORMÁTICA
17%
AREA DE
RECAUDACION
8%
AREA DE GESTION
8%
AREA DE RR.HH. Y
GESTION
ECONOMICA
6%
AREA DE
JEFATURA
3%
AREA GRAL.DE
APOYO
ADMINISTRATIVO
3%
AREA
AUDITORIA
INTERNA
2%
OTROS
3%Nº de Peticiones

More Related Content

What's hot

Building Real-Time Data Pipeline for Diabetes Medication Recommender System U...
Building Real-Time Data Pipeline for Diabetes Medication Recommender System U...Building Real-Time Data Pipeline for Diabetes Medication Recommender System U...
Building Real-Time Data Pipeline for Diabetes Medication Recommender System U...
Databricks
 

What's hot (19)

Software de Planillas STARSOFT
Software de Planillas STARSOFTSoftware de Planillas STARSOFT
Software de Planillas STARSOFT
 
Building Real-Time Data Pipeline for Diabetes Medication Recommender System U...
Building Real-Time Data Pipeline for Diabetes Medication Recommender System U...Building Real-Time Data Pipeline for Diabetes Medication Recommender System U...
Building Real-Time Data Pipeline for Diabetes Medication Recommender System U...
 
SAP BW - Creation of master data texts
SAP BW - Creation of master data textsSAP BW - Creation of master data texts
SAP BW - Creation of master data texts
 
Query Optimization - Brandon Latronica
Query Optimization - Brandon LatronicaQuery Optimization - Brandon Latronica
Query Optimization - Brandon Latronica
 
Product Keynote: Denodo 8.0 - A Logical Data Fabric for the Intelligent Enter...
Product Keynote: Denodo 8.0 - A Logical Data Fabric for the Intelligent Enter...Product Keynote: Denodo 8.0 - A Logical Data Fabric for the Intelligent Enter...
Product Keynote: Denodo 8.0 - A Logical Data Fabric for the Intelligent Enter...
 
Crear y Eliminar Bases de datos en MySQL Workbench
Crear y Eliminar  Bases de datos en MySQL WorkbenchCrear y Eliminar  Bases de datos en MySQL Workbench
Crear y Eliminar Bases de datos en MySQL Workbench
 
Abap proxies
Abap proxiesAbap proxies
Abap proxies
 
Azure Data Factory Data Flows Training v005
Azure Data Factory Data Flows Training v005Azure Data Factory Data Flows Training v005
Azure Data Factory Data Flows Training v005
 
Data Engineer's Lunch #54: dbt and Spark
Data Engineer's Lunch #54: dbt and SparkData Engineer's Lunch #54: dbt and Spark
Data Engineer's Lunch #54: dbt and Spark
 
Ssrs introduction session 1
Ssrs introduction session 1Ssrs introduction session 1
Ssrs introduction session 1
 
Introduction to Azure Data Lake
Introduction to Azure Data LakeIntroduction to Azure Data Lake
Introduction to Azure Data Lake
 
Introduction to Data Warehousing
Introduction to Data WarehousingIntroduction to Data Warehousing
Introduction to Data Warehousing
 
Database Systems - Introduction (Chapter 1)
Database Systems - Introduction (Chapter 1)Database Systems - Introduction (Chapter 1)
Database Systems - Introduction (Chapter 1)
 
Database Administration
Database AdministrationDatabase Administration
Database Administration
 
Introducción a Business objects
Introducción a Business objectsIntroducción a Business objects
Introducción a Business objects
 
Microsoft SQL Server internals & architecture
Microsoft SQL Server internals & architectureMicrosoft SQL Server internals & architecture
Microsoft SQL Server internals & architecture
 
ADF Mapping Data Flows Training Slides V1
ADF Mapping Data Flows Training Slides V1ADF Mapping Data Flows Training Slides V1
ADF Mapping Data Flows Training Slides V1
 
MSBI-SSRS PPT
MSBI-SSRS PPTMSBI-SSRS PPT
MSBI-SSRS PPT
 
Why shift from ETL to ELT?
Why shift from ETL to ELT?Why shift from ETL to ELT?
Why shift from ETL to ELT?
 

Viewers also liked

La Oficina Nacional de Investigación del Fraude (ONIF) / Agencia Estatal de A...
La Oficina Nacional de Investigación del Fraude (ONIF) / Agencia Estatal de A...La Oficina Nacional de Investigación del Fraude (ONIF) / Agencia Estatal de A...
La Oficina Nacional de Investigación del Fraude (ONIF) / Agencia Estatal de A...
EUROsociAL II
 
El sistema de información de la AEAT / Agencia Estatal de Administración Trib...
El sistema de información de la AEAT / Agencia Estatal de Administración Trib...El sistema de información de la AEAT / Agencia Estatal de Administración Trib...
El sistema de información de la AEAT / Agencia Estatal de Administración Trib...
EUROsociAL II
 
Identificación de áreas de actuación
Identificación de áreas de actuaciónIdentificación de áreas de actuación
Identificación de áreas de actuación
EUROsociAL II
 
Arquitectura de la Base de Datos 28 de agosto 2013
Arquitectura de la Base de Datos 28 de agosto 2013Arquitectura de la Base de Datos 28 de agosto 2013
Arquitectura de la Base de Datos 28 de agosto 2013
EUROsociAL II
 
Estructura y organización del Sistema Tributario en España / Agencia Estatal ...
Estructura y organización del Sistema Tributario en España / Agencia Estatal ...Estructura y organización del Sistema Tributario en España / Agencia Estatal ...
Estructura y organización del Sistema Tributario en España / Agencia Estatal ...
EUROsociAL II
 

Viewers also liked (10)

La Oficina Nacional de Investigación del Fraude (ONIF) / Agencia Estatal de A...
La Oficina Nacional de Investigación del Fraude (ONIF) / Agencia Estatal de A...La Oficina Nacional de Investigación del Fraude (ONIF) / Agencia Estatal de A...
La Oficina Nacional de Investigación del Fraude (ONIF) / Agencia Estatal de A...
 
Identificación y localización de Contribuyentes: DEDALO / Agencia Estatal de ...
Identificación y localización de Contribuyentes: DEDALO / Agencia Estatal de ...Identificación y localización de Contribuyentes: DEDALO / Agencia Estatal de ...
Identificación y localización de Contribuyentes: DEDALO / Agencia Estatal de ...
 
ZUJAR de Contribuyentes / Agencia Estatal de Administración Tributaria (AEAT)...
ZUJAR de Contribuyentes / Agencia Estatal de Administración Tributaria (AEAT)...ZUJAR de Contribuyentes / Agencia Estatal de Administración Tributaria (AEAT)...
ZUJAR de Contribuyentes / Agencia Estatal de Administración Tributaria (AEAT)...
 
Elementos Esenciales para efectuar la Seleccion y Comprobacion / Javier Berro...
Elementos Esenciales para efectuar la Seleccion y Comprobacion / Javier Berro...Elementos Esenciales para efectuar la Seleccion y Comprobacion / Javier Berro...
Elementos Esenciales para efectuar la Seleccion y Comprobacion / Javier Berro...
 
El sistema de información de la AEAT / Agencia Estatal de Administración Trib...
El sistema de información de la AEAT / Agencia Estatal de Administración Trib...El sistema de información de la AEAT / Agencia Estatal de Administración Trib...
El sistema de información de la AEAT / Agencia Estatal de Administración Trib...
 
Identificación de áreas de actuación
Identificación de áreas de actuaciónIdentificación de áreas de actuación
Identificación de áreas de actuación
 
Arquitectura de la Base de Datos 28 de agosto 2013
Arquitectura de la Base de Datos 28 de agosto 2013Arquitectura de la Base de Datos 28 de agosto 2013
Arquitectura de la Base de Datos 28 de agosto 2013
 
Marco Macroeconómico Multianual, Reglas Fiscales y su vínculo con el presupue...
Marco Macroeconómico Multianual, Reglas Fiscales y su vínculo con el presupue...Marco Macroeconómico Multianual, Reglas Fiscales y su vínculo con el presupue...
Marco Macroeconómico Multianual, Reglas Fiscales y su vínculo con el presupue...
 
Inventario de Información. Plan de Prevención del Fraude / Virgilio Postigo -...
Inventario de Información. Plan de Prevención del Fraude / Virgilio Postigo -...Inventario de Información. Plan de Prevención del Fraude / Virgilio Postigo -...
Inventario de Información. Plan de Prevención del Fraude / Virgilio Postigo -...
 
Estructura y organización del Sistema Tributario en España / Agencia Estatal ...
Estructura y organización del Sistema Tributario en España / Agencia Estatal ...Estructura y organización del Sistema Tributario en España / Agencia Estatal ...
Estructura y organización del Sistema Tributario en España / Agencia Estatal ...
 

Similar to Herramientas de Análisis de la Información de la AEAT: ZUJAR / Agencia Estatal de Administración Tributaria (AEAT) (España)

Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
edmaga
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3
Climanfef
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
jo_unwell
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
jo_unwell
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
jo_unwell
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
jo_unwell
 
Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informacion
Rossana Pérez
 
Sistemas de información
Sistemas de información Sistemas de información
Sistemas de información
dianadevia
 
Bussines Intelligence
Bussines IntelligenceBussines Intelligence
Bussines Intelligence
brobelo
 
Los sistemas-de-informacion
Los sistemas-de-informacionLos sistemas-de-informacion
Los sistemas-de-informacion
Yesenia Gomez
 
ANALISIS Y DISEÑO....
ANALISIS Y DISEÑO....ANALISIS Y DISEÑO....
ANALISIS Y DISEÑO....
mary taipe
 
DISEÑO Y REALIZACION
DISEÑO Y REALIZACIONDISEÑO Y REALIZACION
DISEÑO Y REALIZACION
mary taipe
 

Similar to Herramientas de Análisis de la Información de la AEAT: ZUJAR / Agencia Estatal de Administración Tributaria (AEAT) (España) (20)

Desarrollo si y base datos
Desarrollo si y base datosDesarrollo si y base datos
Desarrollo si y base datos
 
Minería de datos Presentación
Minería de datos PresentaciónMinería de datos Presentación
Minería de datos Presentación
 
Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3Minera de-datos-presentacin-1205263710628735-3
Minera de-datos-presentacin-1205263710628735-3
 
Estadisticas
EstadisticasEstadisticas
Estadisticas
 
Fundamentos de datawarehouse
Fundamentos de datawarehouseFundamentos de datawarehouse
Fundamentos de datawarehouse
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Inteligencia de negocios
Inteligencia de negociosInteligencia de negocios
Inteligencia de negocios
 
Sistemas de informacion
Sistemas de informacionSistemas de informacion
Sistemas de informacion
 
Sistemas de información
Sistemas de información Sistemas de información
Sistemas de información
 
LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)LinceBI IIoT (Industrial Internet of Things)
LinceBI IIoT (Industrial Internet of Things)
 
Bussines Intelligence
Bussines IntelligenceBussines Intelligence
Bussines Intelligence
 
Cl5
Cl5Cl5
Cl5
 
Webinar: Self-service Analytics con Virtualización de Datos
Webinar: Self-service Analytics con Virtualización de DatosWebinar: Self-service Analytics con Virtualización de Datos
Webinar: Self-service Analytics con Virtualización de Datos
 
Sistemas integrados ERP - Base de Datos
Sistemas integrados ERP - Base de DatosSistemas integrados ERP - Base de Datos
Sistemas integrados ERP - Base de Datos
 
Los sistemas-de-informacion
Los sistemas-de-informacionLos sistemas-de-informacion
Los sistemas-de-informacion
 
Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero. Cómo construir tu propia data platform. From zero to hero.
Cómo construir tu propia data platform. From zero to hero.
 
ANALISIS Y DISEÑO....
ANALISIS Y DISEÑO....ANALISIS Y DISEÑO....
ANALISIS Y DISEÑO....
 
DISEÑO Y REALIZACION
DISEÑO Y REALIZACIONDISEÑO Y REALIZACION
DISEÑO Y REALIZACION
 

More from EUROsociAL II

More from EUROsociAL II (20)

Resultados Piloto Acreditación de la Calidad Regionales Atlántico y Nariño Co...
Resultados Piloto Acreditación de la Calidad Regionales Atlántico y Nariño Co...Resultados Piloto Acreditación de la Calidad Regionales Atlántico y Nariño Co...
Resultados Piloto Acreditación de la Calidad Regionales Atlántico y Nariño Co...
 
Transición Escuela - Trabajo: Propuesta de Plan de Acción para Mejorar el Niv...
Transición Escuela - Trabajo: Propuesta de Plan de Acción para Mejorar el Niv...Transición Escuela - Trabajo: Propuesta de Plan de Acción para Mejorar el Niv...
Transición Escuela - Trabajo: Propuesta de Plan de Acción para Mejorar el Niv...
 
Identificación y evaluación de proyectos de desarrollo regional / Raffaele Co...
Identificación y evaluación de proyectos de desarrollo regional / Raffaele Co...Identificación y evaluación de proyectos de desarrollo regional / Raffaele Co...
Identificación y evaluación de proyectos de desarrollo regional / Raffaele Co...
 
El Programa EUROsociAL en México / Ruggero Tabossi
El Programa EUROsociAL en México / Ruggero TabossiEl Programa EUROsociAL en México / Ruggero Tabossi
El Programa EUROsociAL en México / Ruggero Tabossi
 
Procesos de profesionalización. Programas Sociales del MIDES: PASC, Cercanías...
Procesos de profesionalización. Programas Sociales del MIDES: PASC, Cercanías...Procesos de profesionalización. Programas Sociales del MIDES: PASC, Cercanías...
Procesos de profesionalización. Programas Sociales del MIDES: PASC, Cercanías...
 
Avances y Desafíos para la Evaluación: la experiencia de la Dirección de Gest...
Avances y Desafíos para la Evaluación: la experiencia de la Dirección de Gest...Avances y Desafíos para la Evaluación: la experiencia de la Dirección de Gest...
Avances y Desafíos para la Evaluación: la experiencia de la Dirección de Gest...
 
Institucionalización de la evaluación de políticas públicas / Blanca Lázaro
Institucionalización de la evaluación de políticas públicas / Blanca LázaroInstitucionalización de la evaluación de políticas públicas / Blanca Lázaro
Institucionalización de la evaluación de políticas públicas / Blanca Lázaro
 
QUADRO / Paloma Baquero Dancausa
QUADRO / Paloma Baquero DancausaQUADRO / Paloma Baquero Dancausa
QUADRO / Paloma Baquero Dancausa
 
Microsimulador de IRPF / Jaime Villanueva García
Microsimulador de IRPF / Jaime Villanueva GarcíaMicrosimulador de IRPF / Jaime Villanueva García
Microsimulador de IRPF / Jaime Villanueva García
 
Modelos de Simulación de Impuestos y Prestaciones (Tax - Benefit): EUROMOD / ...
Modelos de Simulación de Impuestos y Prestaciones (Tax - Benefit): EUROMOD / ...Modelos de Simulación de Impuestos y Prestaciones (Tax - Benefit): EUROMOD / ...
Modelos de Simulación de Impuestos y Prestaciones (Tax - Benefit): EUROMOD / ...
 
Herramientas de apoyo para la Elaboración y Análisis del Presupuesto: Microsi...
Herramientas de apoyo para la Elaboración y Análisis del Presupuesto: Microsi...Herramientas de apoyo para la Elaboración y Análisis del Presupuesto: Microsi...
Herramientas de apoyo para la Elaboración y Análisis del Presupuesto: Microsi...
 
Sistema Gestión Presupuestaria Sorolla2 / Pedro Luis García Repetto
Sistema Gestión Presupuestaria Sorolla2 / Pedro Luis García RepettoSistema Gestión Presupuestaria Sorolla2 / Pedro Luis García Repetto
Sistema Gestión Presupuestaria Sorolla2 / Pedro Luis García Repetto
 
Sistema Información Contable SIC3 / Pedro Luis García Repetto
Sistema Información Contable SIC3 / Pedro Luis García RepettoSistema Información Contable SIC3 / Pedro Luis García Repetto
Sistema Información Contable SIC3 / Pedro Luis García Repetto
 
Gestión de la Inversión Pública. Planes de Inversión Pública y su Presupuesta...
Gestión de la Inversión Pública. Planes de Inversión Pública y su Presupuesta...Gestión de la Inversión Pública. Planes de Inversión Pública y su Presupuesta...
Gestión de la Inversión Pública. Planes de Inversión Pública y su Presupuesta...
 
PGEnet / Paloma Baquero Dancausa
PGEnet / Paloma Baquero DancausaPGEnet / Paloma Baquero Dancausa
PGEnet / Paloma Baquero Dancausa
 
ADENDA Inversiones / Paloma Baquero Dancausa
ADENDA Inversiones / Paloma Baquero DancausaADENDA Inversiones / Paloma Baquero Dancausa
ADENDA Inversiones / Paloma Baquero Dancausa
 
QUANTO / Paloma Baquero Dancausa
QUANTO / Paloma Baquero DancausaQUANTO / Paloma Baquero Dancausa
QUANTO / Paloma Baquero Dancausa
 
Proceso de Toma de Decisiones para la Distribución de los recursos y su Proye...
Proceso de Toma de Decisiones para la Distribución de los recursos y su Proye...Proceso de Toma de Decisiones para la Distribución de los recursos y su Proye...
Proceso de Toma de Decisiones para la Distribución de los recursos y su Proye...
 
Inventario de Información y Consulta de Información Individual: Sistemas auto...
Inventario de Información y Consulta de Información Individual: Sistemas auto...Inventario de Información y Consulta de Información Individual: Sistemas auto...
Inventario de Información y Consulta de Información Individual: Sistemas auto...
 
Visita de la Receita Federal de Brasil. Gestión de Notificaciones y NEO / Man...
Visita de la Receita Federal de Brasil. Gestión de Notificaciones y NEO / Man...Visita de la Receita Federal de Brasil. Gestión de Notificaciones y NEO / Man...
Visita de la Receita Federal de Brasil. Gestión de Notificaciones y NEO / Man...
 

Recently uploaded

Recently uploaded (16)

Alojamiento temporal para emergen y desastrescias
Alojamiento temporal para emergen y desastresciasAlojamiento temporal para emergen y desastrescias
Alojamiento temporal para emergen y desastrescias
 
Constitucion y derechos humanos sesion 1.pptx
Constitucion y derechos humanos sesion 1.pptxConstitucion y derechos humanos sesion 1.pptx
Constitucion y derechos humanos sesion 1.pptx
 
Club Rotario Cartago - Revista 04-2024.pdf
Club Rotario Cartago - Revista 04-2024.pdfClub Rotario Cartago - Revista 04-2024.pdf
Club Rotario Cartago - Revista 04-2024.pdf
 
el nuevo sistema de salud latinoamerica.pptx
el nuevo sistema de salud latinoamerica.pptxel nuevo sistema de salud latinoamerica.pptx
el nuevo sistema de salud latinoamerica.pptx
 
SEGUNDO PISO UN ABISMO. RAZONES PARA NO VOTAR POR MORENA
SEGUNDO PISO UN ABISMO. RAZONES PARA NO VOTAR POR MORENASEGUNDO PISO UN ABISMO. RAZONES PARA NO VOTAR POR MORENA
SEGUNDO PISO UN ABISMO. RAZONES PARA NO VOTAR POR MORENA
 
2023 - HOSTIGAMIENTO SEXUAL - DIAPOSITIVAS.ppt
2023 - HOSTIGAMIENTO SEXUAL   - DIAPOSITIVAS.ppt2023 - HOSTIGAMIENTO SEXUAL   - DIAPOSITIVAS.ppt
2023 - HOSTIGAMIENTO SEXUAL - DIAPOSITIVAS.ppt
 
005. - Curso de modernización del Estado 2024.pdf
005. - Curso de modernización del Estado 2024.pdf005. - Curso de modernización del Estado 2024.pdf
005. - Curso de modernización del Estado 2024.pdf
 
Decreto Ejecutivo 255 Reglamento de Seguridad y Salud en el Trabajo
Decreto Ejecutivo 255 Reglamento de Seguridad y Salud en el TrabajoDecreto Ejecutivo 255 Reglamento de Seguridad y Salud en el Trabajo
Decreto Ejecutivo 255 Reglamento de Seguridad y Salud en el Trabajo
 
Formato de revision de la stps para el cumplimiento
Formato de revision de la stps para el cumplimientoFormato de revision de la stps para el cumplimiento
Formato de revision de la stps para el cumplimiento
 
PRESENTACION Plan de Desarrollo Municipal 2024-2027 AL CTP.pptx
PRESENTACION Plan de Desarrollo Municipal 2024-2027 AL CTP.pptxPRESENTACION Plan de Desarrollo Municipal 2024-2027 AL CTP.pptx
PRESENTACION Plan de Desarrollo Municipal 2024-2027 AL CTP.pptx
 
Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...
Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...
Radar de algoritmos de IA y procesos de decisión automatizada para el acceso ...
 
¿Cuáles son los desafíos que enfrentan los periodistas al investigar sobre el...
¿Cuáles son los desafíos que enfrentan los periodistas al investigar sobre el...¿Cuáles son los desafíos que enfrentan los periodistas al investigar sobre el...
¿Cuáles son los desafíos que enfrentan los periodistas al investigar sobre el...
 
PROTOCOLO DE RESPUESTA PARA LLAMADAS DE EMERGENCIA AL 911.docx
PROTOCOLO DE RESPUESTA PARA LLAMADAS DE EMERGENCIA AL 911.docxPROTOCOLO DE RESPUESTA PARA LLAMADAS DE EMERGENCIA AL 911.docx
PROTOCOLO DE RESPUESTA PARA LLAMADAS DE EMERGENCIA AL 911.docx
 
110º ANIVERSARIO DE CITY BELL: CELEBRACIÓN INTEGRADORA PARA LA COMUNIDAD
110º ANIVERSARIO DE CITY BELL: CELEBRACIÓN INTEGRADORA PARA LA COMUNIDAD110º ANIVERSARIO DE CITY BELL: CELEBRACIÓN INTEGRADORA PARA LA COMUNIDAD
110º ANIVERSARIO DE CITY BELL: CELEBRACIÓN INTEGRADORA PARA LA COMUNIDAD
 
Contrataciones del Estado, Administración Pública
Contrataciones del Estado, Administración PúblicaContrataciones del Estado, Administración Pública
Contrataciones del Estado, Administración Pública
 
MAPA DE JILOTEPEC SECTORIAL DIVIDIDO POR SECTORES
MAPA DE JILOTEPEC SECTORIAL DIVIDIDO POR SECTORESMAPA DE JILOTEPEC SECTORIAL DIVIDIDO POR SECTORES
MAPA DE JILOTEPEC SECTORIAL DIVIDIDO POR SECTORES
 

Herramientas de Análisis de la Información de la AEAT: ZUJAR / Agencia Estatal de Administración Tributaria (AEAT) (España)

  • 1. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Herramientas de Análisis de la Información de la AEAT: ZUJAR Herramientas de Análisis de la Información de la AEAT: ZUJAR Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude
  • 2. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude PROBLEMÁTICA DEL ANÁLISIS DE INFORMACIÓN EN LA AEAT Tres factores que hacen difícil encontrar herramientas comerciales que den un soporte integrado a toda la organización: - La abundancia de datos, existe un gran número de entidades a analizar (Contribuyentes, Expedientes, Vehículos, Cuentas Bancarias, cientos de Modelos Tributarios, …) - Un gran número de registros por entidad (en algunos casos puede llegar a miles de millones de registros). - Gran número de variables que se pueden analizar en el caso concreto de la información tributaria asociada al Contribuyente (miles de variables), con origen en declaraciones y autoliquidaciones que de forma periódica deben presentar los obligados tributarios, así como de otra que es requerida por la Inspección durante la instrucción de los expedientes, bien a los interesados o a terceros. DESARROLLO PROPIO
  • 3. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Zújar Contribuy. Zújar Inmuebles MOTOR ZUJAR (SERVIDOR) Arquitectura de la herramienta Zújar Zújar Deudas …. APLICACIÓN CLIENTE ZUJAR BASE DE DATOS Zújar Inmuebles
  • 4. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Zújar Contribuy. Zújar Inmuebles Motor ¿Qué es una entidad Zújar? Zújar Deudas …. Conjunto de información asociada a una entidad del negocio concreta: • Zújares con información tributaria • Contribuyente (más importante) • Inmuebles • Expedientes de inspección • Deudas • ….. • Zújares con otro tipo de información • Nómina • Control horario • Actividad de los sistemas (Logs) • …. Zújar Inmuebles
  • 5. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Propósito de la herramienta Zújar • Herramientas de Business Inteligence (BI) o Inteligencia de Negocio para análisis multidimensinal de la información ajustada a las necesidades de la AEAT y orientada a la toma de decisión y mejora de los objetivos de la organización. • Infraestructura de acceso potente a datos para otras aplicaciones. • Herramienta de selección (contribuyentes): • filtrado sobre miles de variables y sobre millones de registros. • proceso interactivo (tiempos de respuesta de pocos segundos) Para generar el colectivo de contribuyentes sobre los que se van a tomar determinadas acciones tanto de gestión como de inspección, ahorrando tiempo al usuario analizando contribuyentes que no corresponden al colectivo a tratar.
  • 6. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Equipo de Desarrollo Zújar EQUIPOS PARTICIPANTES EN EL DESARROLLO Departamentos (Inspectores, gestores, …) Especificaciones Grupo ETC Grupo de desarrollo aplicaciones cliente Grupo de desarrollo de Motor y Minería Grupo de Calidad
  • 7. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Participantes en la elaboración de una entidad Zújar Departamentos (Inspectores, gestores, …) Grupos de desarrollo DIT (Aplicaciones de gestión) ¿Qué datos necesitan analizar? Grupo ETC Datos ETC DatosMetadatos Grupo de Sistemas y BBDD Dónde está la información Qué requisitos
  • 8. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Clientes Capa de Servidor Arquitectura Lógica Genio Motor Serv. Teseo Serv. Genio Teseo Prometeo ZUJAR Metadatos Datos S. Árboles Diccionario ETCPandata Mainframe Consultas Cargas Accesos Externos Acciones
  • 9. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Interfaz de usuario (Zújar)
  • 10. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Interfaz de usuario (TESEO)
  • 11. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Genio: generador de informes
  • 12. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Subdirección General de Análisis de la Información e Investigación del Fraude (D.I.T.)  Tablón (un Zújar una tabla):  Desnormalización máxima (< 3.000 columnas)  Minimizar número de cruces  Columnas precalculadas para optimización de consultas  Estrella (un Zújar múltiples tablas diferentes estructuras):  En realidad es una particionado vertical (> 3.000 columnas)  Relaciones 1:1  Joins por clave única: Contribuyente (NIU)  Particionado horizontal (un Zújar múltiples tablas misma estructura): • Tablas con acceso acotado por una variable (LOG - Año)  Tablón (un Zújar una tabla):  Desnormalización máxima (< 3.000 columnas)  Minimizar número de cruces  Columnas precalculadas para optimización de consultas  Estrella (un Zújar múltiples tablas diferentes estructuras):  En realidad es una particionado vertical (> 3.000 columnas)  Relaciones 1:1  Joins por clave única: Contribuyente (NIU)  Particionado horizontal (un Zújar múltiples tablas misma estructura): • Tablas con acceso acotado por una variable (LOG - Año) Modelo de datos
  • 13. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Modelo de datos: particionado horizontal Variable División Tabla Física V1 tabla1 V2 tabla1 V3 tabla2 V4 tabla3 V5 tabla3 Variable División Atrib1 Atrib2 V1 V1 … V1 V2 … V2 Variable División Atrib1 Atrib2 V3 V3 V3 … V3 Variable División Atrib1 Atrib2 V4 V4 …. V4 V5 … V5 Tabla Índice (Año, mes, NIU, ….) tabla1 tabla2 tabla3 Tablas con miles de millones de registros Zújar total Zújares parciales
  • 14. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Modelo de datos: diccionario Zújar VISTA MOTOR Tabla Zújar VISTA CLIENTE: árbol de variables Fichero con datos del negocio Información desnormalizada Evitar join DICCIONARIO DE METADATOS: recoge información de ficheros, tablas, árboles de variables (vista de usuario), seguridad, relaciones entre Zújares, …
  • 15. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude FILTRADO DE REGISTROS - Operadores lógicos: Y, O, NOT, … - Operadores de relación (=, >, <, ) - Operadores especiales (colectivos) Funcionalidades Zújar OPERACIONES SOBRE LOS RESULTADOS - Ordenación - Estadísticos (Suma, Media, …) - Agrupaciones - Expresiones calculadas (v1+v2/v3….) - Consultas (publicas y privadas) - Reglas de formato (resaltar los registros que …) VISTA DE RESULTADOS -Tabla - Gráficos - Vistas enlazadas - Exportaciones (Excel, Access, …)
  • 16. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Zújar Contribuy. Zújar Inmuebles Motor Cruce de peticiones entre Zújares Zújar Deudores …. Colectivos….….…. ….….…. Colectivos creados en otros Zújares se pueden aplicar como filtro. Enlaces en cliente (local) entre Zújares. Combinación de Zújares en próxima versión.
  • 17. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Cruce de peticiones entre Zújares: colectivos FILTROS RESULTADOS (Zújar 2) Contribuyente PERTENECE A COLECTIVO “mi colectivo” (de Zújar 1) “mi colectivo”
  • 18. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Cruce de peticiones entre Zújares: enlace entre Zújares RESULTADOS Petición 1 (Zújar 1) RESULTADOS Petición 2 (Zújar 2) Contribuyente del Zújar 2 que están a la consulta del Zújar 1
  • 19. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Cruce de peticiones entre Zújares: combinación Peticiones (filtros, ordenaciones, …) sobre campos de distintos Zújares (siguiente versión) ZUJAR 1 ZUAJR 2
  • 20. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude • Tablas con más de 3.000 columnas • Más de un millón de columnas definidas en más de 7.000 tablas. • Más de 94.000.000.000 de filas • Alrededor de 50 TB de disco • Tablas físicas con más de 2.000.000.000 de filas • Tablas lógicas divididas en tablas físicas y que en total contienen más de 19.000.000.000 de filas. • Más de 500.000 consultas diarias, normalmente pesadas ¿Cuántos datos? Algunos ejemplos
  • 21. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Motor (Java, C++) Metadatos (MySQL) Datos (Sybase IQ) AliaPrometeo Cliente Zújar Servicios Teseo Windows Forms, C# Framework .NET DevXpress yFiles AplicacionesAEAT Gestordecontenidos Arquitectura cliente ZUJAR
  • 22. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude • Herramienta de desarrollo • Microsoft Visual Studio 2010 • Frameworks 4.0 • Cliente pesado • Windows Forms • Lenguaje de desarrollo • C# • Componente de presentación de datos • Developer Express v2011 • Componente de visualización de grafos • yFiles .Net 4.2 Cliente Zújar
  • 23. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude • Desarrollo Java (frontal) y C++ en Linux (SUSE 11) • Interfaz SOAP con aplicaciones clientes. • “dialecto” SQL para dar respuesta a las necesidades específicas del negocio: zSQL. • SGBD: MySQL y SAP Sybase IQ (futuro IMPALA). • El Motor se encarga de transformar zSQL a SQL y resolver las peculiaridades de cada SGBD. Motor Zújar
  • 24. Subdirección General de Tecnologías de Análisis de la Información e Investigación del Fraude Uso de Zújar 0 100 200 300 400 500 600 700 800 900 1000 2.010 2.011 2.012 2.013 2.014 2.015 UsodeZújar Número de Zújares distintos 0 100000 200000 300000 400000 500000 600000 700000 2.010 2.011 2.012 2.013 2.014 2.015 UsodeZújar Número de peticiones del tipo "abrir consulta“ 0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 2.010 2.011 2.012 2.013 2.014 2.015 UsodeZújar Número de usuarios distintos (*) 9 primeros meses (*) AREA DE ADUANAS 29% AREA DE INSPECCION 21% ZÚJARES COMUNES + INFORMÁTICA 17% AREA DE RECAUDACION 8% AREA DE GESTION 8% AREA DE RR.HH. Y GESTION ECONOMICA 6% AREA DE JEFATURA 3% AREA GRAL.DE APOYO ADMINISTRATIVO 3% AREA AUDITORIA INTERNA 2% OTROS 3%Nº de Peticiones