Successfully reported this slideshow.
We use your LinkedIn profile and activity data to personalize ads and to show you more relevant ads. You can change your ad preferences anytime.

Informe big data_en_salud_digitalcg

43 views

Published on

Informe big data en salud digital

Published in: Healthcare
  • Be the first to comment

  • Be the first to like this

Informe big data_en_salud_digitalcg

  1. 1. El estudio “Big Data en salud digital” ha sido elaborado por los siguientes equipos de trabajo: EQUIPO DE TRABAJO DE LA FUNDACIÓN VODAFONE ESPAÑA RED.ES Alberto Urueña López (Dirección y Coordinación) María Pilar Ballestero Alemán Eva Prieto Morais ANÁLISIS E INVESTIGACIÓN José María San Segundo Encinar (Dirección y Coordinación) Iván Soler ISBN: 978-84-617-5896-8 Reservados todos los derechos a Fundación Vodafone España y Red.es. Se permite su copia y distribución por cualquier medio siempre y cuando se mantenga el reconocimiento de sus autores, no se haga uso comercial de la obra y no se realice ninguna modificación de la misma. La información y opiniones vertidas por los expertos, no necesariamente reflejan la opinión de Red.es y Fundación Vodafone España.
  2. 2. ÍNDICE DE CONTENIDOS 1. INTRODUCCIÓN................................................................................................................................. 5 1.1. PRESENTACIÓN......................................................................................................................................5 1.2. FINALIDAD DEL ESTUDIO .......................................................................................................................6 1.3. METODOLOGÍA .....................................................................................................................................6 2. INTRODUCCIÓN A LA SALUD DIGITAL................................................................................................. 8 2.1. MARCO CONCEPTUAL ...........................................................................................................................8 2.1.1. SALUD Y SALUD DIGITAL................................................................................................................8 2.1.2. APLICACIONES EN SALUD DIGITAL.................................................................................................8 2.1.3. MEJORAS DERIVADAS DEL USO DE LAS APLICACIONES EN SALUD DIGITAL ................................11 2.2. MARCO REGULATORIO........................................................................................................................12 3. INTRODUCCIÓN AL BIG DATA .......................................................................................................... 14 3.1. MARCO CONCEPTUAL .........................................................................................................................14 3.1.1. DEFINICIÓN DE BIG DATA............................................................................................................14 3.1.2. LAS “V” DEL BIG DATA .................................................................................................................14 3.1.3. LAS FUENTES DE INFORMACIÓN DEL BIG DATA ..........................................................................15 3.1.4. CONCEPTOS RELACIONADOS CON BIG DATA ..............................................................................16 3.1.5. INFRAESTRUCTURA EN BIG DATA................................................................................................18 3.1.6. TIPOS DE ANÁLISIS EN BIG DATA.................................................................................................19 3.2. ASPECTOS ORGANIZATIVOS ................................................................................................................20 3.2.1. NORMATIVA SOBRE BIG DATA ....................................................................................................20 3.2.2. INICIATIVAS DE FOMENTO DEL BIG DATA ...................................................................................21 3.2.3. LOS PERFILES PROFESIONALES ....................................................................................................21 3.3. FASES DE UN PROYECTO BIG DATA......................................................................................................22 3.3.1. LAS PREGUNTAS INICIALES..........................................................................................................22 3.3.2. CREACIÓN DEL MODELO..............................................................................................................22 3.3.3. ELECCIÓN TECNOLÓGICA.............................................................................................................23 3.3.4. IMPLEMENTACIÓN DEL MODELO................................................................................................23 4. APLICACIÓN DEL BIG DATA EN SALUD.............................................................................................. 25 4.1. LA EVIDENCIA DEL MUNDO REAL.........................................................................................................25 4.2. FUENTES DE INFORMACIÓN EN BIG DATA EN SALUD ..........................................................................26 4.3. LA CUESTIÓN DE LA INTEROPERABILIDAD ...........................................................................................26 4.4. BIG DATA Y MHEALTH...........................................................................................................................27 4.5. EL EFECTO TRANSFORMADOR DEL BIG DATA EN EL ÁMBITO DE LA SALUD..........................................28 4.6. CAMPOS DE APLICACIÓN DEL BIG DATA EN SALUD..............................................................................29 4.6.1. GENÓMICA ..................................................................................................................................29 4.6.2. INVESTIGACIÓN CLÍNICA..............................................................................................................30 4.6.3. EPIDEMIOLOGÍA ..........................................................................................................................30 4.6.4. MONITORIZACIÓN Y SEGUIMIENTO DE ENFERMOS CRÓNICOS ..................................................31 4.6.5. OPERATIVA CLÍNICA.....................................................................................................................32 4.6.6. FARMACOLOGÍA..........................................................................................................................33 5. DESPLIEGUE DEL BIG DATA EN SALUD.............................................................................................. 35 5.1. ESTADO DE DESARROLLO ....................................................................................................................35 5.2. LA CUESTIÓN SOBRE LOS PROYECTOS PILOTO.....................................................................................35 5.3. PROYECTOS IMPULSADOS POR LA UE..................................................................................................36 5.4. ALGUNOS EJEMPLOS DE IMPLEMENTACIÓN EN ESPAÑA ....................................................................37 5.5. IMPACTO SOCIOECONÓMICO .............................................................................................................38
  3. 3. 6. BENEFICIOS DE LA IMPLANTACIÓN DE BIG DATA EN SALUD............................................................. 40 6.1. FAVORECER LA SOSTENIBILIDAD DEL SISTEMA DE SALUD ...................................................................41 6.2. MAYOR CALIDAD EN LA ATENCIÓN SANITARIA....................................................................................42 6.3. UNA MEJOR ADECUACIÓN DE LOS FÁRMACOS....................................................................................44 6.4. NUEVAS MANERAS DE HACER MEDICINA............................................................................................44 6.5. BIG DATA Y LA ATENCIÓN A ENFERMOS CRÓNICOS Y PERSONAS CON DISCAPACIDAD .......................48 6.5.1. LOS CAMBIOS EN LA ESTRUCTURA DEMOGRÁFICA.....................................................................48 6.5.2. EL IMPACTO ECONÓMICO DE LA CRONICIDAD............................................................................49 6.5.3. COLECTIVOS ESPECIALMENTE VULNERABLES..............................................................................50 6.5.4. NUEVOS MODELOS DE VIDA INDEPENDIENTE.............................................................................50 6.5.5. NUEVOS MODELOS DE ATENCIÓN SANITARIA.............................................................................51 6.6. LUCHA CONTRA EL FRAUDE Y LOS ABUSOS..........................................................................................51 6.7. VALORACIÓN DE LAS HIPÓTESIS ..........................................................................................................52 7. BARRERAS Y RIESGOS A LA IMPLANTACIÓN DEL BIG DATA EN SALUD.............................................. 54 7.1. BARRERAS ORGANIZATIVAS ................................................................................................................56 7.1.1. LA COORDINACIÓN EN EL CONSEJO INTERTERRITORIAL .............................................................56 7.1.2. LA COORDINACIÓN ENTRE LOS DIFERENTES AGENTES DEL SISTEMA..........................................57 7.2. BARRERAS NORMATIVAS.....................................................................................................................57 7.3. BARRERAS TÉCNICAS ...........................................................................................................................61 7.3.1. LA INTEROPERABILIDAD Y ESCALABILIDAD..................................................................................61 7.3.2. LA USABILIDAD Y CALIDAD DE LOS DATOS ..................................................................................62 7.4. BARRERAS DE MERCADO.....................................................................................................................63 7.5. RIESGOS ÉTICOS...................................................................................................................................64 7.5.1. LA PÉRDIDA DE AUTONOMIA SOBRE LAS DECISIONES RELACIONADAS CON LA PROPIA SALUD.64 7.5.2. EL INCREMENTO DE LAS DESIGUALDADES ..................................................................................65 7.6. VALORACIÓN DE LAS HIPÓTESIS ..........................................................................................................66 8. TENDENCIAS DE FUTURO................................................................................................................. 68 8.1. LOS AVANCES EN MACHINE LEARNING: EL DEEP LEARNING................................................................68 8.2. HACIA UNA NUEVA MEDICINA PERSONALIZADA .................................................................................69 8.3. HACIA LOS DATOS GLOBALES ..............................................................................................................70 8.4. REALIDAD VIRTUAL..............................................................................................................................71 8.5. 5G, INTERNET DE LAS COSAS, WEARABLES Y NUEVOS BIOSENSORES..................................................72 8.6. NUEVAS HERRAMIENTAS DE VISUALIZACIÓN......................................................................................73 9. RECOMENDACIONES DE LOS EXPERTOS........................................................................................... 75 9.1. EL NECESARIO REPLANTEAMIENTO ESTRATÉGICO DE LA ATENCIÓN SOCIOSANITARIA.......................75 9.2. ACTUAR CON PRUDENCIA EN BIG DATA EN SALUD..............................................................................76 9.3. MEJORAR LA COORDINACIÓN ENTRE LOS AGENTES DEL SISTEMA ......................................................77 9.4. SOLVENTAR LAS CUESTIONES DE INTEROPERABILIDAD.......................................................................77 9.5. LA NECESIDAD DE UN NUEVO MARCO DE GOBERNANZA DE DATOS ...................................................77 10. REFERENCIAS BIBLIOGRÁFICAS ........................................................................................................ 79
  4. 4. Informe Big Data en salud digital 5 1. INTRODUCCIÓN 1.1. PRESENTACIÓN Big data se basa en el procesamiento, análisis y visualización de grandes bases de datos, no necesariamente estructuradas, para la toma de decisiones. Este enfoque, relativamente reciente, está adquiriendo una gran relevancia gracias a la acumulación masiva de datos favorecida por la implantación generalizada de las tecnologías de la información y la comunicación. Concretamente, 2002 fue el año en que el volumen de información digitalizada superó por primera vez la cantidad de información almacenada de forma analógica y puede ser considerado, por tanto, como el inicio de la era digital de la información (Hilbert, 2011). Actualmente, sobre todo desde la generalización del uso de las redes sociales y los smartphones, esta cantidad de información digitalizada crece de forma exponencial. Algunos sectores, como el comercial y financiero, han sido los principales impulsores de esta tecnología, teniendo a las grandes empresas tecnológicas como las principales pioneras. Éstas integran de forma estratégica en su negocio los avances y descubrimientos que van realizando, a los que, de forma pública, se tiene difícil acceso. Por otro lado, los datos relacionados con la salud también han estado siguiendo esta tendencia. Así, gracias a Internet, la popularización de los smartphones y la aparición de multitud de sensores y redes sociales, los datos masivos, que incluyen no sólo registros clínicos y operacionales sino también texto, audio o vídeo y multitud de registros biométricos, son susceptibles de ser analizados para proporcionar información nueva y útil para los sistemas de salud. En este sentido, Big Data abre una nueva era para mejorar la prestación de servicios de salud. Se abren nuevas oportunidades, tanto para el diagnóstico y el tratamiento de multitud de problemas de salud y la capacidad, aún incipiente, de proporcionar nuevos servicios personalizados mediante su detección en tiempo real y la adecuación de los tratamientos desde una perspectiva hipersegmentada. Entre los expertos y profesionales existe un elevado consenso sobre los beneficios teóricos de la aplicación del Big Data al mundo de la salud y, en general, de todos los aspectos de salud digital, configurándose como la gran esperanza para mantener la calidad asistencial sociosanitaria en Europa. Un continente, por otra parte, cada vez más envejecido, y por tanto, con gran prevalencia de patologías crónicas, conllevan asociado un enorme gasto sanitario (Comisión Europea, 2001). Pero más allá de los argumentos tradicionales en defensa de la idoneidad de aplicar estas tecnologías a la salud, basados en cálculos de coste y eficiencia, Tim Kelsey, director de pacientes e información del NHS británico, ofrecía hace poco más de un año una perspectiva original, afirmando que el uso del Big Data en salud era esencialmente “un imperativo moral” (NHS, 2015). En el fondo y expresado de forma muy simple, el sistema de salud ha de salvar vidas y esta consideración debe prevalecer sobre cualquier otra. Hasta ahora, parece clara la idoneidad de tomar acciones decididas e inmediatas para avanzar en todos los aspectos de salud digital, incluyendo entre ellos al Big Data en salud, pero antes deben construirse las suficientes salvaguardas para atenuar los posibles efectos negativos colaterales. Por otro lado, la enorme potencialidad derivada de la aplicación de Big Data en salud puede llegar a resultar profundamente transformadora en el ejercicio de la práctica médica y, por consiguiente, influir en todos los aspectos relacionados con la prestación de servicios de salud.
  5. 5. Informe Big Data en salud digital 6 A lo largo de este informe se desarrollarán estas ideas, entre otras, fruto del análisis de múltiples y diversas fuentes de información y de la consulta realizada a 25 expertos en la cuestión, procedentes de diferentes ámbitos de especialización. Así, se tratará de resolver cómo funciona Big Data en salud; cómo se recogen o se pueden recoger los datos; qué tipos de modelos analíticos se pueden construir y con qué herramientas; cuáles son los beneficios que se pueden esperar; cuáles son las barreras que se deben superar; cómo afecta la implementación de Big Data a la práctica e investigación clínica o la misma gestión de los centros sanitarios; qué impacto puede tener en personas con problemas de pluripatologías crónicas o con discapacidad de algún tipo; o cómo puede transformar la industria farmacológica, entre otras cuestiones. Pero esencialmente, de lo que trata este informe es de aproximarse a comprender, siguiendo el argumento de Tim Kelsey, en qué medida y de qué manera Big Data puede ayudar a mejorar la salud y la calidad de vida de los ciudadanos. 1.2. FINALIDAD DEL ESTUDIO Red.es y la Fundación Vodafone España vienen manteniendo una estrecha relación en diferentes ámbitos para impulsar las TIC en la sociedad española, y especialmente en los campos de menor implantación y/o más valor social. De entre las diferentes aplicaciones de las TIC, la tecnología Big Data presenta un extraordinario potencial en el ámbito de la medicina ya que permite analizar grandes volúmenes de datos a fin de predecir, prevenir o personalizar tratamientos en las diferentes patologías. En este contexto, Red.es y la Fundación Vodafone España plantearon la realización de un estudio integral sobre Big Data en salud digital con la finalidad de realizar un análisis de la situación y de las implicaciones y tendencias de evolución de Big Data en salud. Concretamente, el estudio pretende: 1. Elaborar un marco conceptual de Big data en salud digital que permita: a) Comprender el significado de Big data y sus principales características; b) Explorar las infraestructuras tecnológicas sobre las que se soporta y su ecosistema de herramientas; c) Establecer la relación de Big data con la salud digital y d) Tratar su marco regulatorio y las diferentes estrategias institucionales. 2. Realizar un análisis sobre las utilidades y aplicaciones de Big Data en salud digital que permita: a) Conocer sus principales campos de aplicación; b) Identificar las principales oportunidades que ofrece, los principales retos que debe afrontar para su implantación, así como prevenir los riesgos que se pueden derivar de su uso generalizado. 3. Llevar a cabo una evaluación sobre su implantación que permita: a) Conocer su estado actual de desarrollo en España; b) Estimar el impacto derivado de su implementación y c) Prever tendencias de evolución a futuro. 1.3. METODOLOGÍA Para la realización del proyecto se ha llevado a cabo un proceso metodológico que ha constado de tres fases:  Una primera fase de revisión y análisis de la literatura. En esta primera aproximación se ha procedido a la consulta y análisis de una amplia selección de publicaciones oficiales, artículos en revistas científicas e informes de distintas empresas y organizaciones. Las
  6. 6. Informe Big Data en salud digital 7 búsquedas iniciales han tenido como objetivo cimentar el conocimiento general y de base sobre el objeto de la investigación. A medida que este conocimiento se ha ido asentando, se han incorporado nuevas necesidades de conocimiento, haciendo búsquedas más refinadas y concretas de la problemática.  Una segunda fase de análisis basado en entrevistas en profundidad a 25 expertos en diversos ámbitos relacionados con el objeto de estudio. Una vez iniciada la fase de análisis documental, y consolidadas las primeras hipótesis, se ha procedido a seleccionar el panel de expertos para la realización de las entrevistas, tratando de distribuir los ámbitos de experiencia e interés tratando de realizar una aproximación holística a la cuestión. Entre los expertos que han colaborado se encuentran profesionales del ámbito socio sanitario; consultores especializados en Big Data; así como representantes de empresas del sector y de diferentes asociaciones.  Una tercera fase de consulta cuantitativa al panel de expertos. Tras las entrevistas en profundidad, se ha tratado de validar cuantitativamente las cuestiones de mayor relevancia surgidas a lo largo del proceso de investigación mediante un cuestionario donde los expertos se han posicionado en función de su nivel de acuerdo.
  7. 7. Informe Big Data en salud digital 8 2. INTRODUCCIÓN A LA SALUD DIGITAL 2.1. MARCO CONCEPTUAL 2.1.1. SALUD Y SALUD DIGITAL La Organización Mundial de la Salud (OMS) define la salud como "un estado de completo bienestar físico, mental y social, más allá de la ausencia de afecciones o enfermedades" (OMS, 1946). En este sentido, y según las conclusiones de la OMS, un buen estado de salud de la ciudadanía implica una mejor calidad de vida, ayuda a la reducción de las desigualdades sociales, aumenta la productividad de la sociedad en su conjunto con lo que aumentan los ingresos de los ciudadanos y, por tanto, los ingresos fiscales, reduce la presión presupuestaria en el Sistema Nacional de Salud y, finalmente, reduce la demanda de servicios sociales. De esta manera, un sistema de salud eficaz es un requisito ineludible para un crecimiento económico deseable y una sociedad más plena y satisfecha. Por su parte, el Plan de Acción sobre salud digital (o eHealth1 ) de la Comisión Europea define salud digital como "la aplicación de tecnologías de la información y las comunicaciones en toda la gama de funciones que afectan al sector de la salud incluyendo productos, sistemas y servicios que van más allá de las aplicaciones simplemente basadas en Internet” (Comisión Europea, 2012b). Así, la salud digital puede ser entendida como la aplicación de Internet y otras tecnologías relacionadas en la industria de la salud para mejorar el acceso, la eficiencia, la eficacia y calidad de los procesos clínicos y empresariales utilizadas por las organizaciones de salud, médicos, pacientes y consumidores en un esfuerzo por mejorar el estado de salud de los pacientes. 2.1.2. APLICACIONES EN SALUD DIGITAL LOS HISTORIALES O REGISTROS MÉDICOS ELECTRÓNICOS INTEGRADOS Los historiales médicos electrónicos integrados en redes o registros electrónicos de salud son expedientes que pueden integrar la información clínica y administrativa de un paciente en redes de información sanitaria que cumplen los estándares de interoperabilidad 2 para poder ser utilizados y compartidos por profesionales autorizados dentro de más de una organización de salud. Los sistemas de información hospitalaria suelen contemplar la información demográfica y general del paciente, la agenda médica y la ficha clínica del paciente. También, almacenan y organizan toda la información específica de los diagnósticos y tratamientos efectuados. La implementación de estos sistemas en una institución de salud permite el acceso expedito a la información de tratamiento y facilita al personal médico obtener un amplio conocimiento del 1 A lo largo del documento se utilizarán los términos eHealth o salud digital, indistintamente 2 Los estándares de interoperabilidad en salud tienen como objetivo facilitar el intercambio electrónico de información clínica. En España, los estándares de interoperabilidad del Sistema Nacional de Salud quedan reflejados en el Esquema de Interoperabilidad del Ministerio de Sanidad, Servicios Sociales e Igualdad.
  8. 8. Informe Big Data en salud digital 9 estado del paciente. Estos sistemas son gestionados por los profesionales de la salud de un centro de asistencia sanitaria. Además, los sistemas de información hospitalaria también permiten el control de los servicios prestados a los pacientes y sus costes asociados así como el resto de información administrativa. Algunas veces, estos registros electrónicos de salud pueden ser gestionados y compartidos por el propio paciente. En este caso se conocen como carpetas personales de salud o expedientes electrónicos del paciente. A continuación se presentan las funcionalidades más habituales de los registros médicos electrónicos. Tanto los registros electrónicos de salud (EHR, por sus siglas en inglés) gestionados por los profesionales médicos, como los registros personales de salud (PHR, por sus siglas en inglés), gestionados por los propios pacientes (OCDE, 2010).  Registros electrónicos de salud (EHR): los registros electrónicos de salud están diseñados para registrar y compartir la información por los profesionales del sistema de salud. Un registro electrónico de la información completa sobre la salud del paciente permite a los profesionales dar la mejor atención posible, ya sea durante una consulta o en una emergencia médica, proporcionando la información que pueden necesitar para evaluar la condición de salud del paciente. De la misma manera, los registros electrónicos de salud agilizan la atención médica. Por ejemplo, en una situación de emergencia pueden proveer acceso instantáneo a la información sobre la historia de un paciente y tener información inmediata sobre alergias o medicamentos sin tener que esperar ninguna prueba necesaria para esclarecerlo. Las funcionalidades de estos registros pueden clasificarse en distintas subdimensiones. Algunas de ellas son:  Los registros de información e historia clínica incluyen, entre otros, el registro de la historia médica, los síntomas, los resultados de los tratamientos terapéuticos, las constantes vitales, las imágenes radiológicas, los parámetros médicos básicos, los test y pruebas o las razones de la cita médica.  Los sistemas de ayuda al diagnóstico incluyen funcionalidades como los sistemas de ayuda al diagnóstico sobre contraindicaciones; el registro de las interacciones en medicamentos o guías clínicas y mejores prácticas.  La gestión administrativa del paciente incluye aspectos como el registro de datos administrativos o de facturación.  Los aspectos de apoyo farmacológico incluyen tanto los listados de fármacos como el registro de prescripciones.  Funcionalidades de los registros personales de salud (PHR): los registros personales de salud pueden ser vistos como la parte cliente de los registros electrónicos de salud. Estos pueden incluir tanto el resumen de la información e historia clínica del paciente como la administrativa, de facturación o información relacionada con los seguros médicos. En este sentido, muchas de las posibilidades de registro de datos biológicos que permiten los llevables (wearables) se pueden incluir, en función del diseño del sistema, entre las funcionalidades de los registros personales de salud. Las principales funcionalidades del PHR se pueden clasificar en las siguientes subdimensiones:
  9. 9. Informe Big Data en salud digital 10  La información clínica, como la posibilidad del paciente de acceder a sus registros médicos; ver los resultados de sus pruebas; pedir renovaciones de prescripciones farmacéuticas o complementar sus propios registros médicos con otra información.  La información administrativa incluye aspectos como la solicitud de citas o bien la solicitud de referencias médicas. LOS SISTEMAS DE INTERCAMBIO DE INFORMACIÓN DE SALUD Los sistemas de Intercambio de Información de Salud (Health Information Exchange, HIE, por sus siglas en inglés) permiten a los profesionales y a los pacientes acceder y compartir la información clínica y administrativa del paciente. Existen tres formas principales de intercambio de información de salud (OCDE,2010):  El dirigido a los profesionales de salud que intercambian su información entre ellos para realizar una atención coordinada del paciente entre diversos especialistas.  El intercambio de información de salud mediante consultas de los profesionales que solicitan información generada por otros profesionales habitualmente para ejercer una actuación clínica no coordinada.  El intercambio de información de salud gestionado por el paciente, que es quien agrega y controla el uso de su propia información y aquella que generan los diferentes profesionales. Las principales funcionalidades del HIE pueden clasificarse en las siguientes subdimensiones:  La información clínica, incluye, entre otras funcionalidades como el intercambio de informes radiológicos con otros proveedores sanitarios, el intercambio de test y pruebas de laboratorio con otros profesionales; el intercambio de información médica en derivaciones; o la transferencia de prescripciones a las farmacias.  La información administrativa, incluye tanto la certificación de bajas o discapacidades como el intercambio de datos administrativos de los pacientes con otros proveedores. LAS APLICACIONES DE TELESALUD O TELEMEDICINA Debido a que tanto la telemedicina como la telesalud son ciencias en constante evolución, no existe una definición concreta y definitiva de ellas y, en múltiples ocasiones, ambos conceptos se utilizan como sinónimos y de forma totalmente intercambiable. La OMS (2011a) adopta la siguiente definición de telemedicina: “la prestación de servicios de atención de la salud, donde la distancia es un factor crítico, por todos los profesionales de la salud que utilizan tecnologías de la información y de la comunicación para el intercambio de información válida para el diagnóstico, tratamiento y prevención de enfermedades y lesiones, la investigación y la evaluación, y para la formación continuada de los profesionales de la salud, todo en aras de avanzar en la salud de los individuos y sus comunidades”. Tanto la telesalud como la telemedicina se refieren al uso de las TIC a distancia para proveer servicios de salud. Aun así, también de forma habitual, muchas organizaciones referentes en el ámbito de la salud, e incluso la propia OMS, hacen una distinción entre ellas en función de los
  10. 10. Informe Big Data en salud digital 11 servicios que se proveen. A continuación se presentan los servicios de telemedicina y telesalud más relevantes (OCDE, 2012):  Servicios de telemedicina: una primera distinción en los servicios de telemedicina está relacionada con el hecho de si ésta es síncrona o asíncrona. La telemedicina síncrona implica la transmisión de señales de forma simultánea a su obtención y se destina a su inmediata visualización o procesamiento. Al contrario, en la telemedicina asíncrona, los datos del paciente son obtenidos, almacenados y transmitidos para su posterior evaluación por parte de los profesionales de la salud. En general, los principales servicios de telemedicina son:  Servicios de asistencia remota: pueden referirse tanto a las teleconsultas de seguimiento, diagnóstico o tratamiento a distancia del paciente, como a los servicios de telemonitorización de pacientes a menudo crónicos, que incluyen en muchas ocasiones registros de parámetros biológicos. Estos servicios también incluyen la comunicación electrónica entre profesionales para llevar a cabo acciones coordinadas. A menudo, dentro de los servicios de asistencia remota se realiza una distinción entre telecuidado (telecare) y telemonitorización e, incluso, muchas veces se distinguen de la telemedicina. Los servicios de telemonitorización amplían las opciones para los pacientes y permiten una atención continua en el hogar. Son impulsados por profesionales de la salud y también contribuyen a empoderar a los ciudadanos y pacientes a tomar un papel activo en la gestión de su enfermedad. Además, se reduce la duración de la estancia hospitalaria de los pacientes, se proporciona un nuevo papel a los médicos como segunda línea de soporte en unos entornos de servicio profesional multiprofesional, a menudo coordinados por profesionales de enfermería y los pacientes pueden responsabilizarse sobre su enfermedad y tomar el control sobre ella.  Servicios de gestión administrativa de pacientes: incluyen tanto la solicitud de pruebas analíticas como aspectos relacionados con la facturación por la prestación de servicios.  Servicios de telesalud no clínicos: la telesalud suele referirse a una gama más amplia de servicios que la telemedicina. Es decir, mientras que la telemedicina se refiere específicamente a los servicios clínicos a distancia, la telesalud puede referirse también a los servicios no clínicos a distancia. Así, estos servicios pueden definirse como todas aquellas aplicaciones relacionadas con el mundo de la salud y transmitidos por vía electrónica que no tienen una vinculación directa con la práctica clínica. Estos sistemas no se utilizan directamente por los pacientes o profesionales de la salud. Dentro de este ámbito de aplicación de la salud digital, encontramos usos de salud pública como las campañas informativas sobre prevención y salud, sistemas de recolección de datos de salud pública o plataformas de información especialmente dedicadas a la investigación sanitaria. 2.1.3. MEJORAS DERIVADAS DEL USO DE LAS APLICACIONES EN SALUD DIGITAL Las diferentes funcionalidades de la salud digital pueden verse como distintas perspectivas de una misma realidad, siendo el EHR el registro y consulta de información clínica y administrativa realizado por los profesionales, el PHR (Personal Health Records) el registro y la consulta de
  11. 11. Informe Big Data en salud digital 12 información clínica y administrativa realizado por los pacientes y el HIE los sistemas que permiten intercambiar la información alojada en los diversos repositorios y accesible para los diversos perfiles de usuarios. En este sentido, el almacenamiento de intercambio de información electrónica de salud mediante estos sistemas supera los usos tradicionales como el almacenamiento de la información en papel, su transmisión por correo o fax, o el hecho de que los pacientes lleven consigo sus registros de cita en cita. Si bien estos sistemas electrónicos no pueden reemplazar completamente la comunicación médico–paciente, sí pueden mejorar la toma de decisiones e, incluso, posibilitar una atención más personalizada al paciente al disminuir las pérdidas de tiempo asociadas al registro, proceso e intercambio de información no electrónica. Las principales ventajas del uso de estos sistemas son: la disminución de los errores de medicación; la disminución de los reingresos hospitalarios, la disminución de la duplicación de ensayos y, consiguientemente, una mejora del diagnóstico y la atención Todo ello, al mismo tiempo que se reducen los costes asociados a la atención sanitaria. 2.2. MARCO REGULATORIO En este apartado se detalla la legislación española aplicable al ámbito de la salud, tanto a nivel general como específica, del entorno digital. Cabe especificar que al no existir normativa específica respecto a las cuestiones de salud digital, en España se aplica un marco regulatorio esencial:  La Ley 14/1986, de 25 de abril, General de Sanidad. Establece que el Sistema Nacional de Salud es el conjunto de servicios de salud de la Administración del Estado y de las Comunidades Autónomas, e integra todas las funciones y prestaciones sanitarias que son responsabilidad de los poderes públicos para el debido cumplimiento del derecho a la protección de la salud. La Ley General de Sanidad establece la universalidad de la cobertura como una de las características básicas del sistema español al determinar que la asistencia sanitaria pública se extenderá a toda la población. De igual forma, establece la equidad como principio general del Sistema Nacional de Salud, entendida ésta como la garantía de que el acceso y las prestaciones sanitarias se realizarán en condiciones de igualdad efectiva. Además, la Ley General de Sanidad otorga especial relevancia a que los medios y actuaciones del sistema sanitario estarán prioritariamente orientados a la promoción de la salud y a la prevención de las enfermedades. Ello supone una concepción integral de la salud por la cual los servicios de salud han de incorporar las acciones de promoción de la salud y de prevención de las enfermedades de la misma forma que las asistenciales, las curativas, las rehabilitadoras o las de cuidados paliativos.  Ley Orgánica 15/1999, de 13 de diciembre, de Protección de Datos de Carácter Personal (LOPD). En esta ley se incide en la obligación de almacenar los datos de salud y los diferentes registros electrónicos de forma descentralizada. Según la LOPD, las medidas de seguridad de los ficheros de datos se clasifican en tres niveles acumulativos de seguridad.
  12. 12. Informe Big Data en salud digital 13  Nivel básico de seguridad: afecta a los ficheros que sólo contengan datos identificativos. Por ejemplo, el nombre, el teléfono, el DNI, la afiliación a la seguridad social, la edad, la fecha de nacimiento o el sexo.  Nivel medio de seguridad: se aplica a los ficheros que contengan datos relativos a la situación financiera, patrimonial o de crédito, así como cuestiones relacionadas con las instituciones y administraciones del Estado, o bien hábitos de consumo, sanciones administrativas, antecedentes penales, etc.  Nivel alto de seguridad: se aplica a los ficheros que contienen datos especialmente protegidos, como por ejemplo, los relativos a ideología, afiliación sindical o política, religión y creencias, práctica sexual, así como a las cuestiones relativas a la salud del individuo.  Ley 41/2002, de 14 de noviembre, básica reguladora de la autonomía del paciente y de derechos y obligaciones en materia de información y documentación clínica. En esta ley, además de incidir en la obligación de almacenar la información de forma descentralizada, se realiza una distinción específica en función del tipo de información susceptible de ser almacenada. Así, se distingue entre: 1- La documentación médica o clínica, en relación a un episodio específico de cuidado sanitario. 2- La historia clínica del paciente que contiene la información sobre la situación y la evolución médica de un paciente a través de todo el proceso de atención. 3- La información médica o clínica que se refiere a la adquisición de conocimientos sobre el estado físico y la salud de un paciente con el fin de proporcionarle una mejor observación de la salud, la asistencia y la recuperación.  Ley 16/2003, de 28 de mayo, de Cohesión y Calidad del Sistema Nacional de Salud. Esta ley ordena las actuaciones dirigidas a garantizar la máxima calidad de la atención sanitaria a todos los ciudadanos, con independencia de su lugar de residencia y complementarias a las que se desarrollan desde los servicios de salud de las Comunidades Autónomas. Los principios que inspiran el Plan de Calidad para el Sistema Nacional de Salud, previsto en la Ley 16/2003 de Cohesión y Calidad del Sistema Nacional de Salud, son los de ofrecer garantías a pacientes, usuarios y profesionales para conseguir un Sistema Nacional de Salud:  Centrado en las necesidades de pacientes y de usuarios.  Orientado a la protección, la promoción de la salud y la prevención.  Preocupado por el fomento de la equidad.  Decidido a fomentar la excelencia clínica.  Interesado en impulsar la evaluación de tecnologías y procedimientos con base en la mejor evidencia disponible.  Capaz de generalizar el uso de las nuevas tecnologías de la información para mejorar la atención a pacientes, usuarios y ciudadanos y asegurar la cohesión de los servicios.  Capaz de planificar sus recursos humanos con suficiente anticipación para cubrir adecuadamente las necesidades de los servicios  Transparente para todos los actores.  Evaluable en el resultado de sus acciones.
  13. 13. Informe Big Data en salud digital 14 3. INTRODUCCIÓN AL BIG DATA 3.1. MARCO CONCEPTUAL Las grandes bases de datos que maneja la medicina son una importante fuente de información para mejorar la calidad del sector sanitario. En los últimos años, se ha vuelto cada vez más evidente que el gran flujo de datos relativos a aspectos de salud se puede aprovechar con nuevas y potentes tecnologías de recogida, agregación y técnicas para mejorar la prestación de asistencia sanitaria tanto a nivel individual, es decir, a nivel de pacientes, como respecto a poblaciones completas. 3.1.1. DEFINICIÓN DE BIG DATA La directiva UIT-T Y.3600, de la Unión Internacional de Telecomunicaciones (UIT), aprobada el 6 de noviembre de 2015, facilita las siguientes definiciones de Big Data y de Big Data como Servicio (BDaaS):  Big Data es un paradigma para hacer posible la recopilación, el almacenamiento, la gestión, el análisis y la visualización, potencialmente en condiciones de tiempo real, de grandes conjuntos de datos con características heterogéneas.  BDaaS es una categoría de servicio en la nube en la que las capacidades que se ponen a disposición del cliente del servicio en la nube le permiten recopilar, almacenar, analizar y visualizar los datos utilizando tecnologías Big Data. 3.1.2. LAS “V” DEL BIG DATA Hasta hace muy poco no existía una definición consensuada del concepto Big Data y mucho menos de su aplicación al mundo de la salud, existe el acuerdo de explicar el concepto mediante 3 características principales conocidas como las ‘3 vs’ (velocidad, volumen y variedad). VOLUMEN MASIVO DE DATOS La característica principal que define Big Data es la gran cantidad de volumen de información que maneja (Ishwarappa, 2015). Esta masiva cantidad de datos se acumula con un crecimiento exponencial, ampliando continuamente las estructura de almacenamiento de datos existentes. En este sentido, es importante remarcar que los costes asociados a la recogida, almacenamiento y proceso de datos derivados de la proliferación de dispositivos conectados entre sí y a Internet se reducen continuamente. En la actualidad, cuando se habla de bases de datos masivas se refiere a magnitudes del orden de petabytes (1015 bytes) o exabytes (1018 bytes). VELOCIDAD ELEVADA EN LA GENERACIÓN Y PROCESO DE INFORMACIÓN Otra de las características esenciales de Big Data es la enorme velocidad en la generación, recogida y proceso de la información. Así, la tecnología Big Data ha de ser capaz de almacenar y trabajar en tiempo real con las fuentes generadoras de información como sensores, cámaras de videos, redes sociales, blogs, páginas webs y otras fuentes que generan millones de datos al
  14. 14. Informe Big Data en salud digital 15 segundo. Por otro lado, la capacidad de análisis de dichos datos ha de ser muy veloz reduciendo los tiempos de procesamiento que presentaban las herramientas tradicionales de análisis. GRAN VARIEDAD EN LOS DATOS Finalmente, la tercera de las “v” que explica Big Data es la elevada capacidad de agregar información procedente de una amplia variedad de fuentes de información independientes, como redes sociales, sensores, máquinas o personas individuales. Son tantas que se precisan las nuevas tecnologías para analizar este tipo de datos con el fin de obtener una ventaja competitiva. En este sentido, los sistemas Big Data permiten la integración de datos de origen cuantitativo naturalmente desestructurados, así como gráficos, texto, sonido o imágenes. Los datos no estructurados representan un poderoso recurso sin explotar que tiene el potencial de proporcionar una visión más profunda de los clientes y las operaciones y, en última instancia, ayudar a impulsar la ventaja competitiva. Sin embargo, estos datos no pueden gestionarse fácilmente con las bases de datos relacionales y las herramientas de inteligencia de negocio tradicionales. LA CUARTA Y QUINTA “V” Más allá de las 3 ‘vs’, algunos autores están hablando de una cuarta y una quinta “v”, siendo éstas la veracidad de la información y la valorización de la misma. A pesar de no ser medidas de magnitud, son, habitualmente, aspectos considerados intrínsecos al Big Data.  Valorización: creación de una ventaja competitiva distintiva que presupone una buena comprensión de las expectativas y necesidades del cliente. Para ello se deben identificar y procesar los datos claves, permitiendo así:  Monetizar los datos.  Obtener nuevos clientes.  Generar fidelidad.  Reducir costes.  Mejorar la imagen de marca.  Veracidad: el Big Data ha de ser capaz de tratar y analizar inteligentemente el gran volumen de datos con la finalidad de obtener una información verídica y útil que nos permita mejorar nuestra toma de decisiones. El Big Data exige no solo que los datos sean muchos, analizados y aprovechados a gran velocidad, de diversas fuentes, sino que estos sean veraces y, por ello, confiables. 3.1.3. LAS FUENTES DE INFORMACIÓN DEL BIG DATA Se ha comentado que Big Data va más allá del volumen de información para abarcar características tales como la variedad de los datos; la velocidad de almacenamiento y proceso, y de forma muy significativa, en lo que respecta específicamente a la atención médica, a su veracidad. Para ello, es imprescindible la calidad de la información que se obtiene.
  15. 15. Informe Big Data en salud digital 16 En este sentido, se antoja imprescindible acercarse a las diferentes fuentes de información para el Big Data en salud. Podría afirmarse que toda la información generada en salud proviene de alguna de las siguientes tipologías de fuentes de información:  La web y las redes sociales (social media): la generación e interacción de datos de social media como Facebook, Twitter, o Linkedin, además de la información de sitios web de salud o las aplicaciones de smartphones.  Los datos de máquina a máquina: la información proveniente de las lecturas de los sensores, medidores y otros dispositivos.  Las grandes transacciones de datos: reclamaciones de atención médica y otros registros de facturación cada vez más disponibles en formatos semiestructurados y no estructurados.  Los datos biométricos: huellas dactilares, genéticos, escáner de retina, rayos X y otras imágenes médicas, la presión arterial, el pulso y lecturas de oximetría de pulso y otros tipos similares de datos.  Los datos generados por los seres humanos: datos no estructurados y semiestructurados, tales como registros médicos electrónicos (Electronic Medical Records, EMR, por sus siglas en inglés), notas de los profesionales sanitarios, correos electrónicos y documentos en papel. 3.1.4. CONCEPTOS RELACIONADOS CON BIG DATA A continuación se presentan brevemente las diferencias entre aquellos conceptos relacionados con Big Data que además suelen ser motivo de confusión. BIG DATA Y BUSINESS INTELLIGENCE Aunque se trata de un concepto relativamente nuevo, Big Data no ha surgido de la nada, ya que se puede entender como una evolución del concepto Business Intelligence (BI), que utilizan sobre todo los gestores para convertir sus empresas en organizaciones eficaces y eficientes (LEADA, 2015). Así, el BI tradicional captura información de las fuentes disponibles en la organización y tras la aplicación de algoritmia de análisis muestra unos resultados que tienen la finalidad de ayudar a la toma de decisiones estratégicas en la empresa. Aun así, es importante remarcar que toda la información analizada y visualizada desde BI proviene de fuentes de datos estructuradas. De esta manera, la gran novedad que aporta Big Data es la capacidad de procesar información no estructurada, como por ejemplo: lenguaje natural; información proveniente de las redes sociales; información proveniente de los diferentes dispositivos llevables (wearables), de los diferentes componentes de telemedicina o de variados sensores que pueden proporcionar datos muy valiosos al sector. En este sentido, la principal diferencia radica en la estructura de datos. Así, los métodos tradicionales de Business Intelligence se basan en agrupar los datos empresariales en un servidor central y analizarlos de forma offline. De esta manera, los datos se estructuran en una base de datos relacional convencional con un conjunto adicional de índices y formas de acceso a las tablas.
  16. 16. Informe Big Data en salud digital 17 En cambio, en Big Data los datos se almacenan en un sistema de ficheros distribuido en un entorno más flexible y permiten manejar cantidades más grandes de información de forma más ágil. Finalmente, la tecnología Big Data emplea procesamiento paralelo masivo de datos, mejorando la velocidad del análisis. Este proceso masivo de datos se ejecuta de forma simultánea y en paralelo, unificando los resultados parciales en resultados globales. BIG DATA Y DATA WAREHOUSE Un Data Warehouse es un almacén de datos, no volátil, integrado, creado con el fin de permitir la toma de decisiones en la organización. Es decir, es una arquitectura de datos. En cambio, una solución Big Data es al mismo tiempo una arquitectura de datos y una tecnología de proceso, análisis y visualización de datos. BIG DATA Y MINERIA DE DATOS Big Data y minería de datos también se refieren a dos realidades diferentes. Mientras ambos conceptos se relacionan con el uso de grandes conjuntos de datos para su proceso y análisis, los dos términos divergen en su operativa. La minería de datos se refiere al manejo de grandes conjuntos de datos para buscar información pertinente u oportuna. En este sentido, en minería de datos los decisores necesitan tener acceso a partes pequeñas y específicas de los datos dentro de esos grandes conjuntos. Así, se utiliza la minería de datos para descubrir piezas de información concreta (LEADA, 2015). La minería de datos implica el uso de diferentes tipos de paquetes de software para el análisis estadístico. En general, se refiere a las operaciones que implican sofisticadas operaciones de búsqueda de información que devuelven resultados específicos y concretos. BIG DATA Y COMPUTACIÓN EN LA NUBE Big Data es, en el sector de tecnologías de la información y la comunicación, una referencia a los sistemas que manipulan grandes conjuntos de datos (o datasets). Las dificultades más habituales en estos casos se centran en la captura, el almacenamiento, la búsqueda, la compartición, el análisis y la visualización de los datos. La computación en la nube, del inglés cloud computing, es un paradigma que permite ofrecer servicios de computación a través de Internet. BIG DATA Y MACHINE LEARNING Machine Learning es una disciplina científica que trata de que los sistemas informáticos aprendan automáticamente. Es decir, que los sistemas y los algoritmos que revisan los datos, sean capaces de identificar patrones complejos entre volúmenes enormes de información. En Big Data, las herramientas de análisis tradicionales no son las más adecuadas para capturar el valor total que se puede obtener. El volumen de datos es demasiado grande para un análisis integral tradicional; es demasiado grande para que un analista pueda probar todas las hipótesis
  17. 17. Informe Big Data en salud digital 18 y obtenga todo el potencial valor subyacente en los datos. En este contexto, el aprendizaje automático es ideal para aprovechar las oportunidades ocultas en Big Data. Machine Learning (junto a Big Data) obtiene más valor de las fuentes de datos, sobre todo si son de estructura heterogénea y de elevado volumen. Además, a diferencia de los análisis tradicionales, Machine Learning se nutre de conjuntos de datos en constantemente crecimiento. Cuantos más datos se introducen en un sistema de aprendizaje automático, más puede aprender el algoritmo y obtener resultados de mayor calidad. BIG DATA Y OPEN DATA Según OpenDataHandbook una iniciativa de Open knowledge Foundation con el objetivo de servir de guía universal para el desarrollo y promoción del Open Data: “los datos abiertos son datos que pueden ser utilizados, reutilizados y redistribuidos libremente por cualquier persona, y que se encuentran sujetos, cuando más, al requerimiento de atribución y de compartirse de la misma manera en que aparecen”. En este sentido, la diferencia entre Big Data y Open Data estriba en que el primero es un paradigma completo de recogida, almacenamiento y procesamiento de la información y el segundo se refiere esencialmente al carácter abierto de los datos. 3.1.5. INFRAESTRUCTURA EN BIG DATA Big data requiere un enfoque propio, que debe superar las prácticas habituales redundando en una mayor descentralización y flexibilidad de la arquitectura de datos para poder gestionar las plataformas de Big Data a gran escala y adaptarse a las nuevas demandas de infraestructura de red. Estos nuevos modelos de computación distribuida gestionan datos no estructurados y permiten desarrollar tareas muy intensivas de computación masiva mediante el análisis de grandes cantidades de datos en entornos distribuidos (Schneider, 2012). La relativa inmadurez del mercado y la naturaleza ‘open source’ de muchas de sus soluciones provoca una gran fragmentación de soluciones tecnológicas en Big data que suelen resolver sólo algunos aspectos concretos y específicos. Así, el abanico de soluciones tecnológicas entre las que elegir en el momento de implementar un proyecto de Big Data es amplísimo y no deja de crecer, lo cual puede suponer una barrera de entrada para muchas empresas y organismos públicos que carecen de profesionales especialistas en estas nuevas tecnologías. Ante esta situación, un buen asesoramiento será fundamental a la hora de definir un proyecto de Big Data y será necesario identificar las fuentes de datos de mayor valor (tanto internas como externas) y seleccionar las herramientas más adecuadas. LOS SISTEMAS DE GESTIÓN DE BASES DE DATOS El concepto sistema de gestión de base de datos es un término genérico que engloba una enorme variedad de herramientas que, en su mayoría, trabajan de forma diferente. Estas aplicaciones gestionan la agregación de la información contenida en las organizaciones. Como los datos pueden estructurarse en diferentes formas y tamaños, se han desarrollado múltiples sistemas de gestión de esta información, al mismo tiempo que se han desarrollado una gran variedad de aplicaciones para solventar las diferentes necesidades de programación.
  18. 18. Informe Big Data en salud digital 19 Así, los sistemas de gestión de bases de datos se basan en los diferentes modelos de bases de datos y en sus estructuras definidas. En este sentido, en las últimas décadas, la opción predominante han sido los sistemas de gestión de bases de datos relacionales. EL MODELO RELACIONAL Y EL MODELO NoSQL Los sistemas de bases de datos basados en el modelo relacional han acabado resultando una solución muy eficiente y fiable y están enormemente extendidos. Los sistemas relacionales requieren esquemas claramente definidos para poder trabajar con los datos. Estos formatos determinan cómo se organizan y utilizan los datos y se parecen a las tablas de doble entrada en filas y columnas, desde los cuales evolucionan. A pesar de ello, el modelo relacional tiene diferentes contingencias que limitan las capacidades que puede ofrecer. Así, recientemente, toda una serie de diferentes sistemas y aplicaciones llamadas bases de datos NoSLQ han empezado a ganar popularidad. Éstos eliminan muchas de las restricciones propias del modelo relacional y ofrecen nuevas maneras de gestionar los datos de manera eficiente, permitiendo un uso más libre y flexible. EL FRAMEWORK HADOOP Apache Hadoop es una de las herramientas más conocidas en Big Data. Es un framework de código libre para el almacenamiento y proceso de datos distribuido para grandes volúmenes de datos que puede funcionar en cualquier sistema genérico de hardware. Hadoop incluye una gran variedad de herramientas con utilidades concretas, algunas de las cuales son: tecnologías para el escalado eficiente del almacenamiento de datos (HDFS); herramientas para la gobernanza e integración de datos (Atlas, Falcon, Flume o Scoop); herramientas para la seguridad de datos (Knox o Ranger); o herramientas sobre gestión operativa del sistema (Ambari, Oozie o Zookeeper). De todas ellas, una de las más conocidas es MapReduce, paradigma de programación que permite la escalabilidad masiva a través de una gran cantidad de servidores en un clúster Hadoop con datos de escalado horizontal (Schneider, 2012). 3.1.6. TIPOS DE ANÁLISIS EN BIG DATA A continuación se presentan de forma resumida los tres principales tipos de análisis en Big Data:  Modelos predictivos: analizan los resultados anteriores para evaluar qué probabilidad tiene un individuo de mostrar un comportamiento específico en el futuro con el fin de mejorar la eficacia. Esta categoría también incluye modelos que buscan patrones discriminadores de datos para responder a las preguntas sobre el comportamiento del paciente, tales como la detección de fraudes. Los modelos de predicción a menudo realizan cálculos en tiempo real, durante las operaciones, por ejemplo, para evaluar un determinado riesgo u oportunidad, a fin de orientar una decisión adecuada.  Modelos descriptivos: describen las relaciones entre los datos para poder clasificar a los individuos en grupos. A diferencia de los modelos de predicción que se centran en predecir el comportamiento de un único individuo, los modelos descriptivos identifican diferentes
  19. 19. Informe Big Data en salud digital 20 relaciones entre individuos. Pero los modelos descriptivos no clasifican a los clientes según su probabilidad de tomar una acción en particular. Las herramientas de modelado descriptivo pueden ser utilizadas para desarrollar modelos simulando una gran cantidad de agentes individuales pudiendo predecir también acciones futuras.  Modelos de decisión: describen la relación entre todos los elementos de una decisión, incluidos los resultados de los modelos de predicción, la decisión a tomar y el plan de variables y valores que determinan la propia decisión, con la finalidad de predecir los resultados mediante el análisis de muchas variables. Estos modelos pueden ser también utilizados para diferentes procesos de optimización. 3.2. ASPECTOS ORGANIZATIVOS 3.2.1. NORMATIVA SOBRE BIG DATA Los miembros de la Unión Internacional de Telecomunicaciones (UIT) aprobaron, el 6 de noviembre de 2015, la primera norma de la organización sobre los grandes volúmenes de datos o Big Data. En esta norma internacional se detallan los requisitos, las capacidades y casos de utilización de Big Data en la nube. La Recomendación UIT-T Y.3600 "Grandes volúmenes de datos – requisitos y capacidades basados en la computación en la nube" (UIT, 2015), fue elaborada por el grupo de expertos del UIT-T encargado de los aspectos relacionados con la computación en la nube y redes móviles. En ella se describen el significado de Big Data y las características del ecosistema de Big Data desde la perspectiva de la normalización. La norma detalla cómo aprovechar los sistemas de computación en la nube para ofrecer servicios de Big Data y cómo ayudar a la industria para la gestión de grandes conjuntos de datos imposibles de transferir y analizar utilizando tecnologías tradicionales de gestión de datos. Por otro lado, en el mismo documento, la UIT señala los principales desafíos a los que Big Data debe dar respuesta:  La heterogeneidad de los datos y los datos incompletos: los datos procesados a partir de Big Data pueden pasar por alto algunos atributos o introducir “ruido estadístico” en la transmisión de los mismos datos. Incluso después de realizar una limpieza de datos y una corrección exhaustiva, es probable que permanezcan errores. Este reto puede ser en parte solventado durante el análisis de datos.  La escalabilidad de los datos: el constante y creciente volumen de datos es un desafío formidable para Big Data. Aunque en parte estas cuestiones han estado mitigadas por la gran y rápida evolución de los recursos de procesamiento y almacenamiento, hoy en día, los volúmenes de datos están creciendo más rápido que los recursos disponibles para su óptimo procesamiento y almacenamiento.  Velocidad y oportunidad: la velocidad de obtener información en un tiempo limitado que cumpla con los criterios especificados a priori en un sistema Big Data, es otro desafío que enfrenta el procesamiento de datos. Otros nuevos retos están relacionados con los tipos de criterios especificados y una necesidad de diseñar nuevas estructuras de indexación y de respuestas a las preguntas con plazos de respuesta muy ajustados.  Privacidad: los datos acerca de los individuos, tales como la información demográfica, las actividades de Internet, los patrones de comportamiento, las interacciones sociales o el uso de energía están siendo recogidos y analizados para diferentes propósitos.
  20. 20. Informe Big Data en salud digital 21 Estas tecnologías y servicios de Big Data se enfrentan al reto de proteger la identidad y los atributos sensibles de datos en todo el ciclo de su procesamiento, debiendo respetar las diferentes políticas de protección de datos. 3.2.2. INICIATIVAS DE FOMENTO DEL BIG DATA En julio de 2014, la Comisión presentó una nueva estrategia sobre Big Data, para apoyar y acelerar la transición hacia una economía basada en los datos en Europa. Se basa en la premisa de que una economía basada en datos estimulará la investigación y la innovación mientras conduce a más oportunidades de negocio. Para poder aprovechar estas oportunidades y competir a nivel mundial en la economía de datos, la UE tratará de apoyar las iniciativas de Big Data para mejorar la competitividad, la calidad de los servicios públicos y la vida de los ciudadanos. Para ello quiere:  Asegurarse de que el marco jurídico y las políticas son data-friendly.  Compartir, utilizar y desarrollar sus recursos públicos de datos.  Desarrollar las habilidades, las infraestructuras y tecnologías de apoyo al Big Data.  Acelerar la digitalización de la administración y los servicios públicos para aumentar su eficiencia.  Apoyar el I+D+i para superar cuellos de botella tecnológicos o legales. Estas iniciativas están alineadas con otras estrategias europeas relacionadas, como Open Data, computación en la nube o sobre computación de alto rendimiento (Comisión Europea, 2014h). 3.2.3. LOS PERFILES PROFESIONALES Big Data también representa un cambio sustancial por lo que respecta a los profesionales que deben llevarlo a cabo. Big Data requiere o demanda perfiles muy concretos y, por lo que parece ser, escasos, ya que, además de conocimientos técnicos específicos, deben tener la capacidad de observar lo que en el mundo anglosajón llaman big picture, es decir, ser capaces de observar las diferentes complejidades de los proyectos Big Data y su relación con las múltiples aristas que presentan los problemas en un entorno real de aplicación. Además, en el caso de la aplicación del Big Data al ámbito sociosanitario los profesionales precisan tener un amplio conocimiento del sector. Estos nuevos perfiles profesionales, llamados generalmente “data scientists” o científicos de datos, recogen, filtran, procesan y transforman la información en consejos, recomendaciones o conocimiento, para que se puedan tomar decisiones tanto en el ámbito clínico, como en el de investigación o gestión sanitaria. Este enfoque tan holístico o 360 de la problemática hace que, aunque los profesionales suelen venir de estudios universitarios relacionados estrechamente con ingenierías o ciencias, en el día a día de su actividad, son quizás más gestores que programadores y, por tanto, deben poseer capacidades suficientes de gestión. El papel del científico de datos es esencial desde el primer proceso relacionado con la selección de las herramientas. En primer lugar, porque deberá elegir entre las soluciones tecnológicas disponibles para resolver el problema planteado. Hasta ahora las soluciones de infraestructura en Big Data solían ser adhoc para cada una de las problemáticas a tratar. En segundo lugar, porque tendrá que dirigir o participar en la dirección, del proceso de resolución del problema.
  21. 21. Informe Big Data en salud digital 22 Estos profesionales son demandados por su capacidad de trabajar con herramientas tecnológicas específicas y se les valora especialmente por sus conocimientos sobre estadística y programación y por sus habilidades para construir modelos de datos y realizar las preguntas adecuadas. 3.3. FASES DE UN PROYECTO BIG DATA 3.3.1. LAS PREGUNTAS INICIALES En la era previa al Big Data, las infraestructuras de datos estaban diseñadas y organizadas en torno a un conjunto de preguntas previamente conocidas y estructuradas a priori. Ahora mismo, en la era del Big Data, las preguntas iniciales que dan salida a la generación de información son menos predecibles. Esta incertidumbre, respecto a las preguntas previas de la generación del conocimiento a partir de información, hace que las infraestructuras para el manejo de grandes volúmenes de datos se alejen de las aproximaciones tradicionales. Como la capacidad del Big Data es enorme desde el punto de vista exploratorio, la formulación de las preguntas iniciales de investigación se configura como un elemento clave para la obtención de conocimiento, pero, a su vez, implica un cambio de perspectiva en su realización. Así, mientras queda claro que sin la pregunta adecuada, los datos y el posterior procesamiento de la información apenas tienen utilidad, cabe añadir que Big Data permite explorar y ver la realidad de los datos haciendo que un buen análisis sobre los mismos acabe generando nuevas preguntas que deberán buscar respuesta. En este sentido, la fase inicial de un proyecto de Big Data parte de poder realizar las preguntas adecuadas. Lo importante es hacer las preguntas correctas y poseer los datos apropiados para responderlas. Sin estas condiciones el trabajo realizado sobre Big Data no generará el valor suficiente. 3.3.2. CREACIÓN DEL MODELO La fase siguiente a la definición de las preguntas iniciales de análisis se sustenta en la creación del modelo. Se definen las capacidades necesarias y sus funcionalidades para alinear la estructura de tecnología de la información disponible en la organización con las iniciativas que se deseen llevar a cabo con Big Data. Y, concretamente, será necesario: 1. Definir objetivos definitivos así como la estrategia para alcanzarlos. En esta primera fase de la creación del modelo, es imprescindible definir con precisión cuales son las metas que la organización desea alcanzar con el uso de Big Data, tanto desde la perspectiva holística que incluya al conjunto de la organización como aquellas más propias de algunos aspectos departamentales. Es también esencial que en la estrategia para alcanzarlos (roadmap) se tenga en cuenta que las necesidades deben ser alcanzables con los recursos disponibles en la organización. 2. En segundo lugar, la creación del modelo debe integrar un proceso completo para poder capturar, consolidar, gestionar y proteger la información necesaria. Esta información incluirá datos tanto estructurados como no estructurados y debe explicitar, de forma evidente, la disponibilidad de fuentes internas y externas de datos de que se dispone, así como la calidad
  22. 22. Informe Big Data en salud digital 23 y puntos débiles de las mismas. Evidentemente, es esencial conocer sobre todo qué datos no están disponibles para la organización. 3. Finalmente, deben identificarse los recursos humanos disponibles para llevar a cabo la implementación del modelo, teniendo en cuenta que son perfiles altamente especializados. Estas personas encargadas de llevar a buen puerto la obtención de datos, deben dominar la manipulación, procesamiento y almacenamiento de datos. 3.3.3. ELECCIÓN TECNOLÓGICA Una vez definido el modelo y la estrategia debe realizarse la elección tecnológica. En este caso, los responsables de su desarrollo, con especial relevancia por parte de los llamados científicos de datos, que serán los responsables de su explotación y análisis, deberán escoger entre el gran volumen de soluciones tecnológicas concretas existentes. De forma habitual, las diferentes soluciones tecnológicas de software, sean de extracción, procesamiento o visualización de información, están basadas en código libre. La razón para ello tiene que ver con dos aspectos principales. El primer aspecto, la “juventud” de la tecnología implica que ningún proveedor de estos programas haya conseguido copar el mercado. Pero, el otro aspecto, la propia naturaleza adhoc de los proyectos Big Data facilita que, consecuentemente, también las herramientas se adapten a esta circunstancia. Las nuevas soluciones dan respuesta continuamente a nuevos problemas concretos que aparecen en relación a esta cuestión. Finalmente, añadir que encontrar las soluciones de hardware necesarias, tanto por lo que respecta al almacenamiento y procesamiento de la información, como a las redes en las que el sistema completo debe sustentarse, es un punto crítico en esta fase del proyecto. 3.3.4. IMPLEMENTACIÓN DEL MODELO Una vez realizada la elección tecnológica inicial se llevará a cabo la implementación del modelo. Esta implementación está, de forma general, estructurada en las siguientes fases:  Obtención y almacenamiento de los datos: la obtención de datos debe tener en cuenta las fuentes de los mismos en función de su origen. Por un lado, hay fuentes principales tanto online basadas en APIs 3 que proporcionan clientes o servicios y que se van incorporando en "tiempo real" a los sistemas de almacenamiento. Por otro, fuentes offline (bases de datos relacionales o sistemas de ficheros muy grandes).  Preparación y transformación de los datos: esta fase de la implementación de la solución Big Data es una de las que más tiempo consume en toda la operación ya que es crítica para el éxito del sistema. En este sentido, son claves tanto la calidad de los mismos, como las cuestiones relativas a los diferentes problemas de interoperabilidad4 del sistema. 3 Una API (Interfaz de Programación de Aplicaciones) es un conjunto de métodos y procedimientos que ofrece una biblioteca de programación para ser utilizada por otro software como capa de abstracción. 4 La interoperabilidad es la capacidad de los sistemas de información y de los procedimientos a los que éstos dan soporte, de compartir datos y posibilitar el intercambio de información y conocimiento entre ellos.
  23. 23. Informe Big Data en salud digital 24  Procesamiento: en esta fase se construyen los modelos analíticos para su explotación. Normalmente se utilizan casi todas las herramientas habituales de análisis de datos incluyendo, especialmente, aquellas técnicas procedente de la minería de datos como árboles de clasificación o redes neuronales.  Visualización: las herramientas de visualización deben poder resumir de forma inteligible la información de los repositorios para ayudar al investigador en la toma de decisiones.
  24. 24. Informe Big Data en salud digital 25 4. APLICACIÓN DEL BIG DATA EN SALUD El sistema sanitario, y en concreto los hospitales, están teniendo en los últimos años una creciente sofisticación de sus sistemas de información y recopilación de datos. Estos datos muchas veces no son almacenados para su posterior reutilización, sino que son usados para un análisis coyuntural asociado a una necesidad y momento específico. En este contexto, las aplicaciones de soluciones Big Data en salud, van más allá del volumen, la variedad y la velocidad como características básicas, ya que incorporan aspectos cruciales como la veracidad, permitiendo posteriormente una reutilización mediante el agregado de la nueva información al histórico de datos. Estas nuevas formas de recogida de información y de agregación de la misma, así como las tecnologías y técnicas asociadas, pueden mejorar la prestación de asistencia sanitaria, tanto a nivel individual como para conjuntos poblacionales de pacientes. Pero más allá de los aspectos técnicos, una cultura organizacional de calidad es uno de los factores clave para conseguir un sistema de información de salud eficaz. En este sentido, la consolidación del Big Data en el campo de la salud partirá de la síntesis de la información ‘antigua’ y ‘nueva’ incorporando tanto las provenientes de las redes sociales como en el futuro cercano aquella derivada del Internet de las Cosas. Optimizar esta información se puede traducir en un mayor conocimiento del paciente gracias a la síntesis de la información existente de historias médicas, registros electrónicos de salud, registros personales de salud y análisis e imágenes clínicos. Asimismo, se genera nueva información para conseguir una mejor detección de efectos secundarios de los fármacos, mejores y más adecuados tratamientos y con mayor rapidez, así como avanzar en la medicina personalizada y en la medicina preventiva. 4.1. LA EVIDENCIA DEL MUNDO REAL Uno de los conceptos que cobra más importancia en la relación entre salud y el Big Data es lo que se denomina en inglés “real world data” y que se refiere, concretamente, a que, a diferencia de otros desarrollos anteriores de análisis de datos, Big Data se nutre de información obtenida en condiciones reales, es decir no solamente aquella información recogida en condiciones de laboratorio (Herland, Khoshgoftaar, Wald, 2015). Esta porción del Big Data cobra especial importancia en la sanidad porque abarca también la información relacionada con la historia clínica electrónica, los sistemas de prescripciones médicas, de almacenamiento y comunicación de imágenes y una larga serie de bases de datos construidas con finalidades clínicas. Un buen ejemplo de esta aplicación es el programa Mini-Sentinel 5 de la Agencia de Medicamentos de Estados Unidos. Este programa ha permitido detectar mediante la aplicación de algoritmos a grandes bases de datos con información, a veces no estructurada y procedente del mundo real, nuevas interacciones, efectos adversos de medicamentos y otros problemas de seguridad que han llevado finalmente a la retirada de fármacos o la modificación de sus indicaciones. 5 http://www.mini-sentinel.org/
  25. 25. Informe Big Data en salud digital 26 De esta manera, se observa de entrada un elevado consenso en la comunidad de profesionales sanitarios expertos en los aspectos tecnológicos de la salud, respecto al gran potencial que tiene Big Data si se aplica de forma extensa en salud. Así, los profesionales sanitarios cada vez entienden mejor que Big Data puede suponer un cambio de paradigma en la práctica de la medicina y las empresas farmacéuticas quieren utilizarlo para diseñar medicamentos cada vez más efectivos y con menor coste de investigación. Por su parte, las administraciones quieren comprobar la eficacia de los nuevos medicamentos gracias a la información proveniente de la información obtenida en el mundo real. Este nuevo concepto no sustituye sino que complementa los ensayos clínicos controlados realizados por los laboratorios para determinar la seguridad y eficacia de un nuevo fármaco, en un entorno sin restricciones y considerando la amplia casuística de pacientes de una patología y su comportamiento real. 4.2. FUENTES DE INFORMACIÓN EN BIG DATA EN SALUD De forma aproximada, se podría afirmar que Big Data en salud se alimenta de las siguientes fuentes de información: 1. Web y datos de redes sociales: recogida de datos de redes sociales. También incluye sitios web, o diversas aplicaciones de teléfonos inteligentes, etc. 2. Los datos de máquina a máquina: las lecturas de los sensores, medidores y otros dispositivos. 3. Grandes transacciones de datos: reclamaciones de atención médica y otros registros de facturación disponibles en formatos semiestructurados y no estructurados. 4. Los datos biométricos: huellas dactilares, datos derivados de análisis genético, escáner de retina, resultados de rayos X y otras imágenes médicas, la presión arterial, lecturas de oximetría de pulso y otros tipos similares de datos. 5. Otros datos generados por humanos: los datos no estructurados y semiestructurados, tales como registros médicos electrónicos (EMR), notas de los médicos, correos electrónicos y documentos en papel. 4.3. LA CUESTIÓN DE LA INTEROPERABILIDAD El crecimiento exponencial del conocimiento médico requiere un apoyo del proceso sanitario, del control y de las alertas cada vez mayor, así como un mayor apoyo de la decisión clínica. Los datos de proceso y de pacientes, el conocimiento médico y la experiencia clínica necesitan ser comprensibles para los ordenadores, permitiéndoles así interactuar entre ellos y con los profesionales de la salud. Para ello es necesario construir una infoestructura integral totalmente interoperable. La interoperabilidad es la capacidad que tienen dos o más sistemas de información y los procedimientos a los que estas dan soporte, para compartir datos, posibilitar su intercambio entre ellos y dar servicio eficiente. En el contexto europeo, donde las características lingüísticas y culturales son altamente dispares, esta cuestión pasa a ser especialmente sensible. Así, la red de la sanidad electrónica es el principal organismo estratégico y de gobernanza a escala de la UE a fin de trabajar de cara
  26. 26. Informe Big Data en salud digital 27 a la interoperabilidad transfronteriza de los servicios de salud electrónica (Parlamento Europeo y Consejo de la Unión Europea. Diario oficial de la Unión Europea, 2011). La red tiene la tarea de elaborar directrices sobre la sanidad electrónica, tal como se prevé en la misma Directiva, así como sobre un marco de interoperabilidad transfronteriza de esos servicios. La Comisión Europea reconoce la necesidad de un mejor marco de interoperabilidad en salud digital basado en la planificación general de la salud electrónica y en el Marco Europeo de Interoperabilidad General (Comisión Europea. eHealth Stakeholder Group, 2014) y establece los siguientes niveles de interoperabilidad: 1. Interoperabilidad jurídica: se refiere a superación de las divergencias en las cuestiones regulatorias por el contenido o uso de los diferentes registros electrónicos de salud entre las legislaciones de diferentes países en el uso transfronterizo de servicios de eHealth. 2. Interoperabilidad organizativa: se refiere a la definición de los objetivos y procesos de negocio y a la participación de las diferentes organizaciones y sus estructuras y procesos internos particulares. Con esto, la interoperabilidad organizativa pretende hacer los servicios accesibles, fácilmente identificables y orientados a las necesidades del usuario. 3. Interoperabilidad sintáctica y semántica: la interoperabilidad sintáctica se refiere al formato de los datos y la interoperabilidad semántica a asegurar el significado preciso de los datos y que sean comprensibles para cualquier otro sistema de información. La interoperabilidad semántica permite a los sistemas combinar la información recibida con otras fuentes de información y procesarla de manera que tenga un mismo significado. Por lo tanto, la interoperabilidad semántica es un requisito previo para la prestación multilingüe de servicios al usuario. 4. Interoperabilidad técnica: se refiere a los aspectos técnicos relacionados con la conexión de diferentes equipos informáticos y telecomunicaciones. Incluye aspectos como las interfaces abiertas, los servicios de interconexión de datos, la integración de datos y el middleware, la presentación e intercambio de datos y los servicios de accesibilidad y seguridad. 4.4. BIG DATA Y mHEALTH La tecnología móvil se está extendiendo a todos los aspectos de los sistemas de salud a nivel mundial. Según estimaciones, en 2014 existían casi 7.000 millones de líneas móviles en el mundo, teniendo acceso el 95% de la población mundial a cobertura telefónica móvil (UIT, 2015). Eso implica que la capacidad transformadora y las posibilidades de efectuar acciones de salud pública y asistencia sanitaria móvil son enormes. El término mHealth se refiere a la salud digital móvil, es decir al uso de aplicaciones de salud a través de dispositivos móviles. En este sentido, cualquiera de las aplicaciones de salud digital es susceptible de ser utilizada mediante un dispositivo móvil. De esta manera, son las propias características del uso de dispositivos móviles las que pueden suponer un cambio radical en el modo en que se obtiene, almacena, procesa y transmite la información médica, permitiendo tanto la puesta en práctica de modelos de atención hasta ahora inexistentes, como las muchas oportunidades de optimización que presenta en aquellos preexistentes. De la misma manera, el uso de mHealth permite una recogida masiva de datos que abre las puertas tanto a una mayor calidad y cantidad de información que resulta básica para desarrollar modelos más eficientes y efectivos de medicina basada en la evidencia, como al análisis masivo de datos mediante tecnologías Big Data.
  27. 27. Informe Big Data en salud digital 28 Finalmente y desde la perspectiva del usuario, el uso de mHealth amplía y facilita la forma en que los individuos participan en la gestión de su propia salud favoreciendo un mayor empoderamiento del ciudadano sobre esta cuestión. Esta tecnología puede reducir los costes asociados con la prestación de cuidados sanitarios, manteniendo y mejorando la calidad de la atención y llegará a pacientes en los que el acceso a la asistencia sanitaria ha sido hasta ahora limitado. Aun así, existen diferencias entre un enfoque básico de mHealth y uno de Big Data. Por ejemplo, los proyectos mHealth tienen bajas barreras de entrada y las recompensas tangibles son a menudo muy limitadas. En contraste, el enfoque de los proyectos Big Data exige inherentemente mayores habilidades técnicas, un equipo más especializado, mayor cuidado con los estándares de interoperabilidad y mayores exigencias tanto con la recopilación de datos como con los sistemas de análisis y supervisión. 4.5. EL EFECTO TRANSFORMADOR DEL BIG DATA EN EL ÁMBITO DE LA SALUD Existe el consenso en salud digital sobre el gran efecto transformador que Big Data supone para la prestación de servicios de salud. De forma resumida, algunos de los efectos más relevantes pueden ser los siguientes: • Transformación de datos en conocimiento: Big Data permite el análisis no causal de grandes volúmenes de datos que puede estructurar nuevo conocimiento, especialmente en el área de la genómica. • Mejora del aprovechamiento de la información: en Big Data, la información no se recoge con una finalidad inmediata. La información, por lo general, es muy sencilla de recoger, por lo tanto, la verdadera transformación consiste en qué hacer con esa información para resolver cuestiones en un futuro. • Salto en la investigación clínica: la propia lógica descentralizada y distribuida de los sistemas de Big Data y la creación de mayores repositorios permite una mayor capacidad de análisis. Esto se debe a los nuevos procesos de colaboración científica. Nuevos instrumentos para los profesionales de la salud: los profesionales médicos tendrán acceso a nuevo conocimiento sobre patologías, tratamientos y fármacos que redundará en una mejor y más precisa provisión de servicios, así como en una mayor preparación para cuestiones epidemiológicas. • Promoción del autocuidado de la salud: la información proveniente de los biosensores favorecerá una ciudadanía más empoderada en el cuidado de su salud.
  28. 28. Informe Big Data en salud digital 29 4.6. CAMPOS DE APLICACIÓN DEL BIG DATA EN SALUD En la actualidad, se están desarrollando utilidades del Big Data en múltiples ámbitos de la salud. Así, aunque la historia clínica electrónica y el resto de registros electrónicos de salud digital que se están extendiendo y universalizando en los últimos años son la base necesaria para la ordenación de los datos del paciente, es insuficiente para obtener todo su potencial sin contar con la aplicación de la capacidad de análisis y obtención de conocimiento derivado del uso del Big Data. A continuación, se presentan algunos de los campos de aplicación más relevantes, a pesar de que en la práctica real, casi todos ellos están profundamente relacionados. 4.6.1. GENÓMICA Un gran campo de aplicación del Big Data en salud está relacionado con la bioinformática que nos ha llevado a la llamada era ómica, en relación a la genómica o a la proteómica que está suponiendo un enorme avance de la biomedicina. El Big Data aplicado a la genómica trata de encontrar la manera de capturar, almacenar, procesar e interpretar toda esa información biológica codificada en el genoma humano. En este sentido, mediante potentes sistemas de análisis y la cada vez más presente estandarización de los procesos de secuenciación se obtienen mejores resultados en la investigación y secuenciación del genoma. La combinación de la genómica y el Big Data apunta a que puede convertirse en una nueva revolución de la salud. El Big Data aplicado a datos médicos y al despliegue de la medicina personalizada y la genómica, puede suponer una nueva revolución en la investigación clínica y en la aplicación de las nuevas tendencias de diagnóstico y tratamiento. En este sentido, la reducción de costes en la secuenciación de genomas en la última década es clave para comprender la potencialidad de la información susceptible de ser recogida. Cabe recordar que, mientras el proyecto que consiguió secuenciar y analizar el primer genoma humano tardó 10 años y tuvo un coste cercano a los 3.000 millones de dólares (Estados Unidos. Department of Energy. Human Genome Project. 1990), este coste se ha reducido drásticamente y ahora se pueda secuenciar y analizar un genoma completo en pocas horas por menos de 1.000 dólares. Estos cambios pueden ayudar a mejorar la toma de decisiones clínicas. Por ejemplo, mediante la aplicación de técnicas de Big Data se puede predecir con un mayor nivel de certeza si un individuo es más propenso o no a desarrollar una patología en función de sus factores genéticos, permitiendo anticiparse al desarrollo de la misma. Por tanto, se tendería al nuevo paradigma de medicina preventiva, seleccionando, mediante la fármaco-genética, las medicaciones más eficaces para los pacientes. De esta manera, la genómica personal también aparece como un facilitador clave para desarrollar la llamada medicina predictiva, donde el perfil genético de un paciente puede ser utilizado para determinar un tratamiento adecuado antes de que se desarrolle la enfermedad. Por ejemplo, se calcula que, al ritmo actual, la cantidad de datos de genómica producidos diariamente se duplicará cada 7 meses. En 2025, esa cifra oscilará entre 2 y 40 exabytes por año, estima el equipo, en función de la tasa de duplicación y, en ese mismo año, se espera que 1.000 millones de personas tengan sus genomas completos secuenciados (Schatz, 2015). En el mismo estudio, Schatz explica las particulares especificidades en forma de retos que debe afrontar el Big Data aplicado a la genómica. Se señalan algunos aspectos principales relacionados con la adquisición, el almacenamiento, la distribución y/o el análisis de datos.
  29. 29. Informe Big Data en salud digital 30 Concretamente, y de forma muy resumida, se menciona que algunos aspectos son especialmente complejos y representan retos importantes. Por ejemplo, los datos biológicos, que son la materia prima de la genómica, están muy distribuidos. A diferencia de otro tipo de datos relacionados con la salud que tienen un formato de acuerdo con unos protocolos estándar, los datos genómicos se compilan en muchos formatos diferentes, con los consiguientes problemas de interoperabilidad asociados a su interpretación. 4.6.2. INVESTIGACIÓN CLÍNICA La aplicación del Big Data al ámbito de la salud promete grandes efectos para los diferentes agentes implicados en la investigación clínica. Así, los profesionales sanitarios pueden llegar a ofrecer diagnósticos más ajustados y de forma que estén mejor respaldados desde una perspectiva científica. Por otro lado, los laboratorios de análisis clínicos pueden llegar a prestar sus servicios de forma mucho más rápida. Por su parte, los laboratorios farmacéuticos pueden ver disminuir considerablemente el infradiagnóstico de todas aquellas patologías para las que dispone de opciones terapéuticas comercializadas. Pero sobre todo, el principal beneficiado de la aplicación del Big Data en salud y, concretamente, en la investigación clínica, es precisamente el paciente, que podrá obtener diagnósticos más rápidos y precisos. En este sentido, acceder a información de mayor calidad puede ser clave. Dar uso a estos datos podría ayudar a salvar vidas, la auténtica y verdadera finalidad en la prestación de servicios sanitarios. En resumen, los principales beneficios de la aplicación del Big Data a la investigación clínica son:  Mayor precisión y rapidez a la hora de determinar las causas de las enfermedades y establecer mejores soluciones.  Ofrecer una mayor calidad de la documentación científica.  Conseguir una disminución del infradiagnóstico de aquellas patologías para las que la industria farmacéutica dispone de opciones terapéuticas comercializadas. 4.6.3. EPIDEMIOLOGÍA Otra área importante de la aplicación de Big Data en la asistencia sanitaria es la lucha contra las epidemias. Por ejemplo, para predecir la propagación del virus Ébola en África, los profesionales sanitarios han estado utilizando datos de geolocalización de los teléfonos móviles de la población para realizar un mejor seguimiento de sus movimientos y, por tanto, definir en mayor medida, las áreas para el establecimiento de los centros de tratamiento contra la enfermedad o bien poner en práctica las necesarias restricciones de movimiento de las poblaciones en caso de que éstas fueran necesarias. Así, los profesionales sanitarios pueden utilizar la analítica de Big Data en tiempo real para saber dónde se está extendiendo un virus y a qué ritmo, adaptando la respuesta y garantizando el stock de vacunas. También cabe puntualizar que los estudios poblacionales a gran escala suelen tener costes asociados muy elevados. En este sentido, la aplicación de soluciones Big Data en epidemiología pueden ayudar a contener estos costes gracias a diversos factores:
  30. 30. Informe Big Data en salud digital 31 • Dirección científica: la capacidad del uso de Big Data en aspectos epidemiológicos puede conllevar una transformación de la práctica en esta cuestión, al mismo tiempo que se amplía el alcance de la epidemiología más allá del descubrimiento inicial para incluir más y mejor evaluación e implementación. • La maximización del potencial de investigación de las cohortes existentes: ampliar los estudios de cohorte durante toda la vida incorporando múltiples resultados de salud a los mismos. • La formación y el desarrollo del personal: Big Data en epidemiología también puede conllevar una mayor capacitación de los epidemiólogos del futuro con un creciente énfasis en la colaboración, en el análisis multinivel y la integración de conocimientos. • La integración de la epidemiología de observación y la intervención: ayudar a fomentar la integración de los estudios epidemiológicos observacionales con diferentes ensayos de intervención. 4.6.4. MONITORIZACIÓN Y SEGUIMIENTO DE ENFERMOS CRÓNICOS En 2014, se realizó una encuesta a 10.730 personas6 en 10 países (Australia, Brasil, Canadá, EEUU, España, Italia, Noruega, Japón, Singapur y el Reino Unido) preguntando por sus percepciones en relación al uso de la tecnología para gestionar su salud. El estudio concluyó que la mayoría de las personas mayores de 65 años con conocimientos tecnológicos suficientes preferían acceder a servicios sanitarios desde su casa mediante el uso de la tecnología y, al mismo tiempo, se mostraban preocupados porque la tecnología actual no les permitía cumplir ese deseo (Accenture, 2015). Así, el estudio mostró que las personas mayores que mencionan una mayor cercanía a los aspectos tecnológicos son más propensos a gestionar de forma proactiva su propia salud. Por ejemplo, la mitad de las personas mayores de 65 años con suficiente conocimiento tecnológico monitorizan activamente su colesterol, proporción que se reduce al 31% en aquellos que no valoran los aspectos tecnológicos. En este sentido, los resultados del estudio indican que las personas mayores, precisamente aquellas en donde existe una mayor prevalencia de las patologías crónicas, están muy interesadas en acceder a una serie de aplicaciones de tecnología digital para poder administrar mejor su salud, incluyendo sensores de todo tipo que faciliten la transmisión y recepción de datos de los pacientes, ayudando a los cuidados médicos tanto presenciales como en el propio domicilio del enfermo. Las tecnologías susceptibles de ser utilizadas con Big Data más relevantes para este sector poblacional son:  Herramientas de autocuidado: más de dos de cada tres personas mayores prefieren utilizar la tecnología de autocuidado para manejar de forma independiente su salud. 6 https://www.accenture.com/_acnmedia/Accenture/Conversion-Assets/DotCom/Documents/Local/es-es/PDF_5/Accenture- El-Acceso-A-La-Historia-Clinica-Electronica.pdf
  31. 31. Informe Big Data en salud digital 32  Wearables: más de tres de cada cinco personas mayores están dispuestas a llevar un dispositivo de vigilancia de la salud para rastrear los signos vitales, como por ejemplo la frecuencia cardíaca o la presión arterial.  Gestión de los registros personales de salud: la encuesta muestra que una cuarta parte de las personas mayores utilizan regularmente los registros de salud electrónicos para la gestión de su propia salud. Asimismo, las proyecciones de Accenture sugieren que esta proporción puede crecer hasta un 42% en los próximos cinco años, a medida que aumentan las herramientas disponibles para los pacientes. 4.6.5. OPERATIVA CLÍNICA La aplicación del Big Data en el ámbito de la salud significa que mucha más información procedente de distintas fuentes de información podrá ser recogida, combinada y analizada de forma automática. Esto incluye también los aspectos de operativa clínica. Se puede definir la operativa clínica como el conjunto de decisiones estratégicas, tácticas y operativas sobre la planificación, gestión de los recursos disponibles y/o gestión de departamentos con la finalidad de optimizar la calidad y la eficiencia de la atención sanitaria. Las organizaciones sanitarias se enfrentan a nuevos modelos en los que es altamente probable que el análisis de datos clínicos y, concretamente, de operativa clínica, juegue un papel fundamental a la hora de prestar asistencia a los pacientes. En este sentido, los centros sanitarios necesitan tener información de calidad sobre la demanda de servicios así como tener conocimiento de la disposición y calidad de los servicios que se ofrecen y, evidentemente, los costes asociados a todo ello. Es decir, es imprescindible discriminar y escoger las maneras de optimizar sus ingresos y sus costes para finalmente conseguir aumentar la calidad de la asistencia. De esta manera, se puede conseguir una operativa clínica más efectiva y eficaz, proporcionando información en tiempo real a los técnicos, enfermeras y médicos, para mejorar el triaje; prevenir infecciones; realizar análisis predictivos para identificar a los pacientes con mayor riesgo de reingreso hospitalario o errores de prescripción, diagnóstico o tratamiento. Esto incluye la incorporación de información, basada en datos, tanto de calidad operativa -con variables como tiempos de espera o de admisión-, así como de eficiencia operativa que contenga aspectos como los tiempos de estancia media o los costes asociados a materiales y medicamentos. Un análisis pormenorizado de toda esta información redundará en una mejor gestión de centros sanitarios y. consecuentemente en una mejor distribución del material sanitario y medicamentos. En este aspecto, Big Data junto a herramientas concretas de análisis de datos, tienen diversas aplicaciones orientadas a la gestión:  Mejora operativa: para permitir a los gestores de operaciones enfocarse en objetivos específicos de mejora operativa y reducción de gastos.  Gestión financiera: combinan fuentes de datos financieros con información de facturación, reclamaciones, información clínica, de satisfacción de pacientes o información prospectiva asociada a ingresos.  Planificación de recursos: previsión detallada de demanda de servicios y recursos necesarios para desarrollar de forma más eficiente la planificación de los mismos.
  32. 32. Informe Big Data en salud digital 33  Inteligencia de procesos clínicos y operativos: la gestión efectiva de los procesos asistenciales requiere un entendimiento de la calidad y eficiencia con la que dichos procesos se están ejecutando. Los gestores pueden analizar las fuentes de ineficiencia o malgasto de recursos. Por ejemplo, los gestores de los hospitales y los propios pacientes podrían verse favorecidos si los proveedores de servicios de salud tuvieran un conocimiento en tiempo real del flujo que siguen los pacientes en las emergencias o en las UCIs. En general, la aplicación de los aspectos analíticos derivada del Big Data en salud digital ofrece diversos beneficios a los responsables de gestión de los centros sanitarios:  Visión global del estado de la organización a través de cuadros de mando integrales.  Seguimiento del cumplimiento de los objetivos estratégicos de la organización a través de indicadores y/o alertas.  Repositorio único de datos, independientemente de los sistemas de información.  Acceso directo a los datos sin necesidad de peticiones de informes al departamento de tecnología.  Posibilidad de benchmarking7 con otros centros de condiciones similares. 4.6.6. FARMACOLOGÍA En los ensayos clínicos aleatorizados (ECA), la clave para generar la evidencia científica de la eficacia y la seguridad de un medicamento pasa por la única vía de registrar primero y prescribir después, con garantías, un determinado principio activo. Aun así, los ECA son capaces de demostrar que un medicamento puede solucionar un determinado problema de salud, pero no son capaces de abordar la amplia casuística que existe en relación a la realidad de los pacientes reales y los múltiples factores que disminuyen significativamente el número de personas para las que el medicamento es eficaz. De acuerdo con esto, la capacidad de Big Data de complementar esta información resultante de los ECA incorporando la información proveniente del mundo real puede tener un gran efecto transformador en la manera en cómo se pueden registrar y prescribir los fármacos. Al desarrollar nuevas maneras de analizar la información de un elevado número de pacientes que son tratados con un medicamento en estudio, fuera del ensayo concreto y aislado en un entorno de laboratorio, se puede evaluar mejor la eficiencia de un determinado principio activo al añadir también toda una serie de variables recogidas en entorno real. Y no sólo la eficiencia concreta del fármaco, sino también su aplicabilidad a un mayor número de pacientes. Otra de las posibilidades que permite Big Data en el ámbito de la farmacología es la de conseguir un mejor ajuste del precio de los nuevos tratamientos, combinando no sólo la eficacia comprobada en los ECA, sino también la efectividad contrastada en el entorno real. También puede evaluar el uso de los productos actuales en el mercado e identificar los usos no deseados 7 Por benchmarking se entiende el proceso de evaluar y comparar productos, servicios o procesos de otras organizaciones de referencia.

×