La Unidad de Análisis de Datos (UAD) del Instituto de Investigación Sanitaria del Hospital de la Princesa (IIS-IP) tiene como fin brindar a los investigadores, tanto básicos como clínicos, apoyo, asesoramiento y colaboración activa en el análisis numérico y visualización de datos provenientes de las bio-áreas.
Pretende actuar como “una primera consulta” y asesoramiento en muchos de los temas, además de ser un sólido apoyo en las áreas en las que tenemos una mayor y probada experiencia. Debido al alto grado de informatización existente en todo el equipamiento médico como por ejemplo historias clínicas, registros a través de monitores temporales externos, internos o portátiles, secuenciadores, etc., es necesario el empleo de herramientas y metodología especialmente diseñadas para el tratamientos de las cada vez mayores cantidades de datos.
Por todo ello la UAD es clave para el desarrollo de los proyectos de investigación de nuestro centro, en muchos casos proyectos multidisciplinares, multicéntricos, nacionales o internacionales.
Actualmente la Unidad cuenta estaciones de trabajo aptas para el calculo numérico intensivo con altas prestaciones (un servidor Hewlett Packard Z600 y una estación de trabajo con 10 núcleos, 128GB de memoria RAM y tarjeta grafica NVIDIA GTX 1080 Ti de 11GB, apta para cálculo basado en GPU).
La Unidad posee instalaciones de almacenamiento hasta 80 TB lo que la hace especialmente apta para el procesamientos de grandes cantidades de datos bioinformáticos, especialmente los obtenidos en secuenciadores de próxima generación (NGS).
Desarrollo de Escalas de Riesgo:
Big Data e inteligencia Artificial en Cardiología:
Monitorización no invasiva de la presión intracraneal
Epilepsia
Epigenetics
miRNAs
Análisis de series temporales de registros extracelulares de multielectrodos
Análisis y clasificación de imágenes celulares usando métodos de multi-fractalidad
Modelos biofísicos
Desarrollo de métodos de análisis de series temporales basadas en la teoría de caos
PERSONAL IISHUP | PERSONAL EXTERNO | |
Consultas sin análisis numérico | Gratuito | 30 €/hora |
Consultas con análisis numérico | 21€/hora | 50€/hora |
Asesoría proyectos (con análisis numérico y/o elaboración informes) | 27 €/hora | 70 €/hora |
Formación/Cursos (R, Linux, Machine Learning) | 50 €/hora | 80 €/hora |
Desarrollo de scripts | 30 €/hora | 70 €/hora |
Uso de recursos informáticos (estación de trabajo, software) | 100 €/año | 400 €/año |
La Unidad de análisis de Datos del IIS del Hospital de la Princesa ha desarrollado un modelo de análisis epidemiológico compartimental que permite estudiar la evolución de los distintos estados de la población de la comunidad de Madrid ante varios escenarios. El método tiene en cuenta a la población general dividida en los siguientes compartimientos:
No se ha tenido en cuenta un compartimiento para Expuestos, esto es, contagiados asintomáticos que no transmiten la enfermedad, ya que en el caso de infecciones por SARS-CoV-2 es muy probable que el pico de “contagiosidad” de los infectados se encuentra antes de que comiencen los síntomas [1]. Por lo tanto hemos considerado que todos los contagiados son contagiosos.
Debido a estos compartimentos, hemos llamado al modelo SIHCMR. además, el modelo permite estudiar la dinámica de interacción entre los compartimientos en distintas poblaciones, las cuales no se encuentra aisladas, sino que, por el contrario, pueden intercambiar personas en algunos de los estados S, I y R.
El modelo ha sido desarrollado en R sobre la base del paquete R SimInf [2].
El siguiente grafico muestras posibles “transiciones” que pueden aparecer a lo largo de la evolución de contagio en una población determinada.
[1] Temporal dynamics in viral shedding and transmissibility of COVID-19. (2020) Nature medicine, 26(5), 672-675.
[2] Journal of Statistical Software November 2019, Volume 91, Issue 12. doi: 10.18637/jss.v091.i12
Puesto que el modelo permite estudiar tanto las transiciones entre compartimientos como así también el flujo de personas, transmisoras de la enfermedad entre distintas regiones, un esquema mas completo del modelo es el que se muestra en la siguiente Figura, en donde el flujo de personas que pueden estar en los estados S, I o R pueden moverse entre municipios.
De acuerdo a lo anterior por tanto es posible estudiar diversas situaciones a las cuales puede enfrentarse la Comunidad de Madrid y de esta forma evaluar la mejor estrategia no farmacológica a implementar, de tal forma que el costo social y sanitario sea el menor posible.
A modo de ejemplo se muestran algunos casos de “prueba”
Ejemplo 1: Inicio de la epidemia de COVID-19 en Madrid, sin cuarentena. 5 casos iniciales
Parámetros
Datos modelo COVID-19:
β (tasa de transmisión)= 0.14
γ (tasa de recuperación)=0.05
Inicialmente sin Hospitalizado, ni Cuarentena ni Muertos, esto es, Modelo SIR con transferencias de personas entre Municipios
Datos Madrid: Poblaciones de los distintos municipios de la Comunidad de Madrid
Flujo de personas: 5% de poblaciones cercanas se desplazan (ida y vuelta en el día) entre poblaciones de mas de 30.000 habitantes
En esta figura se muestra la evolución de los compartimentos para el caso de una evolución “libre” sin que exista ninguna intervención como cuarentena y/o distanciamiento, ni muertos ni hospitalizados
Se muestra la evolución para los 9 municipios de Madrid de mas de 30.000 habitantes.
En todos los casos existe un movimiento de personas entran/salen de cada municipio con los vecinos, de un 5%.
El comienzo de la infección es en Madrid con 5 casos. La línea punteada marca el momento del máximo de infecciones en Madrid ciudad.
Se ve que en todos los municipios grandes, salvo en Alcobendas, el pico de infecciones se encuentra tanto antes como después del de Madrid.
Ejemplo 2: Inicio de la epidemia de COVID-19 en Madrid, con 150 días de cuarentena. 5 casos iniciales
Movilidad en la Comunidad de Madrid
El Instituto Nacional de Estadísticas (INE) ha hecho público los datos de movilidad de España, tomados del 80% de los teléfonos móviles de los tres principales operadores de teléfono móvil (Orange, Telefónica, Vodafone). Esto permite estudiar como es el flujo de personas entre las distintas localidades. Para su estudio, el país está dividido en “celdas” y el tránsito de las personas se cuantifican de acuerdo con el pasaje de las señales de los móviles de unas celdas a otras. El INE ha hecho publico estos datos entre las distintas celdas de España en el periodo de “estado de alarma”, del 15 de marzo al 20 de junio de 2020 con datos (casi) diarios. Estos datos muestran tanto el flujo de personas “salientes” de una celda como las “entrantes” en el mismo día. Esto permite por lo tanto estudiar como el flujo de personas afecta a la propagación de la epidemia. Además, ha publicado como referencia, un promedio de la movilidad en España en una semana típica de noviembre de 2019.
En nuestro modelo hemos seleccionado las celdas correspondientes a la Comunidad de Madrid, 293 y estudiado el flujo de personas entrantes/salientes de cada una de las celdas durante el estado de alarma.
Con el objeto de introducir la movilidad de las personas en el modelo, y para contar con datos de transito en tiempos normales, hemos generado, a partir de los datos de noviembre de 2019, 500 “días” mas, generando valores subrogados (resampleados) a partir de los datos originales. Esto no permite estudiar la evolución de la epidemia en tiempos fuera del periodo del estado de alarma.
Esta figura muestra el movimiento de personas en un día “normal” para 3 celdas, Pozuelo de Alarcón (distrito 01) en azul, Colmenarejo en verde, y Madrid (Aplomeras Sureste-1). En el grafico se observa a cada región de referencia en negro, y en los respectivos colores hacia dónde va la población residente de cada una. El movimiento de la población se muestra en porcentajes de la población total de cada celda.
En esta figura se muestra lo mismo que en la anterior pero para el caso del periodo del estado de alarma, donde ese observa la drástica reducción en la movilidad de las personas.
Modelo completo con movilidad de personas
El paso siguiente ha sido incluir la movilidad de las personas, cuantificado con los datos del INE, esto es, tener en cuenta todos los compartimentos S, I, R, H, M, QS, QI, QR para cada una de las celdas y teniendo en cuanta el flujo, entrante y saliente, de personas en cada celda con los respectivos destinos.
Una simulación de esto para el caso de los datos “reales” es la que se puede ver en la figura de abajo.
En este caso la dinámica de la epidemia ha comenza con 5 casos en una celda particular al tiempo 0. Se representa la evolución en 9 celdas particulares de la Comunidad de Madrid. Se puede observar que al tener en cuenta el movimiento de las personas, las curvas dejan de ser “suaves”. La línea de color negro representa el número de infectados en cada celda. Al día 170 y debido a la cantidad de infectados se determina una “cuarentena” del 50% de la población,
lo que incluye a los S, I y R y que dura hasta el día 200 (30 días de aislamiento) . La figura de abajo muestra en más detalle el periodo de cuarentena.
Para el caso de las personas hospitalizadas y muertes (D), se puede observar en la siguiente figura la evolución para cada una de las celdas graficadas.
Evolución de la epidemia en la Comunidad de Madrid con el modelo completo Para tener una idea de como evoluciona la epidemia, para estos parámetros del modelo y en esta situación simulada de periodos de no-confinamientos, tenemos la figura siguiente, en donde se muestra el porcentaje de infectados, respecto de la celda correspondiente, para todas las celdas de la Comunidad de Madrid, de acuerdo al modelo anterior.
En el caso que interés el numero de hospitalizados previstos en función del tiempo, podemos observar esta situación en el gráfico de abajo. Tener en cuanta que el modelo llama “hospitalizados” a las personas que necesitan atención en las Unidades de Cuidados Intensivos.
Muchos de los modelos actuales de COVID-19 prevén una segunda “ola de contagios” pasada la inicial y en otros escenarios, varias olas sucesivas [3], por lo que es necesario desarrollar estrategias de prevención
Actualmente estamos trabajando con el modelo estudiando distintas situaciones de interés para la sanidad publica de Madrid, con datos reales de la cobertura sanitaria del área única de la comunidad de Madrid y de los 262 Centros de Salud de atención primaria asociados a cada uno de los 11 sectores en que se divide esta. El trabajo tiene en cuenta la población asignada a cada C.S. por tramos etarios y factores de riesgo para COVID-19 –diabetes, obesidad, EPOC, etc.-
En este entorno, se están estudiando los siguientes posibles escenarios para el caso de la “segunda ola” y sucesivas olas de contagios.
[3] COVID-19: The CIDRAP Viewpoint: Part 1: The Future of the COVID-19 Pandemic: Lessons Learned from Pandemic Influenza.
Tu colaboración y ayuda es lo que nos permite seguir trabajando para mejorar la calidad de vida de nuestros pacientes.
¡Donar ahora!