Analítica de datos en investigación en salud: oportunidades al alcance

9 Feb
Xavier Serra-Picamal
Xavier Serra-Picamal

La generación y almacenaje de datos es ya omnipresente. Los costes han disminuido de forma drástica y el ámbito sanitario no es ajeno. Para ilustrarlo, vale la pena ver el siguiente gráfico, elaborado por el Instituto americano de investigación sobre el genoma humano (National Human Genome Research Institute), y que muestra la evolución del coste de secuenciación de un genoma:

Cost per genome

Como se observa, desde 2007, lo que cuesta secuenciar un genoma ha disminuido enormemente. Tener el propio genoma secuenciado ya es posible y en un futuro posiblemente sea frecuente. Teniendo en cuenta que una copia del genoma humano está formado por aproximadamente 3 millones de pares de bases (3 millones de adeninas, timinas, citosinas o guaninas dispuestas secuencialmente en 23 cromosomas) es fácil deducir que, también en este ámbito, la cantidad de datos que se generarán en los próximos años será ingente.

La tendencia se replica en otros aspectos de la atención sanitaria: datos de historiales clínicos en formato electrónico, imagen médica, datos de atención primaria o de consumo de fármacos, entre otros, son obtenidos y almacenados en registros, generalmente estructurados y entrelazados. El potencial de estos datos para hacer investigación que sirva para proveer una mejor asistencia sanitaria es notoria, en forma de diagnósticos más rápidos y detallados, mejores abordajes terapéuticos y una mejor gestión del sistema.

Para analizar los retos y oportunidades a nivel europeo, se hizo una sesión de trabajo organizada por la Dirección General por la Investigación e Innovación de la Comisión Europea en Luxemburgo, con presencia de AQuAS. Los puntos que se discutieron se han recogido en el artículo Making sense of big data in health research: Towards an EU action plan, publicado en la revista Genome Medicine, y que se puede consultar en abierto. Tal como se recoge en el artículo, utilizar esta información con el fin de proveer una mejor atención sanitaria es un reto y una gran oportunidad al mismo tiempo.

Making sense of big data in health research

Hace falta, sin embargo, un gran esfuerzo a fin de que estos datos se transformen en conocimiento y acciones concretas. Por más que los costes de generación y almacenaje bajen, la gestión de la información, interpretación, y generación de conocimiento necesitan de una gran inversión y recursos. Eso implica dotarse de sistemas de información y recursos económicos y humanos adecuados, a fin de que los datos se traten de manera eficiente, garantizando la preservación de los derechos individuales. Además, es necesaria la participación, implicación y comunicación de todos los agentes del sistema (incluyendo la comunidad científica, pacientes, ciudadanos, administración…) para garantizar que el uso de estos datos sea eficiente, responsable y fomente una investigación eficiente y de calidad

Cataluña, por el número de habitantes, el hecho de disponer de un sistema sanitario integrado y por el trabajo hecho durante años, está en una buena posición para fomentar la reutilización de datos de salud para la investigación. A nivel internacional, existen algunos proyectos equiparables, y existen nuevos proyectos para poder integrar y consolidar datos de diferentes fuentes, con algunos programas muy ambiciosos y atractivos. El programa PADRIS que se presentó el pasado 12 de enero, nace con el objetivo de centralizar y poner al alcance de los investigadores de los centros de investigación de Cataluña y universidades los datos que se generan en salud con el fin de ofrecer una mejor atención sanitaria con las máximas garantías de seguridad y privacidad. El trabajo para hacer es grande. Los recursos necesarios también. Las oportunidades para ofrecer una mejor investigación y una mejor atención sanitaria están al alcance.

Entrada elaborada por Xavier Serra-Picamal, investigador en el Karolinska Institutet (Suecia).

*Recientemente, el TERMCAT (centro de terminología de la lengua catalana) ha tratado la cuestión sobre cómo se puede decir data scientist  en catalán. ¡El tema es muy actual!