Analítica de dades en recerca en salut: oportunitats a l’abast

9 febr.
Xavier Serra-Picamal

Xavier Serra-Picamal

La generació i emmagatzematge de dades és ja omnipresent. Els costos han disminuït de forma dràstica i l’àmbit sanitari no n’és aliè. Per il·lustrar-ho, val la pena  veure el següent gràfic, elaborat per l’Institut americà de recerca sobre el genoma humà (National Human Genome Research Institute), i que mostra l’evolució del cost de seqüenciació d’un genoma:

Cost per genome
Com s’observa, des de 2007, el que costa seqüenciar un genoma ha disminuït enormement. Tenir el propi genoma seqüenciat ja és possible i en un futur possiblement sigui freqüent. Tenint en compte que una còpia del genoma humà està format per aproximadament 3 milions de parells de bases (3 milions d’adenines, timines, citosines o guanines disposades seqüencialment en 23 cromosomes) és fàcil deduir que, també en aquest àmbit, la quantitat de dades que es generaran en els propers anys serà ingent.

La tendència es replica en altres aspectes de l’atenció sanitària: dades d’historials clínics en format electrònic, imatge mèdica, dades d’atenció primària o de consum de fàrmacs, entre d’altres, són obtingudes i emmagatzemades en registres, generalment estructurats i entrellaçats. El potencial d’aquestes dades per a fer recerca que serveixi per proveir una millor assistència sanitària és notòria, en forma de diagnòstics més ràpids i acurats, millors abordatges terapèutics i una millor gestió del sistema.

Per analitzar els reptes i oportunitats a nivell europeu, es va fer una sessió de treball organitzada pel Directorat General per la Recerca i Innovació de la Comissió Europea a Luxemburg, amb presència d’AQuAS. Els punts que es van discutir s’han recollit a l’article Making sense of big data in health research: Towards an EU action plan, publicat a la revista Genome Medicine, i que es pot consultar en obert. Tal i com es recull en l’article, utilitzar aquesta informació per tal de proveir una millor atenció sanitària és un repte i una gran oportunitat alhora.

Making sense of big data in health research
Cal, però, un gran esforç per tal que aquestes dades es transformin en coneixement i accions concretes. Per més que els costos de generació i emmagatzematge baixin, la gestió de la informació, interpretació i generació de coneixement necessiten d’una gran inversió i recursos. Això implica dotar-se de sistemes d’informació i recursos econòmics i humans adequats, per tal que les dades es tractin de manera eficient, garantint la preservació dels drets individuals. A més, és necessària la participació, implicació i comunicació de tots els agents del sistema (incloent la comunitat científica, pacients, ciutadans, administració…) per garantir que l’ús d’aquestes dades sigui eficient, responsable i fomenti una recerca eficient i de qualitat

Catalunya, pel nombre d’habitants, el fet de disposar d’un sistema sanitari integrat i per la feina feta durant anys, està en una bona posició per fomentar la reutilització de dades de salut per a la recerca. A nivell internacional, existeixen alguns projectes equiparables, i existeixen nous projectes per poder integrar i consolidar dades de diferents fonts, amb alguns programes molt ambiciosos i atractius. El programa PADRIS que es va presentar el passat 12 de gener, neix amb l’objectiu de centralitzar i posar a l’abast dels investigadors dels centres de recerca de Catalunya i universitats les dades que es generen en salut per tal d’oferir una millor atenció sanitària amb les màximes garanties de seguretat i privacitat. La feina per fer és gran. Els recursos necessaris també. Les oportunitats per oferir una millor recerca i una millor atenció sanitària són a l’abast.

Entrada elaborada per Xavier Serra-Picamal, investigador al Karolinska Institutet (Suècia).

*Recentment, el TERMCAT (centre de terminologia) ha tractat la qüestió sobre com es pot dir data scientist en català. El tema és ben actual!

Estratificació i bases de dades de morbiditat (2a part)

31 març

Emili Vela

(Aquest post és la continuació d’aquest altre post)

Un element fonamental per tal de poder dur a terme l’estratificació de la població per grups de risc són els sistemes d’informació. Cal, doncs, disposar d’una base de dades que integri la informació recollida en els diferents registres sanitaris i per donar resposta a aquesta demanda, es va crear la base de dades de morbiditat poblacional.

La qüestió és que cada cop es fa més èmfasi en la necessitat de proporcionar als pacients una atenció social i sanitària integral i integrada, però l’anàlisi i l’avaluació d’aquesta atenció no es pot dur a terme correctament amb uns sistemes d’informació fragmentats, sinó que s’ha de fer a partir de la integració de les dades que contenen.

Estructura de la base de dades de morbiditat poblacional

La base de dades de morbiditat poblacional es fonamenta sobre un sistema de taules relacionades que pivoten al voltant de la taula d’usuaris, que recull les principals dades de l’assegurat (demogràfiques o estat de salut, per posar dos exemples).

Actualment hi ha tres taules més, la taula de diagnòstics, la de contactes amb serveis sanitaris i la de farmàcia, però aquest tipus d’estructura permet, amb relativa facilitat, incorporar tant informació de nous registres (consultes externes, diàlisi, teràpia respiratòria, etc.), com noves taules amb altra informació rellevant, com per exemple de resultats de determinacions clíniques:

Figura 1. Estructura i contingut de la base de dades de morbiditat poblacional. La taula de determinacions clíniques, en gris, encara no està implementada.

Taula d'assegurats

La base de dades de morbiditat poblacional integra la informació dels següents registres:

  • Registre Central d’Assegurats (RCA): gestionat des de la Gerència d’atenció ciutadana del CatSalut. Aquest registre proporciona fonamentalment tota la informació de residència, sociodemogràfica i de l’estat vital dels assegurats.
  • Registres del conjunt mínim bàsic de dades (CMBD): gestionats per la Divisió d’anàlisi de la demanda i l’activitat del CatSalut. Aquests registres alimenten tant la taula de diagnòstics com la de contactes. Existeixen diferents registres per recollir la informació de les línies assistencials:
  • Hospitalització (CMBD-HA): informació proporcionada pels hospitals generals d’aguts (ingressos, cirurgia major ambulatòria, hospitalitzacions domiciliàries, hospital de dia) del període 2005-2014
  • Sociosanitari (CMBD-SS): informació de l’atenció proporcionada pels centres sociosanitaris d’internament (llarga i mitja estada i UFISS) i equips d’atenció ambulatòria (PADES) del període 2005-2014.
  • Hospitalització psiquiàtrica (CMBD-SMH): informació de l’atenció proporcionada pels hospitals monogràfics psiquiàtrics del període 2005-2014.
  • Salut mental ambulatòria (CMBD-SMP): informació de l’atenció proporcionada pels centres de salut mental ambulatòria del període 2005-2014.
  • Atenció primària (CMBD-AP): informació de l’atenció proporcionada pels equips d’atenció primària del període 2010-2014.
  • Urgències (CMBD-UR): informació de l’atenció a urgències (hospital i CUAP) del període 2013-2014.
  • Registre d’activitat de farmàcia (RAF): gestionat per la Gerència de farmàcia i del medicament del CatSalut. Aquest registre proporciona tota la informació de dispensació farmacèutica ambulatòria del període 2011-2014.
  • Registre de facturació de serveis sanitaris (RF): gestionat per la divisió de provisió de serveis assistencials. Aquest registre proporciona informació de tota aquella activitat finançada pel CatSalut, però que no compta amb un registre específic: consultes externes hospitalàries, diàlisi, oxigenoteràpia domiciliaria, rehabilitació o transport sanitari no urgent. Aquest registre proporciona fonamentalment informació a la taula de contactes pel període 2011-2014.

Les utilitats de la base de dades de morbiditat poblacional són múltiples, l’estratificació poblacional, l’anàlisi específic de determinats problemes de salut (fractura de fèmur, IC, MPOC,…), l’elaboració d’indicadors poblacionals d’eficiència en la utilització de recursos, etc.

Podem concloure que, pel volum de dades que integra, aquesta base de dades té les característiques d’un “big data” estructurat, amb una considerable capacitat de creixement i d’adaptació a nous requeriments i fonts de dades i ofereix unes enormes possibilitats d’anàlisi.

Entrada elaborada per Emili Vela, responsable dels Mòduls per al Seguiment d’Indicadors de Qualitat (MSIQ). Àrea d’Atenció Sanitària. CatSalut.