I registri ospedalieri che includono i dati dei pazienti con insufficienza cardiaca hanno il pregio di raccogliere numerosi dati da setting di real-life, tuttavia dipendono fortemente dall’accuratezza con cui i dati sono stati inseriti e non sono sempre facilmente consultabili.
Un gruppo di ricercatori ha condotto uno studio per verificare l’applicabilità di sistemi di intelligenza artificiale (machine learning, ML, e natural language processing, NLP) per definire il fenotipo dell’insufficienza cardiaca tra i pazienti inclusi nel registro elettronico della Veterans Health Administration statunitense e associati a insufficienza cardiaca secondo l’International Classification of Diseases (ICD).
La coorte per lo sviluppo del modello di IA (totale di 20mila pazienti, di cui 16mila per il training, 2000 per la validazione e 2000 per il test finale) ha incluso 10mila pazienti con insufficienza cardiaca e altrettanti pazienti senza insufficienza cardiaca associati per sesso, età, etnia e ospedalizzazione.
Una volta sviluppati e testati, i modelli di ML e NLP sono stati applicati a una coorte di 200 pazienti con almeno un codice ICD identificativo di insufficienza cardiaca, per ognuno dei quali sono stati calcolati i punteggi ML, NLP e ML+NLP. Questi dati hanno consentito di stimare i valori soglia indicativi di insufficienza cardiaca per i tre modelli considerati.
Il passo successivo è stato quello di confrontare il numero di pazienti di questa coorte diagnosticabili con insufficienza cardiaca sulla base dei valori soglia dei modelli e quello dei pazienti, sempre di questa coorte, diagnosticati da due ricercatori sulla base di un’analisi “manuale” delle cartelle cliniche.
In generale i tre modelli hanno ottenuto performance migliori nell’identificare i pazienti con insufficienza cardiaca rispetto all’approccio tradizionale basato sui codici ICD.
Inoltre i pazienti individuati dai tre modelli presentavano caratteristiche e prognosi similari a quelle dei pazienti diagnosticati con l’analisi delle cartelle da parte dei ricercatori.
In generale, i risultati di questo studio suggeriscono che ML e NLP possano essere considerati modelli efficienti per riconoscere il fenotipo dell’insufficienza cardiaca nella miriade di dati raccolti nel registro americano e che possano essere di supporto nell’identificazione dei pazienti da includere in nuovi studi di efficacia o dedicati alla verifica della qualità della presa in carico e degli outcome.