Raggruppamento
Rapporti scientifici volume 13, numero articolo: 12701 (2023) Citare questo articolo
Dettagli sulle metriche
L’apprendimento automatico applicato alla patologia digitale è stato sempre più utilizzato per valutare la funzionalità renale e diagnosticare la causa alla base della malattia renale cronica (IRC). Abbiamo sviluppato un nuovo quadro computazionale, l'analisi spaziale basata sul clustering (CluSA), che sfrutta l'apprendimento non supervisionato per apprendere le relazioni spaziali tra modelli visivi locali nel tessuto renale. Questo framework riduce al minimo la necessità di annotazioni di esperti, dispendiose in termini di tempo e poco pratiche. Nel modello di clustering e di deep learning sono state utilizzate 107.471 immagini istopatologiche ottenute da 172 nuclei bioptici. Per incorporare informazioni spaziali sui modelli di immagini raggruppate sul campione bioptico, abbiamo codificato spazialmente i modelli raggruppati con colori ed eseguito l'analisi spaziale attraverso la rete neurale del grafico. Per prevedere la CKD è stato utilizzato un classificatore forestale casuale con vari gruppi di caratteristiche. Per prevedere l'eGFR alla biopsia, abbiamo raggiunto una sensibilità di 0,97, una specificità di 0,90 e un'accuratezza di 0,95. L’AUC era 0,96. Per prevedere le variazioni dell’eGFR in un anno, abbiamo raggiunto una sensibilità di 0,83, una specificità di 0,85 e un’accuratezza di 0,84. L’AUC era 0,85. Questo studio presenta la prima analisi spaziale basata su algoritmi di apprendimento automatico non supervisionati. Senza annotazioni da parte di esperti, il quadro CluSA può non solo classificare e prevedere accuratamente il grado di funzionalità renale alla biopsia e in un anno, ma anche identificare nuovi predittori della funzionalità renale e della prognosi renale.
La malattia renale cronica (IRC) comporta una perdita graduale della funzione renale e non viene facilmente rilevata nelle fasi iniziali finché la condizione non è avanzata. Secondo i Centri per il controllo e la prevenzione delle malattie, si stima che più di 37 milioni di persone (il 15% degli adulti statunitensi) soffrano di malattia renale cronica (IRC) e ben 9 adulti su 10 affetti da insufficienza renale cronica non sanno di avere la malattia renale cronica1. Diabete, ipertensione, malattie cardiache e una storia familiare di insufficienza renale sono le cause più comuni di malattia renale. Attualmente, la malattia renale cronica, che causa più decessi del cancro al seno o alla prostata, è la nona causa di morte negli Stati Uniti1.
Poiché il grado di disfunzione renale è associato a un aumento della mortalità e del rischio di malattie cardiache2,3, una diagnosi precoce e accurata è fondamentale per rallentare la progressione verso l'insufficienza renale4. Le attuali misurazioni tipiche della funzionalità renale e del rischio di progressione, come il livello di creatinina nel sangue e le proteine nelle urine5,6, presentano diverse limitazioni e non sono accurate a livelli più elevati di funzionalità renale7. Sebbene i campioni bioptici renali possano fornire ulteriori informazioni prognostiche, ad esempio il grado di sclerosi glomerulare e la fibrosi interstiziale8, essi vengono spesso stimati visivamente e l'interpretazione può variare da un patologo all'altro. Gli algoritmi assistiti da computer possono fornire una valutazione renale più obiettiva e aiutare a superare la sostanziale variabilità tra osservatori.
Diversi approcci di deep learning e machine learning all'analisi delle immagini istopatologiche sono diventati sempre più comuni con la crescente disponibilità di scanner digitali a vetrino intero9. Coudray et al. hanno utilizzato reti neurali di convoluzione (CNN) su immagini di vetrino intero (WSI) per classificarle in adenocarcinoma polmonare (LUAD), carcinoma polmonare a cellule squamose (LUSC) o tessuto polmonare normale10. Inoltre, la CNN è stata applicata al WSI per classificare i glomeruli sclerosati e non sclerosati11,12. Kolachalama et al. hanno dimostrato che i modelli di deep learning della CNN possono superare il punteggio di fibrosi stimato dal patologo nei compiti di classificazione e possono essere applicati alle immagini di biopsia renale di routine13.
Ad oggi, la maggior parte degli algoritmi di machine learning e deep learning applicati alle immagini istopatologiche si basano su approcci (di formazione) supervisionati. Tuttavia, gli algoritmi supervisionati richiedono l’uso di una grande quantità di dati di addestramento etichettati, il che è un compito lungo, spesso poco pratico e costoso. Per superare questo problema, diversi studi hanno proposto metodi come l'apprendimento debolmente supervisionato e l'apprendimento a istanze multiple (MIL) che hanno fornito prestazioni relativamente elevate14,15,16,17,18. Tuttavia, si tratta ancora di metodi supervisionati che richiedono etichette a livello di paziente.