A practical perspective on the concordance index for the evaluation and selection of prognostic time-to-event models

Lo sviluppo di un modello prognostico per applicazioni biomediche richiede in genere di mappare l’insieme di covariate di un individuo ad una misura del rischio che lui o lei possa sperimentare l’evento da prevedere. Molti scenari, tuttavia, specialmente quelli che coinvolgono esiti patologici avversi, sono meglio descritti tenendo conto esplicitamente della tempistica di questi eventi, nonché della loro probabilità. Di conseguenza, in questi casi, la classificazione tradizionale o le metriche di classificazione possono essere inadeguate per informare la valutazione o la selezione del modello. Per affrontare questa limitazione, è pratica comune riformulare il problema nel contesto dell’analisi di sopravvivenza e ricorrere, invece, all’indice di concordanza (C-index), che riassume quanto bene un punteggio di rischio previsto descrive una sequenza di eventi osservata. Un’interpretazione praticamente significativa del C-index, tuttavia, può presentare diverse difficoltà e insidie. Nello specifico, identifichiamo due questioni principali: i) l’indice C rimane implicitamente e sottilmente dipendente dal tempo, e ii) la sua relazione con il numero di soggetti il cui rischio è stato erroneamente previsto non è semplice. La mancata considerazione di questi due aspetti può introdurre pregiudizi indesiderati e indesiderati nel processo di valutazione e persino comportare la selezione di un modello non ottimale. Quindi, qui, discutiamo i modi per ottenere un’interpretazione significativa nonostante queste difficoltà. Con l’obiettivo di assistere gli sperimentatori indipendentemente dalla loro familiarità con l’indice C, partiamo da una presentazione a livello introduttivo del suo stimatore più popolare, evidenziando la dipendenza temporale di quest’ultimo e suggerendo come potrebbe essere usato correttamente per informare la selezione del modello. Affrontiamo anche la non linearità dell’indice C rispetto al numero di previsioni di rischio corrette, elaborando un quadro semplificato che possa consentire una più facile interpretazione e quantificazione dei miglioramenti o dei deterioramenti dell’indice C.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato.