Une perspective pratique sur l’indice de concordance pour l’évaluation et la sélection de modèles pronostiques de délai d’événement

L’élaboration d’un modèle pronostique pour des applications biomédicales nécessite généralement de cartographier l’ensemble des covariables d’un individu à une mesure du risque qu’il subisse l’événement à prédire. De nombreux scénarios, cependant, en particulier ceux impliquant des résultats pathologiques défavorables, sont mieux décrits en tenant compte explicitement du moment de ces événements, ainsi que de leur probabilité. Par conséquent, dans ces cas, les mesures traditionnelles de classification ou de classement peuvent être inadéquates pour éclairer l’évaluation ou la sélection du modèle. Pour remédier à cette limitation, il est courant de recadrer le problème dans le contexte de l’analyse de survie et de recourir plutôt à l’indice de concordance (indice C), qui résume à quel point un score de risque prédit décrit une séquence d’événements observée. Une interprétation pratiquement significative de l’indice C peut toutefois présenter plusieurs difficultés et pièges. Plus précisément, nous identifions deux problèmes principaux: i) l’indice C reste implicitement, et subtilement, dépendant du temps, et ii) sa relation avec le nombre de sujets dont le risque a été mal prédit n’est pas simple. Le fait de ne pas tenir compte de ces deux aspects peut introduire des biais indésirables et indésirables dans le processus d’évaluation, et même aboutir à la sélection d’un modèle sous-optimal. Par conséquent, nous discutons ici des moyens d’obtenir une interprétation significative malgré ces difficultés. Dans le but d’aider les expérimentateurs quelle que soit leur familiarité avec l’indice C, nous partons d’une présentation au niveau introductif de son estimateur le plus populaire, soulignant la dépendance temporelle de ce dernier et suggérant comment il pourrait être correctement utilisé pour éclairer la sélection du modèle. Nous abordons également la non-linéarité de l’indice C par rapport au nombre de prédictions de risque correctes, en élaborant un cadre simplifié qui pourrait permettre une interprétation et une quantification plus faciles des améliorations ou des détériorations de l’indice C.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.