EVALUACIÓN DE UN NUEVO MODELO DE PREDICCIÓN PARA CÁNCER GÁSTRICO
Evaluación de un nuevo modelo de predicción para cáncer gástrico
A continuación, se presenta la traducción del texto original del artículo de los autores más adelante mencionados realizado por el equipo del comité editorial de MD&CO Consulting Group. Esta traducción se realiza con fines académicos para promover la revisión de la literatura disponible sobre el tema. Se advierte que la traducción puede presentar notas realizadas por el traductor con el objetivo de facilitar la comprensión del documento y disipar ambigüedades que puedan existir por las diferencias en los idiomas.
Berlin JA, Catenacci DV. (2020) Evaluating the Value of a New Prediction Model for Gastric Cancer. JAMA Network Open. 2021;4(11):e2137148. doi:10.1001/jamanetworkopen.2021.37148 (
La actual publicación de Chen y sus colegas, presenta un modelo diseñado para predecir la supervivencia de pacientes con cáncer gástrico. Ellos argumentan que el actual sistema de estadios que usa datos recolectados rutinariamente es limitado en su habilidad para predecir los resultados clínicos y, más importante aún, para predecir los beneficios potenciales de la quimioterapia. Ellos se enfocan en construir una forma de colágeno asociada a los tumores (TACS, por sus siglas en inglés) usando los datos del microambiente del tumor. El colágeno es un componente importante en el microambiente del tumor y puede influenciar la progresión de cáncer y la respuesta a quimioterapia.
Los autores utilizaron un modelo estadístico sofisticado para un gran número de datos de potenciales variables predictoras, con un limitado sobreajuste de los modelos. Cuando los modelos se sobren ajustan a un conjunto de datos específicos, ellos pueden ser excelente para la predicción en la muestra actual pero no tan buen predictor en otras poblaciones. Chan et al., desarrollaron el modelo en una cohorte de una sola institución en China y validaron el modelo en una cohorte aparte, de otro hospital.
El modelo incluía 9 aspectos en el TACS, un mayor TACS fue asociado con un peor desenlace independientemente del tratamiento. Cuando comparado con un modelo que contenía solamente las variables clínicas de la patología, el modelo que incluye TACS muestra una habilidad de predicción significativamente mejor para predecir los desenlaces. Hay algunos aspectos técnicos que requieren algo de contextualización:
Primero, es importante recordar la diferencia entre los modelos de pronósticos que tienen como objetivo predecir los resultados naturales entre diferentes subgrupos y los modelos exploratorios que son diseñados con el objetivo de determinar inferencias causales acerca de las relaciones entre las variables y los desenlaces. En el desarrollo de modelos pronósticos el objetivo, es tener una predicción valida; en estos modelos se tiende a no preocupar por las interpretaciones causales, por lo tanto, temas como los factores de confusión no son pertinentes. Por lo contrario, los modelos exploratorios se preocupan en una proporción alta por los factores de confusión en el interés de determinar que variable causa los determinados desenlaces. Un tercer modelo relevante a este estudio es el modelo predictivo, estos tienen el objetico de predecir los desenlaces de tratamiento en lugar de los resultados naturales predichos por los modelos de pronósticos. Los factores identificados en el modelo predictivo se denominan algunas veces biomarcadores. El punto central es que todos estos 3 tipos de modelos no pueden ser interpretados y construidos solamente con base en los valores P.
Un artículo reciente en modelos de pronósticos propone una ruta para desarrollar estos modelos. Los pasos para el desarrollo del modelo de acuerdo con esta ruta son: definir el problema explícitamente, seleccionar un conjunto de datos que informe del problema, extraer y construir variables a considerar en el modelo, desarrollar el modelo predictivo y validar el funcionamiento del modelo.
Chen et al., hicieron un trabajo excelente siguiendo estos criterios. Sin embargo, en la interpretación de los resultados hay observaciones. El estadístico C, es una medida de discriminación, por ejemplo, la habilidad del modelo de distinguir entre aquellos que van a tener el evento de interés y los que no. Esto también se llama el área debajo de la curva característica del operador receptor. Otro termino igualmente relevante es la calibración, este mide que tan cercanas están las probabilidades predichas del modelo a las observadas.
Las curvas de calibraciones de Chen et al, parecen confirmar la habilidad de modelo de hacer pronósticos válidos. El estadístico c, reportado por los autores mostró una mejora significativa con la adición del TACS a las variables clínicas patológicas. La pregunta es, ¿Independiente de la significancia estadística, que magnitud del cambio en el c estadístico es importante clínicamente?
Primero, para supervivencia libre de enfermedad el c estadístico fue de 0,8 para el modelo completo vs 0,78 para el modelo clínico patológico solo (P: 0.03) Para la supervivencia en general, los valores correspondientes fueron 0.81 vs 0.80 (P: 0.03). Los resultados para la validación de la cohorte muestran un patrón similar. El pequeño incremento en el estadístico C genera la pregunta de si la adición del TACS al modelo es realmente necesario, considerando el esfuerzo y el costo.
Cuando desarrollando modelos de pronósticos y modelos predictivos es esencial confirmar el desempeño del modelo en un conjunto de datos que no fue usado en el desarrollo de este. En general la inquietud se da dado a que los modelos tienden a tener un mejor desempeño en el conjunto de datos utilizados para su desarrollo. La validación puedes ser interna, usando una separación de muestras para la misma población, usualmente escogidas de manera aleatoria de la muestra completa. El modelo es desarrollado en una de las muestras y luego probado en otra. Esto puede ser una validación algo débil debido a que cualquier variabilidad entre los resultados es puramente aleatoria. Existen diferentes grados de validación externa, dependiendo de que tan diferentes son las poblaciones originales de la de validación. Chen et al, usaron datos de otro hospital en china para realizar esta validación y los resultados indican que el modelo aplico igual de bien para ambas poblaciones. Uno podría validar aún más con periodos de tiempo recientes, otros países o ambos.
En resumen, TACS puede ser una adición útil para ayudar a entender el pronóstico de cáncer gástrico. Adicionalmente, pacientes con menor TACS, parecen responder mejor a quimioterapia, pero esto necesita validación adicional independientemente del conjunto de datos.