Enfoque: Métodos contemporáneos en bioestadística (I)Estrategias para la elaboración de modelos estadísticos de regresiónRegression Modeling Strategies
Section snippets
Introducción
Los modelos de regresión multivariables se utilizan ampliamente en la investigación de ciencias de la salud. Con frecuencia, el objetivo en la recolección de datos obedece al afán de explicar las interrelaciones que existen entre ciertas variables o a determinar los factores que afectan a la presencia o ausencia de un episodio adverso determinado. Es ahí donde los modelos de regresión multivariables pasan a ser un instrumento útil, al suministrar una explicación matemática simplificada de dicha
Estructura de los datos y tipo de análisis de regresión
Los modelos de regresión tienen en general una estructura común que debe resultar familiar a la mayoría; generalmente siguen este patrón: respuesta = ponderación1 × predictor1 + ponderación2 × predictor2 + … ponderaciónk × predictork | término de error normal. La variable a explicar se denomina variable dependiente (o variable de evaluación). Cuando la variable dependiente es binaria, la literatura médica se refiere a ella en términos de eventos clínicos o episodios adversos. Los factores que explican la
Manipulación de los datos
No es infrecuente que los datos requieran una depuración antes de iniciar el análisis estadístico. Hay tres puntos importantes que considerar en este caso:
- 1.
Valores perdidos. Este es un problema universal en la investigación en ciencias de la salud. Se han diferenciado tres tipos de mecanismos19: valores perdidos completamente aleatorios (MCAR), valores perdidos aleatorios (MAR) y valores perdidos no aleatorios (NMAR) (tabla 3). La imputación múltiple se desarrolló para abordar la ausencia de
Estrategias de creación de modelos
La selección de variables es un paso crucial en el proceso de creación del modelo (tabla 1). La inclusión de variables adecuadas es un proceso intensamente influido por el equilibrio preespecificado entre complejidad y simplicidad (tabla 3). Los modelos predictivos deben incluir las variables que reflejen el patrón de la asociación en estudio en la población representada en los datos. En este caso, lo que importa es la información que el conjunto del modelo representa. Por otra parte, en
Evaluación del modelo final
Un elemento central en el proceso de crear un modelo de regresión es su evaluación en cuanto al rendimiento. En este sentido, se han propuesto diversas medidas, que pueden agruparse en dos categorías principales: medidas de calibración y de discriminación (Tabla 1, Tabla 3). Independientemente del objetivo para el que se ha creado el modelo, estas dos medidas del rendimiento deben derivarse de los datos que le han dado origen, y preferiblemente deben estimarse utilizando técnicas de remuestreos
Presentación de los resultados
Las consideraciones finales en el proceso de creación de un modelo corresponden a la forma en la que se presentarán los parámetros estimados. Con frecuencia, los programas informáticos de estadística expresan la magnitud del efecto de la variable explicativa en unidades relativas, al comparar dos grupos respecto a un resultado binario. Para la regresión logística y la regresión de Cox, la OR y la HR son las unidades tradicionales utilizadas para indicar el grado de asociación entre una variable
Conflicto de intereses
Ninguno.
Bibliografía (45)
- et al.
Importance of events per independent variable in proportional hazards regression analysis. II. Accuracy and precision of regression estimates
J Clin Epidemiol
(1995) - et al.
A simulation study of the number of events per variable in logistic regression analysis
J Clin Epidemiol
(1996) - et al.
Stepwise selection in small data sets: a simulation study of bias in logistic regression analysis
J Clin Epidemiol
(1999) - et al.
Automated variable selection methods for logistic regression produced unstable models for predicting acute myocardial infarction mortality
J Clin Epidemiol
(2004) - et al.
Development and validation of a prediction model with missing predictor data: a practical approach
J Clin Epidemiol
(2010) - et al.
Prognostic modeling with logistic regression analysis: in search of a sensible strategy in small data sets
Med Decis Making
(2001) Regression modeling strategies: with applications to linear models, logistic regression, and survival analysis
(2001)- et al.
Prediction of coronary heart disease using risk factor categories
Circulation
(1998) - et al.
Prognosis and prognostic research: Developing a prognostic model
BMJ
(2009) Clinical prediction models: a practical approach to development, validation, and updating
(2009)
Efficiency of the logistic regression and Cox proportional hazards models in longitudinal studies
Stat Med
Dynamic regression models for survival data
Further development of flexible parametric models for survival analysis
Stata J
Competing risks: a practical perspective
A proportional hazard model for the subdistribution of a competing risk
J Am Stat Assoc
Basic concepts and methods for joint models of longitudinal and survival data
J Clin Oncol
Joint modelling of longitudinal and time-to-event data: challenges and future directions
A comparison of two methods for the estimation of precision with incomplete longitudinal data, jointly modelled with a time-to-event outcome
Stat Med
Impact of missing data due to selective dropouts in cohort studies and clinical trials
Epidemiology
JM: An R package for the joint modelling of longitudinal and time-to-event data
J Stat Soft
Analyzing longitudinal data in the presence of informative drop-out: The jmre1 command
Stata J
Multi-state models for the analysis of time-to-event data
Stat Methods Med Res
Cited by (184)
Predicting thermophysical properties of alkanes and refrigerants using machine learning algorithms
2024, Fluid Phase EquilibriaReview and proposition for model-based multivariable-multiobjective optimisation of extrusion-based bioprinting
2023, Applied Materials TodayDevelopment of Prognostic Indicator Based on AU-Rich Elements-Related Genes in Glioblastoma
2023, World Neurosurgery