Hemos leído con interés el trabajo de Sánchez-Font A et al1. Por un lado, felicitarlos por investigar sobre pruebas diagnósticas (PD), ya que, son estudios poco populares pero importantes para hacer tratamientos efectivos2. Por otro lado, estos estudios deben seguir una metodología básica3 que facilite su validez externa e interna, además, de contribuir a evitar la introducción en la clínica de PD incorrectamente evaluadas, lo que podría suponer la toma de decisiones erróneas con consecuencias adversas4.
Los autores consideran que la estimación puntual de parámetros (sin intervalos de confianza al 95% [IC95%]) son válidas, lo que no es correcto, ya que todas las determinaciones puntuales están sujetas a error aleatorio, cuya magnitud depende del tamaño muestral y la dispersión de observaciones individuales, por tanto, con PD, no es válido no calcular IC95% y sustituirlos por el valor de p3,5. De hecho si se hace el cálculo de los mismos (tabla 1), observamos que, al solaparse los IC95% de ambas pruebas, no podemos concluir que una sea mejor que la otra5. Además, los autores afirman que la S y E de las pruebas varían en función de la prevalencia (Pv) de la enfermedad, lo que no es correcto, ya que éstas al ser propiedades intrínsecas a la PD, definen completamente su validez, independientemente de la Pv en la población a la cual se aplica; por el contrario, los valores predictivos sí están influidos por la Pv, de manera que, si la tasa de enfermedad es baja, un resultado negativo descartará la enfermedad con mayor seguridad, siendo el valor predictivo negativo (VPN) mayor. Por el contrario, un resultado positivo no permitirá confirmar el diagnóstico, resultando un bajo valor predictivo positivo (VPP)3. De todo esto se deduce que la S y E carecen de utilidad práctica clínica, ya que proporcionan información acerca de la probabilidad de tener un resultado positivo o negativo en función de la verdadera condición del enfermo con respecto a la enfermedad. Sin embargo, cuando realizamos alguna prueba, carecemos de dicha información a priori. Los valores predictivos, al ser dependientes de la Pv en cada lugar, tampoco pueden ser utilizados como índices para comparar dos métodos diagnósticos diferentes, ni tampoco para extrapolar resultados de otros estudios al nuestro2,3,5. Por tanto, debemos calcular los coeficientes de probabilidad positivo (CPP) y negativo (CPN), que son clínicamente útiles y, al no dependen de la prevalencia en cada lugar, permiten comparar estudios diferentes2,3,5. Conceptualmente, miden cuánto es más probable un resultado concreto (positivo o negativo) según la presencia o ausencia de enfermedad3. Si los calculamos en este estudio (tabla 1), vemos que el CPP tiende a infinito en las dos pruebas (no podemos decir qué prueba es mejor), y el CPN, en ambas pruebas está en torno a 0,3, por lo que ninguna de las pruebas sirve para descartar la enfermedad (una prueba se considera útil si su CPN es menor de 0,1).
Parámetros definitorios de una prueba diagnóstica con sus intervalos de confianza al 95%
Valor (%) | IC95% | |
Indices para PATb Convencional | ||
Sensibilidad | 68% | 54% a 80% |
Especifidad | 100% | 100% a 100% |
Valor Predictivo positivo | 58% | 45% a 75% |
Valor predictivo negativo | 58% | (48% a 75%) |
Coeficiente probabilidad positivo | – | – |
Coeficiente probabilidad negativo | 0,32 | 0,2 a 0,49 |
Indices para USEB radial | ||
Sensibilidad | 63% | 56% a 83% |
Especifidad | 100% | 100% a 100% |
Valor Predictivo positivo | 100% | 100% a 100% |
Valor predictivo negativo | 66% | (48% a 78%) |
Coeficiente probabilidad positivo | – | – |
Coeficiente probabilidad negativo | 0,37 | 0,2 a 0,47 |
PATb: Punción aspirativa transbronquial; USEB: Ultrasonografía endobronquial.
Tanto autores como correctores debemos ser conscientes de todos estos detalles con el fin de mejorar, entre todos, el nivel científico y la utilidad de las PD. Así, Gómez Sáez el al4, en un magnífico estudio han puesto de manifiesto la escasa calidad metodológica de los trabajos sobre estudios diagnósticos que se publican en España, en concreto entre 2004 y 2007, de los 8 artículos sobre diagnóstico publicados en Archivos de Bronconeumología, menos del 50% cumplen los requisitos mínimos para un estudio de estas características.