En una de las clases impartidas por el Premio Nobel de Física Richard Feynman en Caltech, inició su exposición con la siguiente aseveración: «la excepción confirma que la regla es mentira. Si hay una excepción a cualquier regla y se puede probar por la observación, esa regla es falsa».
La investigación científica tiene 2 facetas: la primera, descriptiva, se basa en la observación y descripción con la máxima precisión posible de un fenómeno determinado; la segunda consiste en explicar lo que se ha observado. La forma idónea de explicación es mediante una función matemática que deberá predecir con exactitud lo que sucederá cada vez que se repita el fenómeno. En 1905 Albert Einstein publicó la fórmula más famosa de todos los tiempos que sustentaba su teoría de la relatividad especial. Solo un selecto puñado de físicos consiguió a duras penas entenderla. No era fácil imaginar que un ser humano pudiera contener tanta energía como la que una ciudad consume en un año. El premio Nobel se le otorgó por la explicación del efecto fotoeléctrico y no por esa teoría endemoniada. Todos los intentos experimentales para derrotar a Einstein fracasaron. En 2011 un experimento realizado en el CERN (siglas en francés del Consejo Europeo para la Investigación Nuclear, con sede en Ginebra) pareció invalidarla pero, tras el escalofrío inicial, en 2012 se confirmó que había habido un error de cálculo. Einstein y la relatividad habían superado un nuevo escollo.
La medicina es, en general, una ciencia probabilística. En la mayor parte de los sucesos estudiados influye un gran número de variables de las que usualmente solo conocemos algunas, sin saber además en qué medida intervienen en el desarrollo de ese suceso. Por ejemplo, el volumen de gas espirado en un segundo (FEV1) está sometido probablemente a cientos, quizá miles de variables. Medimos ese volumen a un número elevado de individuos y se confecciona una ecuación que no suele ser excesivamente elegante. Al aplicarla a muchos individuos se puede comprobar el grado de precisión que tiene. En la mayor parte de los procesos fisiológicos y patológicos no podemos contar con ecuaciones de regresión suficientemente precisas. Por ejemplo, no podemos cuantificar la probabilidad que un individuo concreto tiene de desarrollar una cavidad pulmonar de 4cm en el lóbulo superior del pulmón izquierdo tras entrar en contacto durante 24h con otro individuo que padece tuberculosis. Por ello, en medicina es fundamental conocer qué estamos diciendo cuando hablamos de valores sobre algo concreto. Para empezar, es preciso asumir que la medicina es fundamentalmente descriptiva. Se realizan experimentos (ensayos clínicos u otros), vemos que sucede y se extraen unas conclusiones. La fiabilidad de estas conclusiones dependerá, en gran medida, de la precisión de las herramientas de medición. En física, un experimento puede realizarse con un solo caso porque el número de variables es pequeño y con frecuencia pueden controlarse. Si dejamos caer un cuerpo en el vacío sobre la tierra a 20m de altura siempre alcanzará la misma aceleración y velocidad final. Tenemos una sencilla fórmula que lo predice con exactitud. ¿Qué sucede si probamos un broncodilatador en pacientes con EPOC? Lo más probable es que los objetivos del estudio sean funcionales (FEV1), de calidad de vida (cuestionarios), y quizá el número y tipo de agudizaciones. Al realizarse con seres humanos, todos estos objetivos tienen variables dependientes del propio individuo que afectan a la variable principal, muchas de las cuales desconocemos o no podemos controlar (el estado de ánimo en sí mismo encierra un número indeterminado de variables). La precisión de las herramientas para medir cada objetivo varía notablemente, bastante buena para el FEV1 pero escasa para la calidad de vida, donde es únicamente semicuantitativa. En el caso de las agudizaciones, ni siquiera disponemos de una definición precisa de la variable que en el 100% de los casos permita decidir sin ninguna duda que un evento es o no una agudización y mucho menos cuantificarla más allá de una modesta clasificación. Volvamos al FEV1. Realizamos al menos 3 pruebas con una precisión que alcanza hasta los mililitros, pero lo más probable es que todas sean diferentes. Aunque lo idóneo para comparar esta prueba en sucesivas mediciones sería realizarla muchas veces y coger el valor que más se repite, a efectos prácticos resulta imposible. Según los criterios SEPAR1, utilizamos el más elevado, considerándose aceptable una diferencia menor de 150ml entre las 2 mejores (100ml si el FEV1<1.000ml). Establecer un número absoluto en una prueba cuyos valores normales se pueden multiplicar por más de 2 en función del individuo parece poco adecuado. Incluso aceptando un 10% de variación, sigue indicando una falta de precisión notable. Con nuestros broncodilatadores más potentes, la mejora media del FEV1 es de unos 170ml2. Cuando la comparación es entre 2 broncodilatadores oscila entre 30-90ml3,4. Parece evidente que si el incremento es bastante inferior al valor que consideramos aceptable para la reproducibilidad del test, los resultados pierden fiabilidad.
Como se comentó anteriormente, en física un principio ha de tener asociada una demostración matemática que calcule con elevada precisión los resultados de cualquier experimento en relación con ese principio. En el caso del FEV1 tendremos un amplio abanico de valores posibles. Por ello, solemos expresarlo como una media del total con un intervalo. Aplicar estos resultados a un paciente concreto resulta prácticamente imposible. No podemos predecir lo que sucederá al administrarle ese broncodilatador, igual que es imposible conocer la renta de un español a partir de la renta media del país. Parece más eficaz determinar previamente el cambio que tiene consecuencias positivas y conocer cuántos pacientes en cada grupo del ensayo lo alcanzan. Si la diferencia es del 15% a favor del fármaco, quizá este porcentaje se acerque al real que tiene el paciente de mejorar. El problema surge en determinar con precisión el valor mínimo de mejoría. En enfermedad respiratoria carecemos de umbrales suficientemente precisos. Se han postulado valores de 100ml para FEV15, aunque parece más razonable establecer cambios porcentuales. En el cuestionario St. George se establece en 4 puntos, pero ¿tiene la misma relevancia si la puntuación de base es 35 que 58?, ¿Qué valor práctico tiene un cambio medio respecto al comparador de 2,5 puntos, aunque el análisis estadístico alcance una diferencia muy significativa?, ¿Esa información sirve de algo para el paciente que está ante nosotros?
La medicina es una ciencia probabilística en la que en general solo describimos sucesos que, a menudo, cuesta explicar o entender. Es fundamental analizar con detenimiento como se ha de diseñar el experimento y ser humildes en las conclusiones. El principio de incertidumbre enunciado por Heisenberg determina que cualquier medición estará influenciada por el propio sistema de medición. En el universo de las probabilidades es necesario tener muy en cuenta lo que medimos, como lo medimos y a quién o qué se puede aplicar. Einstein decía que locura es hacer una cosa una y otra vez esperando obtener diferentes resultados. En medicina frecuentemente diseñamos estudios similares (o eso creemos) con resultados a veces muy distintos.
En conclusión, no estaría mal aplicar algunos preceptos de la física a la investigación médica para ajustar mejor el valor de los hallazgos obtenidos en los ensayos clínicos.