¿Estadísticamente significativo o clínicamente Important?

Santibáñez, Miguel; García-Rivero, Juan Luis; Barreiro, Esther

doi:10.1016/j.arbres.2019.11.006

Archivos de Bronconeumología

ISSN: 0300-2896

Archivos de Bronconeumologia is an international journal that publishes original studies whose content is based upon results of research initiatives dealing with several aspects of respiratory medicine including epidemiology, respiratory physiology, pathophysiology of respiratory diseases, clinical management, thoracic surgery, pediatric lung diseases, respiratory critical care, respiratory allergy and translational research. Other types of articles such as editorials, reviews, and different types of letters are also published in the journal. Additionally, the journal expresses the voice of the following scientific societies: the Spanish Respiratory Society of Pneumology and Thoracic Surgery (SEPAR; https://www.separ.es/), the Latin American Thoracic Society (ALAT; https://alatorax.org/), and the Iberian American Association of Thoracic Surgery (AIACT; http://www.aiatorax.com/).

It is a monthly journal in which all manuscripts are sent to peer-review and handled by the editor or an associate editor from the team and the final decision is made on the basis of the comments from the expert reviewers and the editors. The journal is published solely in English. All the published data is composed of novel manuscripts not previously published in any other journal and not being in consideration for publication in any other journal..

The journal is indexed at Science Citation Index Expanded, Medline/Pubmed, Embase and SCOPUS. Access to any published article is possible through the journal's web page as well as from Pubmed, ScienceDirect, and other international databases. Furthermore, the journal is also present in X, Facebook and Linkedin. Manuscripts can be submitted electronically using the following web site: https://www.editorialmanager.com/ARBR/.

Indexed in:

Medline, Science Citation Index Expanded (SCIE)

Impact factor

The Impact Factor measures the average number of citations received in a particular year by papers published in the journal during the two preceding years.

© Clarivate Analytics, Journal Citation Reports 2025

Impact factor 2024

9.2

Citescore

CiteScore measures average citations received per document published.

Citescore 2024

3.5

SJR

SRJ is a prestige metric based on the idea that not all citations are the same. SJR uses a similar algorithm as the Google page rank; it provides a quantitative and qualitative measure of the journal's impact.

SJR 2024

0.466

SNIP

SNIP measures contextual citation impact by wighting citations based on the total number of citations in a subject field.

SNIP 2024

0.505

View more metrics

Open Access Option

Journal Information

Previous article | Next article

Vol. 56. Issue 10.

Pages 615-616 (October 2020)

Read this article in English

¿Estadísticamente significativo o clínicamente Important?

Statistically Significant or Clinically Relevant?

Visits

6698

Download PDF

Miguel Santibáñeza,

Corresponding author

santibanezm@unican.es

Autor para correspondencia.

, Juan Luis García-Riverob, Esther Barreiroc,d,e

a Grupo de Investigación de Salud Global, Universidad de Cantabria, Instituto de Investigación Marqués de Valdecilla (IDIVAL), Santander, Cantabria, España

b Servicio de Neumología, Hospital de Laredo, Laredo, Cantabria, España

c Servicio de Neumología-Debilidad muscular y caquexia en las enfermedades respiratorias crónicas y el cáncer de pulmón, IMIM-Hospital del Mar, Barcelona, España

d Departament de Ciències Experimentals i de la Salut (CEXS), Universitat Pompeu Fabra (UPF), Parc de Recerca Biomèdica de Barcelona (PRBB), Barcelona, España

e Centro de Investigación en Red de Enfermedades Respiratorias (CIBERES), Instituto de Salud Carlos III (ISCIII), Barcelona, España

This item has received

6698 Visits

1 Cites

Article information

Full Text

Bibliography

Download PDF

Statistics

Figures (1)

Full Text

Este editorial es la tercera y última entrega de la serie de 3 editoriales. En la primera se explicó el ciclo del método científico para contextualizar, en él, el papel de la estadística, junto con los conceptos de precisión y validez interna y externa1. En la segunda se intentó dejar claro que si una diferencia no es estadísticamente significativa, esto no es sinónimo de equivalencia y no debe considerarse que ambos tratamientos «son iguales o equivalentes», en el contexto por ejemplo de un ensayo clínico en el que se compare un nuevo tratamiento con el tratamiento convencional2.

Este último editorial pretende mostrar la diferencia entre estadísticamente significativo y clínicamente relevante3.

Pongamos como ejemplo una «variable respuesta principal» o «primary endpoint», que en este caso es el cambio desde la visita basal hasta la visita final en el volumen espiratorio forzado en el primer segundo (FEV1)4, por ejemplo, en el contexto comparativo de 2 tratamientos en asma.

Planteando el diseño del ensayo clínico como un ensayo clínico controlado y aleatorizado de 2 brazos paralelos, obtendremos como medida descriptiva la media de la puntuación en el FEV1 en el grupo de intervención y la compararemos con la media en el grupo control, obteniendo la «diferencia de medias entre grupos» en litros o mililitros (mL), que es una variable cuantitativa continua al ser susceptible de tomar valores decimales. En cuanto a test estadísticos, el test t de Student-Fisher es el procedimiento más habitual para comparar ambas medias.

En la figura 1, el umbral para la diferencia mínima clínicamente relevante (+100mL) se muestra con barritas en color negro resaltado, y el umbral de la hipótesis nula clásica de diferencia de mL=0 se muestra con barras y puntos (resaltado en rojo en la versión electrónica del editorial). Cada intervalo de confianza (IC) representa los límites inferior y superior de la verdadera diferencia de medias poblacional de respuesta a los tratamientos (con un 95% de confianza). En los cuatro IC95%, el límite inferior de cada intervalo es mayor que cero. Si dividiéramos la diferencia de medias entre su error estándar, que recordemos que cuantifica el papel del azar en nuestros resultados, comprobaríamos cómo el resultado sería un estadístico «t de Student» mayor que 1,96; con una p<0,05. Así pues, los cuatro IC95% son estadísticamente significativos.

Figura 1.

Interpretación de la relevancia clínica de ejemplos de intervalos de confianza al 95%, en el que se ha establecido el umbral para la diferencia mínima clínicamente relevante en una diferencia de medias en el FEV1 mayor que +100mL. Sig.=estadísticamente significativo (p<0,05).

Que un resultado sea estadísticamente significativo, únicamente va a querer decir que el error estándar es pequeño en comparación con la diferencia de medias. Si el error estándar es lo suficientemente pequeño, nuestros resultados serán siempre estadísticamente significativos, pero ello no implica que necesariamente sean clínicamente relevantes. En este caso, como hemos mencionado, se considera que una diferencia en el FEV1 tiene que ser de al menos 100mL para que tenga un impacto en la calidad de vida de los pacientes.

Siguiendo con el ejemplo de la figura 1, veremos cómo a pesar de que todos los IC95% son estadísticamente significativos, no todos son concluyentes en cuanto a la relevancia clínica del tratamiento. La relevancia crítica se interpreta en base al tamaño del efecto o «effect size» (nuestra diferencia de medias), usando los límites de los IC95% en relación con el umbral delta que se corresponde con la diferencia mínima clínicamente relevante, conocida en inglés como «minimal clinically important difference» (MCID)5,6.

El primer IC95% (ejemplo 1) se corresponde con una diferencia de +50mL, con un límite inferior y uno superior de +25 a +75mL respectivamente (teniendo en cuenta el papel del azar en nuestros resultados con un 95% de confianza). Es decir, el nuevo tratamiento sería mejor que el tratamiento convencional, pero no tanto como para considerarlo clínicamente relevante, porque su límite superior (+75mL) es menor que la diferencia mínima clínicamente relevante de +100mL. Este es el ejemplo paradigmático de cómo algo puede ser estadísticamente significativo, pero clínicamente no relevante.

Recordemos que el error estándar se puede disminuir reduciendo la variabilidad o aumentando el tamaño muestral, luego cualquier diferencia de medias que no sea cero se podrá volver estadísticamente significativa. Una diferencia de medias totalmente irrelevante de 0,05mL será estadísticamente significativa si, por ejemplo, logramos que su error estándar asociado sea de 0,025mL.

Únicamente un IC95% (el del ejemplo 4), además de estadísticamente significativo, es clínicamente relevante de forma concluyente porque su límite inferior es mayor que 100mL. En el ejemplo 2 la mayor parte del intervalo concuerda con la hipótesis de que la diferencia no es clínicamente relevante. En el ejemplo 3 la mayor parte del intervalo concuerda con que el efecto sí es clínicamente relevante. No obstante, al cruzar sendos IC95% el umbral para la diferencia mínima clínicamente relevante, ambos ejemplos serían clínicamente no concluyentes.

Esto mismo se aplica a las medidas de asociación. La relevancia clínica en este caso ha de tenerse siempre en cuenta ante resultados cercanos a 1 en medidas de asociación, y especialmente si se trata de odds ratios, ya que recordemos que esta medida puede sobreestimar la magnitud de la asociación con respecto a otras como la razón de riesgos7.

Así pues, a modo de conclusión, cualquier diferencia de medias que no sea cero, o cualquier medida de asociación que no sea 1, se podrá volver estadísticamente significativa aumentando el tamaño muestral o disminuyendo la variabilidad de los datos. Que un resultado sea estadísticamente significativo no es sinónimo de relevancia clínica, pues no todos los resultados estadísticamente significativos serán clínicamente relevantes, cuya interpretación debe hacerse en base a un umbral específico de relevancia clínica. El problema y las diferentes metodologías a la hora de establecer un umbral para la diferencia mínima clínicamente relevante es motivo de interés científico8,9 y excede las pretensiones de este editorial. Por su utilidad práctica en el caso de la investigación aplicada a enfermedades respiratorias, conviene recordar los cuestionarios de control de síntomas como por ejemplo el Asthma Control Test (ACT, por sus siglas en inglés). Estas herramientas validadas reportan, entre sus características métricas, la llamada «sensibilidad al cambio» o «responsiveness» en inglés10, estableciendo asimismo la diferencia mínima clínicamente relevante que en este caso es de 3 puntos11.

Bibliografía

[1]

M. Santibáñez, J.L. García-Rivero, E. Barreiro.

No se debe empezar la casa por el tejado (si queremos publicar en una revista de impacto).

Arch Bronconeumol., (2019),

http://dx.doi.org/10.1016/j.arbres.2019.05.019

[2]

M. Santibañez, J.L. Garcia-Rivero, E. Barreiro.

p de significación: ¿mejor no usarla si se interpreta mal?.

Arch Bronconeumol, (2019),

http://dx.doi.org/10.1016/j.arbres.2019.11.003

[3]

K.B. Chan, M. Man-Son-Hing, F.J. Molnar, A. Laupa- cis.

How well is the clinical importance of study results reported? An assessment of randomized controlled trials.

CMAJ., 165 (2001), pp. 1197-1202

Medline

[4]

L. Puente Maestú, J. García de Pedro.

Lung function tests in clinical decision-making.

Arch Bronconeumol., 48 (2012), pp. 161-169

[5]

M. Kieser, D. Hauschke.

Assessment of clinical relevance by considering point estimates and associated confidence intervals.

Pharm Stat., 4 (2005), pp. 101-107

[6]

R. Jaeschke, J. Singer, G.H. Guyatt.

Measurement of health status. Ascertaining the minimal clinically important difference.

Control Clin Trials., 10 (1989), pp. 407-415

http://dx.doi.org/10.1016/0197-2456(89)90005-6 | Medline

[7]

A.J. Viera.

Odds ratios and risk ratios: what's the difference and why does it matter?.

South Med J., 101 (2008), pp. 730-734

http://dx.doi.org/10.1097/SMJ.0b013e31817a7ee4 | Medline

[8]

G.H. Guyatt, D. Osoba, A.W. Wu, K.W. Wyrwich, G.R. Norman, Clinical Significance Consensus Meeting Group.

Methods to explain the clinical significance of health status measures.

Mayo Clin Proc., 77 (2002), pp. 371-383

http://dx.doi.org/10.4065/77.4.371 | Medline

[9]

J.A. Sloan.

Assessing the minimally clinically significant difference: scientific considerations, challenges and solutions.

COPD., 2 (2005), pp. 57-62

http://dx.doi.org/10.1081/copd-200053374 | Medline

[10]

M. Schatz, C.A. Sorkness, J.T. Li, P. Marcus, J.J. Murray, R.A. Nathan, et al.

Asthma Control Test: reliability, validity, and responsiveness in patients not previously followed by asthma specialists.

J Allergy Clin Immunol., 117 (2006), pp. 549-556

http://dx.doi.org/10.1016/j.jaci.2006.01.011 | Medline

[11]

M. Schatz, M. Kosinski, A.S. Yarlas, J. Hanlon, M.E. Watson, P. Jhingran.

The minimally important difference of the Asthma Control Test.

J Allergy Clin Immunol., 124 (2009), pp. 719-723

http://dx.doi.org/10.1016/j.jaci.2009.06.053 | Medline

Tools

Publish in

Archivos de Bronconeumología

Free access articles

A 73-Year-Old Female With a 7-Year History of a Growing...

10.1016/j.arbres.2026.01.002

Lessons From the ANTES B+...

10.1016/j.arbres.2025.12.004

Update 2025 of the Spanish COPD Guidelines (GesEPOC):...

Arch Bronconeumol. 2025;61:766-82

Diffuse Alveolar Hemorrhage as a Complication of Severe...

Arch Bronconeumol. 2025;61:380-1

Podcast

Effect of Carbocysteine on Exacerbations and Lung Function in Patients With Mild-to-Moderate Chronic Obstructive Pulmonary Disease: A Multicentre, Double-Blind, Randomized, Placebo-Controlled Trial

Graphical abstract

Archivos de Bronconeumología is a member and subscribes the principles of, the Committee on Publication Ethics (COPE)
www.publicationethics.org.

Archivos de Bronconeumología follows the Recommendations for the Conduct, Reporting, Editing and Publication of Scholarly Work in Medical Journals

¿Estadísticamente significativo o clínicamente Important?

Subscribe to our newsletter