Inteligencia artificial en radiología torácica. ¿Un reto en tiempos de la COVID-19?

Corbacho Abelaira, María Dolores; Ruano-Ravina, Alberto; Fernández-Villar, Alberto

doi:10.1016/j.arbres.2020.10.008

Archivos de Bronconeumología

ISSN: 0300-2896

Archivos de Bronconeumologia is an international journal that publishes original studies whose content is based upon results of research initiatives dealing with several aspects of respiratory medicine including epidemiology, respiratory physiology, pathophysiology of respiratory diseases, clinical management, thoracic surgery, pediatric lung diseases, respiratory critical care, respiratory allergy and translational research. Other types of articles such as editorials, reviews, and different types of letters are also published in the journal. Additionally, the journal expresses the voice of the following scientific societies: the Spanish Respiratory Society of Pneumology and Thoracic Surgery (SEPAR; https://www.separ.es/), the Latin American Thoracic Society (ALAT; https://alatorax.org/), and the Iberian American Association of Thoracic Surgery (AIACT; http://www.aiatorax.com/).

It is a monthly journal in which all manuscripts are sent to peer-review and handled by the editor or an associate editor from the team and the final decision is made on the basis of the comments from the expert reviewers and the editors. The journal is published solely in English. All the published data is composed of novel manuscripts not previously published in any other journal and not being in consideration for publication in any other journal..

The journal is indexed at Science Citation Index Expanded, Medline/Pubmed, Embase and SCOPUS. Access to any published article is possible through the journal's web page as well as from Pubmed, ScienceDirect, and other international databases. Furthermore, the journal is also present in X, Facebook and Linkedin. Manuscripts can be submitted electronically using the following web site: https://www.editorialmanager.com/ARBR/.

Indexed in:

Medline, Science Citation Index Expanded (SCIE)

En los últimos años, la inteligencia artificial y el aprendizaje profundo (DL, acrónimo del inglés, deep learning), se han convertido en tecnologías de gran interés en el campo de la medicina. El DL forma parte del aprendizaje automático basado en algoritmos con estructura de red neuronal multicapa, inspirado en el cerebro humano. Aunque no es un concepto nuevo, el rápido crecimiento de la informática y la disponibilidad de conjuntos de datos etiquetados de imágenes torácicas han facilitado su éxito y podrían alterar significativamente la forma en que se practica la medicina. Estos algoritmos son capaces de aprender de sus errores y de reorganizar sus redes neuronales, con lo que, igual que los seres humanos, están sometidos a un constante aprendizaje1. La radiografía de tórax y la tomografía computarizada, 2pilares de la radiología torácica, han sido de las modalidades de imagen más investigadas y han ido superando limitaciones de otras técnicas más convencionales al proporcionar interpretabilidad, transparencia, reproducibilidad y un alto rendimiento para alcanzar la credibilidad de los radiólogos, que las implementan en su práctica clínica2.

Con la evidente reducción de la mortalidad por cáncer de pulmón después de la detección de nódulos pulmonares con tomografía computarizada de tórax de baja dosis, clasificar o categorizar los nódulos con apoyo de DL reduce la variabilidad, mejora el rendimiento de los radiólogos y mejora también la clasificación de los pacientes en aquellos con cáncer de pulmón o sin él3. Más desafío supone su diagnóstico precoz en radiografía de tórax, en la que el DL detecta nódulos malignos con aceptables resultados y, a pesar de las limitaciones por los falsos positivos y superposiciones entre enfermedades torácicas, puede llegar a superar a los radiólogos y mejorar su rendimiento4.

En el estudio de las infecciones respiratorias, estas tecnologías han despertado gran interés. La Organización Mundial de la Salud recomienda la detección sistemática de tuberculosis activa en poblaciones de alto riesgo para reducir su carga mundial, pero, en muchos países con alta prevalencia, el número de radiólogos expertos es limitado. El DL ha mostrado rendimientos prometedores5, con áreas bajo la curva ROC que han llegado al 0,99 en algunas experiencias y al superar a los radiólogos torácicos, quienes mejoran su rendimiento después de revisar los resultados del algoritmo. De la misma forma, la Organización Mundial de la Salud destaca el valor potencial de esta herramienta6 con base en resultados similares obtenidos en la detección de neumonías. Una revisión actual plasma como la inteligencia artificial ha contribuido a mejorar el diagnóstico de la COVID-19, en la que ha conseguido excelentes precisiones, incluso en validaciones externas, lo que hace pensar en la posibilidad de su generalización7.

Sin embargo, algoritmos específicos para una sola enfermedad o huella radiológica pueden tener un valor limitado en la práctica clínica real, ya que la interpretación radiológica requiere la evaluación de diversas enfermedades y anomalías. Entrenar un algoritmo para cubrir todas las enfermedades que se pueden encontrar es casi imposible y la diferenciación de varias anormalidades puede ser una tarea difícil debido a hallazgos radiológicos superpuestos. Aun así, estos podrían ayudar a detectar múltiples enfermedades, incluso para los que no fueron dirigidos, con sensibilidades altas y un nivel de rendimiento comparable al de los radiólogos6, sobre todo, al de los médicos residentes de Radiología durante el desempeño de las guardias8.

Otro aspecto importante lo constituye la predicción del pronóstico del paciente o de la respuesta terapéutica. Los algoritmos permiten actuar como biomarcadores cuantitativos, en muchos casos con técnicas de segmentación (separación de la lesión del tejido adyacente), con una cuantificación automática que resulta lenta cuando es manual y que es casi imposible en la práctica diaria. Esta aumentaría la eficacia en la predicción de los radiólogos al evaluar cambios en el porcentaje de opacificación pulmonar comparando de forma evolutiva la progresión y eliminando, potencialmente, la subjetividad en la evaluación de los hallazgos9. Estos sistemas pueden ayudar a clasificar pacientes con diferentes etapas de enfermedad pulmonar obstructiva crónica o a predecir la aparición de agudizaciones y muerte10 o la estancia hospitalaria de pacientes infectados con coronavirus11.

De igual modo, los algoritmos podrían utilizarse para favorecer flujos de trabajo de imágenes que disminuyan el contacto con el paciente, optimicen la calidad de la imagen, mejoren la reproducibilidad de los protocolos técnicos, minimicen la dosis de radiación y racionalicen la dotación de personal, lo que reducirá los costes12. La integración de estos algoritmos puede hacerse verificando los hallazgos de forma simultánea, como segunda lectura del radiólogo a la interpretación provisional del algoritmo y posibilitando priorizar la lista de trabajo en términos de la gravedad de la enfermedad o de las anormalidades y reduciendo el tiempo de respuesta; también podrían emplearse en la preselección de exámenes negativos para priorizar la lista de trabajo y que los radiólogos interpretasen los exámenes positivos o no concluyentes13.

Para que un algoritmo reciba crédito y aceptación, debe explicar cómo ha llegado a los resultados (problema de «capas ocultas»), generalmente, utilizando un mapa de prominencia14 que destaca las áreas específicas de la imagen que contribuyeron a la salida final del algoritmo. Otro problema lo constituye el volumen y calidad de los datos empleados (se producirán malos resultados si los modelos se entrenan con datos no representativos), ya que la población real puede tener una prevalencia de enfermedad mucho más baja y un espectro mucho más amplio de enfermedades, algunas de las cuales pueden no estar cubiertas durante el desarrollo del algoritmo8. El gran desafío en el diagnóstico médico es la accesibilidad limitada de las imágenes médicas disponibles públicamente.

Otro tipo de problemas son los éticos, que pueden surgir del uso de datos de pacientes para entrenar estos sistemas de inteligencia artificial, o los que se plantean con base en la posible responsabilidad derivada de decisiones basadas en un algoritmo de inteligencia artificial15.

Como se ha descrito, cuando los humanos y la inteligencia artificial trabajan juntos, el rendimiento diagnóstico mejora, aunque esto no significa necesariamente mejores resultados para el paciente. Se debe buscar un diagnóstico integrado, con el potencial de personalizar aún más la atención médica, mucho más allá de lo que sería posible solo con aplicaciones de imágenes, estableciendo factores de enfermedad individualizados y decisiones personalizadas de tratamiento.

Bibliografía

[1]

E.J. Topol.

High-performance medicine: The convergence of human and artificial intelligence.

Nat Med, 25 (2019 Jan), pp. 44-56

http://dx.doi.org/10.1038/s41591-018-0300-7 | Medline

[2]

D.L. Rubin.

Artificial intelligence in imaging: The radiologist's role.

J Am Coll Radiol., 16 (2019 Sep), pp. 1309-17

[3]

D. Ardila, A.P. Kiraly, S. Bharadwaj, B. Choi, J.J. Reicher, L. Peng, et al.

End-to-end lung cancer screening with three-dimensional deep learning on low-dose chest computed tomography.

Nat Med., 25 (2019), pp. 954-961

http://dx.doi.org/10.1038/s41591-019-0447-x | Medline

[4]

J.G. Nam, S. Park, E.J. Hwang, J.H. Lee, K.-N. Jin, K.Y. Lim, et al.

Development and validation of deep learning–based automatic detection algorithm for malignant pulmonary nodules on chest radiographs.

Radiology., 290 (2019 Jan), pp. 218-228

http://dx.doi.org/10.1148/radiol.2018180237 | Medline

[5]

E.J. Hwang, S. Park, K.-N. Jin, J.I. Kim, S.Y. Choi, J.H. Lee, et al.

Development and validation of a deep learning-based automatic detection algorithm for active pulmonary tuberculosis on chest radiographs.

Clin Infect Dis Off Publ Infect Dis Soc Am., 16 (2019), pp. 739-747

[6]

P. Rajpurkar, J. Irvin, R.L. Ball, K. Zhu, B. Yang, H. Mehta, et al.

Deep learning for chest radiograph diagnosis: A retrospective comparison of the CheXNeXt algorithm to practicing radiologists.

PLoS Med., 15 (2018), pp. e1002686

http://dx.doi.org/10.1371/journal.pmed.1002686 | Medline

[7]

H. Swapnarekha, H.S. Behera, J. Nayak, B. Naik.

Role of intelligent computing in COVID-19 prognosis: A state-of-the-art review.

Chaos Solitons Fractals., 138 (2020 Sep), pp. 109947

http://dx.doi.org/10.1016/j.chaos.2020.109947 | Medline

[8]

E.J. Hwang, J.G. Nam, W.H. Lim, S.J. Park, Y.S. Jeong, J.H. Kang, et al.

Deep learning for chest radiograph diagnosis in the emergency department.

Radiology., 293 (2019), pp. 573-580

http://dx.doi.org/10.1148/radiol.2019191225 | Medline

[9]

C.-J. Huang, Y.-H. Chen, Y. Ma, P.-H. Kuo.

Multiple-input deep convolutional neural network model for COVID-19 forecasting in China.

Infect Dis, (2020),

[10]

G. González, S.Y. Ash, G. Vegas-Sánchez-Ferrero, J. Onieva Onieva, F.N. Rahaghi, J.C. Ross, et al.

Disease staging and prognosis in smokers using deep learning in chest computed tomography.

Am J Respir Crit Care Med., 15 (2018), pp. 193-203

[11]

X. Qi, Z. Jiang, Q. Yu, C. Shao, H. Zhang, H. Yue, et al.

Machine learning-based CT radiomics model for predicting hospital stay in patients with pneumonia associated with SARS-CoV-2 infection: A multicenter study [Internet]. Infectious Diseases (except HIV/AIDS), (2020),

[12]

P. Lakhani, A.B. Prater, R.K. Hutson, K.P. Andriole, K.J. Dreyer, J. Morey, et al.

Machine learning in radiology: Applications beyond image interpretation.

J Am Coll Radiol, 15 (2018), pp. 350-359

http://dx.doi.org/10.1016/j.jacr.2017.09.044 | Medline

[13]

E.J. Hwang, C.M. Park.

Clinical implementation of deep learning in thoracic radiology: Potential applications and challenges.

Korean J Radiol., 21 (2020 May), pp. 511-525

http://dx.doi.org/10.3348/kjr.2019.0821 | Medline

[14]

J. Choo, S. Liu.