Aprendizaje profundo
¿la atención oftalmológica del futuro ?
Prof. Dr. Leopold Schmetterer, Dr. Luciano Daniel Scorsetti y Prof. Dr. Daniel H. Scorsetti
Prof. Dr. Daniel H. Scorsetti
scorsettu@gmail.com
Recibido: 29/10/2021
Aceptado: 29/11/2021
Disponible en www.sao.org.ar
Arch. Argent. Oftalmol. 2021; 19: 7-10
INTRODUCCIÓN
El aprendizaje profundo es un tipo de inteligencia artificial computarizada que tiene como objetivo entrenar a una computadora para que realice tareas que normalmente realizan los humanos basándose en redes neuronales artificiales. Los avances tecnológicos recientes han demostrado que las redes neuronales artificiales se pueden aplicar a campos como el reconocimiento de voz y audio, la traducción automática, los juegos de mesa, el diseño de fármacos y el análisis de imágenes médicas. El desarrollo de estas técnicas ha sido extremadamente rápido en los últimos años y las redes neuronales artificiales hoy en día superan a los humanos en muchas de estas tareas. Las redes neuronales artificiales se inspiraron en la función de sistemas biológicos como el cerebro y los nodos conectados dentro de estas redes que modelan las neuronas. El principio de tales redes es que están capacitadas con conjuntos de datos donde se conoce la verdad fundamental. Como ejemplo, la red debe estar capacitada para identificar imágenes donde se representa una bicicleta. Esto requiere una gran cantidad de imágenes donde las bicicletas se etiquetan manualmente (la llamada verdad fundamental) que luego son analizadas por la computadora. Si se utilizan suficientes imágenes con bicicleta o sin bicicleta, la red neuronal artificial puede entrenarse para identificar bicicletas en otros conjuntos de imágenes.
En las imágenes médicas, los enfoques clásicos incluyen la extracción de características semánticas definidas por expertos humanos o características agonísticas definidas por ecuaciones. Las características semánticas pueden proporcionar una buena especificidad para el diagnóstico de enfermedades, pero pueden diferir entre diferentes médicos dependiendo de su nivel de experiencia, requieren mucho tiempo y son costosas. Las características agonísticas pueden tener una especificidad limitada, pero ofrecen la ventaja de una alta reproducibilidad. El aprendizaje profundo tiene un enfoque diferente. Se requiere un conjunto de datos de entrenamiento donde se conoce la verdad básica, en este caso el diagnóstico. El número de datos necesarios es elevado y, por lo general, se utilizan 100.000 imágenes o más. Una vez que se entrena la red neuronal artificial, se puede aplicar a un conjunto de datos de validación en el que también se conoce el diagnóstico, pero no se informa a la computadora. La salida de la red neuronal artificial es, en el caso más simple, una enfermedad o ninguna enfermedad que pueda compararse con la verdad fundamental. La concordancia con la verdad del terreno se cuantifica utilizando medidas como el área bajo la curva (AUC, puede tomar valores entre 0 y 1, siendo 1 la discriminación perfecta entre salud y enfermedad), especificidad (puede tomar valores entre 0% y 100% y la proporción de negativos reales que se identifican correctamente) y la sensibilidad (puede tomar valores entre 0% y 100% y cuantifica la proporción de positivos reales que se identifican correctamente). Si se requiere una alta sensibilidad o una alta especificidad depende de la enfermedad, la prevalencia de la enfermedad, así como el entorno clínico real donde se debe emplear esta red.
Aprendizaje profundo en enfermedades oculares
Mediante el uso de fotografías del fondo de ojo de la retina de pacientes diabéticos, varios autores han demostrado que los algoritmos basados en el aprendizaje profundo proporcionan un rendimiento excelente para detectar la retinopatía diabética referible. El primer estudio que mostró un alto rendimiento fue publicado por Google e incluyó más de 120000 imágenes en el conjunto de datos de entrenamiento (Gulshan et al. 2016). Posteriormente, varios autores informaron sobre redes neuronales convolucionales que mostraban un alto poder discriminativo para la retinopatía diabética basándose en fotografías del fondo de ojo (Ting et al.2017, Gargeya y Leng 2017). Sin embargo, la comparación directa entre el desempeño informado en esta publicación es difícil, ya que esto puede depender en gran medida de las características de la población de estudio, incluida la etnia, la gravedad de la enfermedad, el estándar de referencia definido como calificado por los especialistas en retina (verdad básica) y la calidad de la las fotografías del fondo de ojo. Recientemente, también se demostró que las redes neuronales convolucionales también pueden reemplazar la clasificación humana en estudios clínicos que incluyen conjuntos de datos epidemiológicos (Ting et al. 2019a). Mientras que la mayoría de las características de la retinopatía diabética se pueden descubrir a partir de fotografías del fondo de ojo, el edema macular diabético puede requerir enfoques basados en la tomografía de coherencia óptica (OCT) (Roy et al.2017, Schlegl et al.2018).
En la degeneración macular relacionada con la edad, la definición de enfermedad referible no es tan sencilla como en la retinopatía diabética, porque varios sistemas de clasificación de la enfermedad se han propuesto (Ferris et al. 2013, Klein et al. 2014). Los sistemas de clasificación basados en aprendizaje profundo fueron propuestos para la referenciabilidad (Burlina et al., 2017), así como la estimación del riesgo de conversión a 5 años
a AMD en etapa tardía (Burlina et al.2018). Se requieren más esfuerzos para aclarar cómo tales sistemas se puede implementar en la práctica clínica. Un estudio utilizó el aprendizaje profundo para predecir el resultado después del tratamiento anti-VEGF y encontró que la cantidad de líquido intrarretiniano está asociada con agudeza visual basal, así como el resultado visual después de 12 meses (Schmidt-Erfurth et al. 2018a). No se ha demostrado si los criterios de retratamiento basados en inteligencia artificial para inyecciones de anti-VEGF pueden ser utilizado para orientar la frecuencia del tratamiento.
En el glaucoma, los enfoques de inteligencia artificial aún están en sus inicios. Esto está parcialmente relacionado con las dificultades para definir la enfermedad en base a medidas estructurales y funcionales (Casson et al. 2012) y se refleja en la incertidumbre del diagnóstico clínico que define a los pacientes como sospechosos de glaucoma y les hace un seguimiento longitudinal para determinar el diagnóstico. Se publicaron enfoques basados en fotografías del disco óptico que muestran suficiente especificidad y sensibilidad (Shibata et al.2018), pero es poco probable que los complejos cambios morfológicos en la cabeza del nervio óptico que son característicos del glaucoma puedan detectarse adecuadamente con una técnica de imagen bidimensional. Para los enfoques de inteligencia artificial basados en OCT para el glaucoma se han utilizado tanto exploraciones maculares (Asaoka et al. 2019) como exploraciones del disco óptico (Maetschke et al. 2019), pero el número de imágenes incluidas es relativamente pequeño y los algoritmos aún no se han validado en poblaciones multiétnicas a gran escala. Alternativamente, los datos del campo visual se pueden usar para entrenar redes neuronales convolucionales y se han propuesto diferentes enfoques (Cai et al.2017, Wang et al.2018), pero la alta variabilidad de los datos aún limita la aplicabilidad clínica. Las aplicaciones de los enfoques de inteligencia artificial para el glaucoma no son sencillas. Hasta ahora, la detección del glaucoma se ha considerado poco rentable (Momont y Mills 2013) y aún no se ha demostrado si se pueden emplear enfoques de aprendizaje profundo para programas rentables. Como se mencionó anteriormente, el diagnóstico en el glaucoma es una tarea clínica compleja que incluye muchas modalidades de examen diferentes y es poco probable que sea reemplazada por aprendizaje profundo en un futuro próximo. El análisis de progresión puede ser un área atractiva para el uso de enfoques de aprendizaje profundo, pero basar las decisiones de tratamiento en la inteligencia artificial requerirá principalmente ensayos controlados aleatorios.
Los algoritmos de inteligencia artificial no solo se pueden utilizar para la clasificación de enfermedades, sino también para la segmentación de imágenes y la mejora de la calidad de la imágen. Para el desarrollo de algoritmos de segmentación de aprendizaje profundo, se requiere un conjunto de datos a gran escala de imágenes anotadas manualmente que puedan servir como verdad fundamental. Se han descrito algoritmos para la segmentación del líquido intrarretiniano en imágenes de OCT (Lee et al., 2017) y la segmentación del desprendimiento del epitelio pigmentario (Xu et al., 2017, Schmidt-Erfurth et al., 2018a). También se han propuesto algoritmos de segmentación para la región de la cabeza del nervio óptico con especial énfasis en el glaucoma (Devalla et al.2018a, b) y la córnea en un esfuerzo por la detección temprana del queratocono (Bata et al.2016, D’Aranha et al. 2019). El aprendizaje profundo también se ha utilizado para eliminar el ruido de las imágenes OCT (Halupka et al. 2018), produciendo así artificialmente imágenes de alta calidad a partir de escaneos OCT de baja calidad. Dado que estas redes se han entrenado en exploraciones de sujetos sanos, todavía no está claro si se pueden aplicar con éxito a imágenes de pacientes con patología de la retina y / o la cabeza del nervio óptico.
CONCLUSIONES
La inteligencia artificial revolucionará la atención oftalmológica en el siglo XXI. Sigue siendo necesario definir mejor cómo se utilizarán estas redes neuronales convolucionales en la rutina clínica. La aplicación más avanzada es el uso en programas de detección de retinopatía diabética para identificar a los pacientes que tienen un alto riesgo de ceguera. Para obtener más información, se remite al lector a algunas revisiones en profundidad recientes que brindan más detalles sobre los detalles técnicos y las aplicaciones clínicas de esta innovación (Schmidt Erfurth et al. 2018b, Ting et al. 2019b, c).
BIBLIOGRAFÍA