Un algoritmo desarrollado por científicos de la Universidad de California consigue mejores resultados que dos de cada cuatro radiólogos expertos en encontrar pequeñas hemorragias cerebrales en los escáneres de cabeza, un avance que algún día puede ayudar a los médicos a tratar a pacientes con lesiones cerebrales traumáticas, accidentes cerebrovasculares y aneurismas, según publica en la revista científica 'Proceedings of the National Academy of Sciences'.
El aumento continuo en los estudios de diagnóstico por imágenes, incluidos los estudios de imágenes en 3D, como la tomografía computarizada (TC), significa que los radiólogos están mirando miles de imágenes cada día, en busca de pequeñas anomalías que pueden señalar emergencias potencialmente mortales.
Esto podría ser mucho más eficiente, y potencialmente más preciso, si la tecnología de inteligencia artificial pudiera detectar las imágenes con anomalías significativas, por lo que los radiólogos podrían examinarlas más de cerca.
"Queríamos algo que fuera práctico, y para que esta tecnología sea útil clínicamente, el nivel de precisión debe ser casi perfecto", señala Esther Yuh, profesora asociada de Radiología en la UCSF y coautora del estudio.
El algoritmo desarrollado por el equipo tardó solo un segundo endeterminar si un examen completo de la cabeza contenía signos de hemorragia. También trazó los contornos detallados de las anomalías que encontró, demostrando su ubicación dentro de la estructura tridimensional del cerebro.
Algunos puntos pueden ser del orden de 100 píxeles de tamaño, en una pila 3D de imágenes que contienen más de un millón de ellos, e incluso los radiólogos expertos a veces los pierden, con consecuencias potencialmente graves.
El algoritmo encontró algunas pequeñas anormalidades que los expertos no detectaron. También señaló su ubicación dentro del cerebro y los clasificó según el subtipo, información que los médicos necesitan para determinar el mejor tratamiento.
Y el algoritmo proporcionó toda esta información con un nivel aceptable de falsos positivos, minimizando la cantidad de tiempo que los médicos necesitarían dedicar a revisar sus resultados.
Yuh apunta que una de las cosas más difíciles de lograr con la tecnología de inteligencia artificial era la capacidad de determinar si un examen completo, que consistía en una "pila" en 3D de aproximadamente 30 imágenes, era normal.
"Lograr una precisión del 95 por ciento en una sola imagen, o incluso el 99 por ciento, no está bien, porque en una serie de 30 imágenes, hará una llamada incorrecta en uno de cada 2 o 3 escaneos --explica--. Para que esto sea clínicamente útil, debe obtener las 30 imágenes correctas, lo que llamamos precisión del nivel de examen. Si una computadora señala muchos falsos positivos, ralentizará al radiólogo y puede provocar más errores".
Los expertos en radiología dijeron que la capacidad del algoritmo para encontrar anormalidades muy pequeñas y demostrar su ubicación en el cerebro fue un avance sustancial.
"La hemorragia puede ser pequeña y aún ser significativa --precisa Pratik Mukherjee, profesor de radiología en la UCSF--. Eso es lo que hace que el trabajo de un radiólogo sea tan difícil, y es por eso que estas cosas ocasionalmente se pasan por alto. Si un paciente tiene un aneurisma y está empezando a sangrar, y se le envía a casa, puede morir".
Jitendra Malik, profesora de Ingeniería Eléctrica y Ciencias de la Computación en Berkeley, apunta que la clave era elegir qué datos alimentar al modelo. El nuevo estudio hizo uso de un tipo de aprendizaje profundo conocido como una red neuronal totalmente convolucional, o FCN, que entrena algoritmos en un número relativamente pequeño de imágenes, en este caso 4.396 pruebas de TC.
Pero las imágenes de entrenamiento utilizadas por los investigadores estaban llenas de información, porque cada pequeña anomalía se delineaba manualmente a nivel de píxel. La riqueza de estos datos, junto con otros pasos que impidieron que el modelo malinterpretara las variaciones aleatorias o el "ruido" como significativo, creó un algoritmo extremadamente preciso.
Los científicos podrían haber elegido alimentar una pila completa de imágenes, o una imagen completa, todo a la vez. En su lugar, eligieron alimentar solo una parte o "parche" de una imagen a la vez, contextualizando esta imagen con las que precedieron y siguieron directamente en la pila.
Ver una imagen en parches también es cómo las personas leen el texto o miran la pantalla de una computadora, y esto permitió a la red aprender de la información relevante en los datos sin "sobreajustar" el modelo sacando conclusiones basadas en variaciones insignificantes que también estaban presentes en los datos. Llamaron a su modelo PatchFCN.
"Tomamos el enfoque de marcar cada anormalidad, es por eso que teníamos datos mucho, mucho mejores --explica Malik, uno de los autores corresponsales del estudio--. Luego hicimos el mejor uso posible de esos datos. Así es como logramos el éxito".
Malik, un destacado experto en visión por computadora, señala que recibe muchas más solicitudes de colaboración en la investigación de las que puede honrar, pero aceptó trabajar en el proyecto de Yuh y Mukherjee debido a su gran potencial para ayudar a los pacientes.
Los autores ahora están aplicando el algoritmo a las tomografías computarizadas de centros de trauma en todo el país que están inscritos en un estudio de investigación dirigido por Geoffrey Manley, profesor y vicepresidente de neurocirugía de la UCSF.
"Dada la gran cantidad de personas que sufren lesiones cerebrales traumáticas todos los días y son trasladadas al departamento de emergencias, esto tiene una importancia clínica muy grande --apunta Malik--. Eso me convenció para trabajar en este problema".