Por Cristina Espinoza C.
Jocelyn Dunstan
Licenciada y magíster en Física de la U. de Chile, con un doctorado en Matemática Aplicada de la U. de Cambridge, Reino Unido; Jocelyn Dunstan ha realizado gran parte de su investigación ligada a la salud. Primero como postdoc en la Escuela de Salud Pública Johns Hopkins Bloomberg, en EE.UU., y luego como investigadora en la Escuela de Salud Pública de la U. de Chile.
A partir de 2018 dividió su jornada entre el Centro de Informática Médica y Telemedicina de la Facultad de Medicina y el Centro de Modelamiento Matemático (CMM), ambos en la U. de Chile. Desde junio de 2021 es académica de la Iniciativa (y futuro instituto) de Datos e Inteligencia Artificial de la FCFM.
Su interés por la IA en salud partió durante su postdoctorado, cuando decidió que quería trabajar en problemas que tuvieran impacto directo en la gente. Comenzó estudiando la obesidad, usando herramientas de aprendizaje de máquinas, y se fue moviendo hacia la lista de espera en los hospitales nacionales y el análisis del texto libre en medicina, es decir, lo que los doctores escriben en las fichas médicas de sus pacientes. Dado que este texto no es estructurado, se hace muy difícil su uso en herramientas que apoyen la gestión o hagan estadísticas sobre estos datos, “en particular, sería muy útil poder determinar qué caso es más grave”, explica.
Hoy, la académica y su grupo trabajan con cinco millones de casos de la lista de espera en hospitales públicos obtenidos a través de la Ley de Transparencia. “Hemos publicado varios artículos científicos en el área, tanto de clasificación automática de interconsultas como de uso de estos datos para estimar nuevos casos de psoriasis en el país”, cuenta. Su meta es que el Ministerio de Salud acceda a utilizar métodos basados en lenguaje natural para gestionar la lista de espera. “El objetivo de mi Fondecyt es que exista una plataforma online donde revisar la lista de espera, en la que se pueda buscar por región y encontrar la distribución por sexo y edad de una enfermedad, por ejemplo. La idea es apoyar a las personas que toman la decisión para saber qué especialistas se requieren, y que un/a paciente o investigador/a pueda revisar el estado de cierta especialidad o zona geográfica”, agrega.
El trabajo con las listas de espera está dentro del llamado procesamiento en lenguaje natural, un campo de la IA que investiga la manera de comunicarse entre humanos y máquinas. En ese sentido, los avances que se hacen en esta investigación son aplicables también en otras áreas, como la industria financiera o la minera, por ejemplo, donde Dunstan y su equipo también han realizado análisis. “Como grupo estamos, además, haciendo codificación automática de enfermedades. Esto es, no solo identificar cuando se nombra a una enfermedad en un texto, sino asignarle un código internacional. En un proyecto de cinco meses con la Fundación Oncológica FALP hemos sido capaces de codificar tanto el tipo de cáncer como su ubicación, y estamos actualmente trabajando en la identificación de metástasis”, cuenta.
Sobre la creación del nuevo instituto, señala que era algo esperable, considerando la investigación que se realiza en la Facultad. “En términos de docencia es muy importante. Pasaremos a tener una iniciativa que aloje al magíster, donde va a poder avanzar más rápido, para seguir potenciándose”, dice. “En investigación, la Facultad tiene académicos y académicas que se dedican al tema, y si bien ya colaboramos, el que exista esta iniciativa, con reuniones y presupuesto para proyectos, crea redes más estables y una relación más virtuosa entre los que ya hacemos investigación en ciencia de datos e IA”, destaca.
Francisco Förster
Licenciado en Ingeniería Civil y en Astronomía de la FCFM, Francisco Förster partió trabajando en problemas de radiointerferometría —la combinación de radiotelescopios para formar el equivalente a uno de mayor tamaño—, antes de seguir su doctorado en la U. de Oxford, Reino Unido, donde estudió evolución estelar.
Su investigación involucraba mucha matemática y astrofísica teórica, por lo que volvió a Chile con la inquietud de vincularlas con la parte observacional. Lo hizo, primero trabajando en la instalación de un telescopio robótico en Cerro Tololo, luego como investigador postdoctoral y a su llegada al laboratorio de astroinformática del CMM.
Era 2012 y tenían en mente un proyecto que produciría grandes cantidades de datos y que requería habilidades que aún no dominaban: HiTS (High cadence Transient Survey). “Estuvimos como un año preparándonos para recibir datos en tiempo real de una nueva cámara en Cerro Tololo: la Dark Energy Camera, de 500 millones de pixeles, la más grande del Hemisferio Sur, e íbamos a procesar esos datos en tiempo real, usando el NHLPC (Laboratorio Nacional de Computación de Alto Rendimiento)”, cuenta.
El proyecto fue un éxito, se transformaron en el primer grupo del mundo en procesar esos datos en tiempo real descubrieron más de 100 supernovas y desarrollaron varios trabajos de estrellas variables y asteroides.
La gran cantidad de datos obtenidos hasta 2015 siguió produciendo descubrimientos incluso en 2020. Por lo mismo, en 2017 comenzaron a preparar un nuevo proyecto para enfrentar el desafío que se vendría con los nuevos telescopios capaces de detectar cientos de miles de objetos por noche. Así nació ALeRCE (Automatic learning for the rapid classification of events) que posee la infraestructura necesaria para ingerir un gran volumen de datos que llegan desde el telescopio ZTF (Zwicky Transient Facility), EE.UU., que detecta alrededor de 300 mil objetos cambiantes por noche. Los almacenan, curan y procesan en tiempo real, usando machine learning para clasificarlos y habilitarlos para el acceso de la comunidad astronómica.
ALeRCE es un llamado broker astronómico que permite determinar qué objetos resultan más interesantes para hacerles seguimiento con otros telescopios. “Hoy tiene como usuarios a más de 60 países, tenemos un impacto realmente global y estamos compitiendo con los mejores brokers astronómicos”, señala Förster. Ahora, se preparan para el desafío que será el Observatorio Vera Rubin —en construcción en la Región de Coquimbo— capaz de detectar 10 millones de objetos por noche.
Del futuro instituto de la FCFM, espera que pueda hacer avanzar la ciencia de datos a través de grandes proyectos. “Veo muchos paralelos entre lo que hacemos con varios de los problemas que vienen, por ejemplo, con internet de las cosas. Vamos a tener grandes flujos de datos que van a llegar de todos lados; vamos a tener que procesar en tiempo real y tomar decisiones basadas en esos stream de datos. En astronomía, la decisión es observar o no, usando telescopios que pueden ser carísimos, y en internet de las cosas son mil cosas diferentes: si hay una máquina a la que hay que hacer mantención, si hay un posible incendio forestal, el manejo del agua en agricultura, etc. Para analizar el cambio climático también va a ser fundamental”, subraya.
Un ejemplo de interdisciplinariedad y uso de machine learning es lo que lograron con el también académico FCFM Ricardo Finger, para la creación de un sensor que detecta el aumento de CO2 en lugares cerrados, para regular la ventilación y prevenir la transmisión del SARSCoV- 2. El sistema funciona similar al de ALeRCE, ya que también es capaz de analizar streams de datos y gatillar alarmas.
Felipe Tobar
Ingeniero y magíster en Ingeniería Eléctrica de la FCFM, y doctorado en la misma especialidad por el Imperial College London, Felipe Tobar comenzó trabajando en procesamiento de señales, pero durante su doctorado se interesó en el aprendizaje de máquinas, campo que siguió desarrollando durante su postdoctorado en la U. de Cambridge, también en Reino Unido.
En 2015 llegó al CMM a continuar su investigación en aprendizaje de máquinas con aplicaciones en procesamiento estadístico de señales. Pasó a ser académico del Departamento de Ingeniería Matemática en 2018, donde dictó cursos de estadística y de aprendizaje de máquinas; además de cursos avanzados a través del CMM, del que también es investigador hasta hoy. Es investigador asociado del Centro Avanzado de Ingeniería Eléctrica y Electrónica de la U. Santa María y coordinador del Magíster en Data Science, que comienza este semestre en la FCFM.
Su investigación se centra en modelos probabilísticos para series de tiempo, con aplicaciones en generación, imputación, eliminación de ruido, filtrado y estimación espectral. En particular, se ha dedicado al análisis de series de tiempo multicanal tales como el electroencefalograma (EEG), examen que registra la actividad eléctrica en el cuero cabelludo para detectar actividad cerebral. “Analizando esta serie de tiempo de 16 canales, se puede inferir la actividad cerebral y detectar si el o la paciente, por ejemplo un neonato, está sufriendo una convulsión imposible de detectar a simple vista. El análisis es complejo, pues son muchos datos que deben analizarse por segundo y, si bien un/a experto/a del área de la salud puede realizar esta detección, es infactible que lo haga ininterrumpidamente durante horas o días, como es necesario en la práctica”, explica.
En el caso del EEG, el objetivo es desarrollar algoritmos para la identificación de patrones anómalos desde los datos, como los indicativos de una convulsión. “Si bien este es un objetivo ambicioso, nuestra motivación no es necesariamente alcanzar las altas tasas de detección de una o un experto que entiende la naturaleza de la actividad cerebral, por el contrario, esperamos diseñar una metodología que pueda tener una tasa de detección razonable, pero que, a diferencia de los detectores humanos, pueda operar continuamente sin interrupciones”, dice. En este sentido, el objetivo no es reemplazar, sino asistir al humano. “Esto, en el seguimiento de un neonato es importante, porque tienen riesgo de convulsiones y no puedes tener todo el día a médicos monitoreando EEG, pero sí un sistema que detecte cuando ocurra algo remotamente similar a un evento y que active una alarma”, sostiene.
El académico dice estar entusiasmado con la Iniciativa de Datos e Inteligencia Artificial. “La ID&IA será un espacio de encuentro para varios esfuerzos existentes en la FCFM relacionados a la ciencia de datos, de investigadoras/es y profesores/as en distintos departamentos y centros. Desde mi punto de vista, la FCFM se ha posicionado naturalmente como un referente regional en investigación, docencia y transferencia en los temas anteriores, en ese sentido, la ID&IA viene a reconocer estos avances y potenciarlos aún más. Personalmente, veo múltiples oportunidades para crecer como investigador y docente: colaborando con académicas y académicos de la Facultad que son líderes en sus áreas, enseñando y guiando estudiantes en el área de aprendizaje de máquinas, y contribuyendo a una mejor sociedad a través de la FCFM desde mi área de especialización”, enfatiza