Planeta Grande, Datos Más Grandes: el Centro de Investigación del Reino Unido Avanza en la Ciencia Ambiental con la IA

El Servicio de Adquisición y Análisis de Datos de Observación de la Tierra de NERC reduce el tiempo de entrenamiento de meses a días gracias a los sistemas NVIDIA DGX.
por Emily Bryce

El cambio climático es un gran problema y los grandes problemas requieren big data para comprenderlos.

Pocos centros de investigación adoptan una perspectiva más amplia de las ciencias ambientales que el Servicio de Adquisición y Análisis de Datos de Observación de la Tierra de NERC (NEODAAS). Desde la década de 1990, el servicio, parte del Consejo de Investigación del Medio Ambiente del Reino Unido y supervisado por el Centro Nacional de Observación de la Tierra (NCEO), ha puesto a disposición de los investigadores los datos de observación de la Tierra recopilados por cientos de satélites.

El equipo de NEODAAS, con sede en el Laboratorio Marino de Plymouth en el Reino Unido, apoya la investigación de vanguardia que abre nuevas formas de analizar los datos de observación de la Tierra con deep learning. Para lograr esta tarea, utilizan los sistemas NVIDIA DGX como parte del Clúster de Unidades de Procesamiento Gráfico Masivo para la Observación de la Tierra (MAGEO).

Gracias a la plataforma de computación acelerada de NVIDIA, ahora logran analizar estos tesoros de datos más rápido de lo que se creía posible.

La Tierra Bajo Observación

Más de 10 TB de datos de observación de la Tierra se recopilan diariamente mediante sensores en más de 150 satélites que orbitan el planeta. Procesar y analizar esto requiere una enorme cantidad de potencia de computación.

Para facilitar la aplicación del deep learning a estos datos y obtener información valiosa sobre la salud del planeta, NEODAAS instaló MAGEO. El gran clúster de computación acelerada consta de cinco sistemas NVIDIA DGX-1, interconectados con la red NVIDIA Mellanox InfiniBand y conectados a 0.5 PB de almacenamiento dedicado.

MAGEO fue financiado a través de una oferta de capital transformacional del Consejo de Investigación del Medio Ambiente Natural (NERC) en 2019 para proporcionar a NEODAAS la capacidad de aplicar deep learning y otros algoritmos, que se benefician de una gran cantidad de cores de las GPU de NVIDIA, en los datos de observación de la Tierra. El clúster se opera como un servicio, con investigadores capaces de hacer uso del poder de computación y la experiencia del personal de NEODAAS.

“MAGEO ofrece una excelente oportunidad para acelerar la investigación de inteligencia artificial e inteligencia ambiental”, dijo Stephen Goult, científico de datos del Laboratorio Marino de Plymouth. “Su proximidad al archivo de NEODAAS permite la creación rápida de prototipos y el entrenamiento con grandes cantidades de datos satelitales, lo que finalmente transformará la forma en que usamos y entendemos los datos de observación de la Tierra”.

Con los sistemas NVIDIA DGX, el equipo de NEODAAS puede realizar tipos de análisis que, de otro modo, no serían factibles. También permite al equipo acelerar su investigación de forma espectacular, ya que reduce el tiempo de entrenamiento de meses a días.

Además, NEODAAS recibió fondos para apoyar la ejecución de un curso del Deep Learning Institute de NVIDIA, que se puso a disposición de los miembros del Centro Nacional de Observación de la Tierra en marzo, para fomentar el desarrollo y la capacitación de la inteligencia artificial en los campos de observación ambiental y de la Tierra.

“El curso fue un gran éxito: los participantes se fueron sintiéndose bien informados y entusiasmados acerca de la aplicación de la IA en sus áreas de investigación”, dijo Goult. “Las conversaciones mantenidas durante el curso han dado como resultado la generación de varios proyectos nuevos que aprovechan la IA para resolver problemas en el espacio de observación de la Tierra”.

Transformar la Detección de Clorofila

Usando MAGEO, el equipo de NEODAAS también colaboró en nuevos enfoques que han destacado conocimientos esenciales sobre la naturaleza de los datos de observación de la Tierra.

Uno de esos éxitos implica el desarrollo de un nuevo detector de clorofila para ayudar a monitorear las concentraciones de fitoplancton en los océanos de la Tierra.

El fitoplancton microscópico es una fuente de alimento para una amplia variedad de vida oceánica, que sustenta todo, desde un pequeño zooplancton hasta gigantescas ballenas azules. Pero también sirven para otro propósito que es beneficioso para la salud del planeta.

Como cualquier planta que crece en la tierra, usan clorofila para capturar la luz solar, que luego convierten en energía química a través de la fotosíntesis. Durante la fotosíntesis, el fitoplancton consume dióxido de carbono. El subproducto de carbono de este proceso se transporta al fondo del océano cuando el fitoplancton muere o se transporta a otras capas cuando se consume el fitoplancton.

Anualmente, el fitoplancton transfiere alrededor de 10 gigatoneladas de carbono de la atmósfera a las profundidades del océano. Dado que los altos niveles de CO2 son uno de los principales contribuyentes al cambio climático, el fitoplancton es crucial para reducir el CO2 atmosférico y los efectos del cambio climático. Incluso una pequeña reducción en el crecimiento del fitoplancton podría tener consecuencias devastadoras.

Utilizando MAGEO, NEODAAS trabajó con científicos para desarrollar y entrenar una red neuronal que ha permitido una nueva forma para detectar la clorofila que permite estudiar la abundancia de fitoplancton a escala global. La técnica utiliza datos del coeficiente de atenuación del haz de partículas, calculado por la pérdida de energía de un haz de luz que viaja en el agua de mar debido a la presencia de partículas en suspensión.

La técnica significa que los científicos pueden hacer mediciones precisas de clorofila mucho más baratas y rápidas, utilizando una cantidad significativamente mayor de datos, que con el enfoque de laboratorio existente, que alguna vez se consideró el «estándar de oro» de la cromatografía líquida de alto rendimiento.

“Gracias al entorno altamente paralelo y el rendimiento computacional impulsado por NVIDIA NVLink y la arquitectura Tensor Core de los sistemas NVIDIA DGX, el trabajo que habría tomado 16 meses con una sola GPU, ahora tomó 10 días en MAGEO”, dijo Sebastian Graban, estudiante de colocación industrial en el Laboratorio Marino de Plymouth. “La red neuronal entrenada resultante puede predecir la clorofila con una precisión muy alta y proporcionará a los expertos un método mejorado y más rápido para monitorear el fitoplancton”.

Obtén más información sobre los sistemas NVIDIA DGX y cómo la computación por GPU está acelerando la ciencia.

Crédito de la imagen: Laboratorio Marino de Plymouth. Contiene datos de Copernicus Sentinel modificados [2016]