A bordo del BEAGLE: el uso de GPU permitió realizar un descubrimiento de la historia de la evolución

Nota del editor: Este es uno de los cinco perfiles de los finalistas para el premio Global Impact 2017 de NVIDIA, que proporciona $150.000 a investigadores que usan tecnología de NVIDIA en trabajos revolucionarios relacionados con problemas sociales, humanitarios o ambientales.

El HMS Beagle llevó al naturalista Charles Darwin en un viaje por todo el mundo, que lo ayudó a formar las ideas sobre el proceso de la evolución. Casi dos siglos después, otro BEAGLE ayuda a los científicos a resolver problemas en datos genéticos complejos para avanzar con nuestra comprensión del mundo viviente y, posiblemente, para salvar vidas.

Monkey Flower
Flor-mono

Este es el BEAGLE del Siglo XXI, la sigla, en inglés, corresponde al nombre de la plataforma amplia del Evaluador de probabilidades general para el análisis evolutivo. Es una biblioteca de código abierto y una API que usan GPU de NVIDIA. La velocidad con la que el software puede procesar datos es fundamental para el análisis de datos secuenciales biológicos, como el ADN, que cuenta con el material genético de todos los organismos vivientes y muchos virus, entre ellos, los que causan el SIDA, la gripe y el ébola.

Gracias al procesamiento rápido y preciso de modelos específicos, BEAGLE se convirtió en un componente fundamental en el flujo de trabajo de software para muchos científicos que estudian la historia de la evolución de los organismos. El campo, conocido como inferencia filogenética, abarca desde las bacterias causantes de plagas hasta el estudio de flores-mono que se adaptaron a diferentes regiones geográficas.

Michael Cummings, un profesor del Instituto de Estudios de Computación Avanzados  de la  Universidad de Maryland y su colega Daniel Ayres, quien estuvo a cargo de la programación y el diseño del software, lideraron el desarrollo de BEAGLE.

Gracias a su trabajo, lograron un lugar entre los cinco finalistas para el premio Global Impact 2017 de NVIDIA. Nuestro programa anual de becas que otorga un total de $150.000 está destinado a investigadores que usan tecnología de NVIDIA en trabajos revolucionarios relacionados con problemas sociales, humanitarios o ambientales.

Ponerse al día con la computación

Primero, Cummings tuvo la idea de usar GPU para el análisis filogenético en 2003; sin embargo, en ese momento, los emergentes marcos de trabajo de desarrollo no tenían la capacidad necesaria. En 2007, con la aparición de CUDA de NVIDIA, las GPU para la computación de alto rendimiento y el financiamiento de la National Science Foundation, BEAGLE cobró vida.

El trabajo con conjuntos de datos enormes y que demandan mucho procesamiento en la inferencia filogenética es lento y propenso a encontrarse con obstáculos. Gracias a la capacidad para obtener resultados más rápidamente, los investigadores tienen más posibilidades para ayudar a los organismos de salud en el tratamiento de amenazas.

Las relaciones filogenéticas describen las relaciones evolutivas inferidas entre varias especies biológicas. Piensa en Darwin buscando conexiones entre las variedades pinzones que habitaban las diferentes islas. Los investigadores usaron BEAGLE de forma similar para comprender la dinámica evolutiva de los organismos que, de otra forma, parecían inconexas.

Ebola virus
Virus del Ébola

Rendimiento potente

Ahora, con el potente rendimiento de las GPU en BEAGLE, los científicos pueden usar modelos más complejos y conjuntos de datos más grandes. Esto mejora la calidad de las inferencias en mucho menos tiempo.

“BEAGLE se usa para la inferencia de la historia evolutiva de la gripe y el ébola” dijo Cummings. “Esto les permitió a los científicos probar y descubrir dónde se originaron los brotes, tanto en el aspecto geográfico como temporal.”

La biblioteca BEAGLE es parte del portal de acceso científico CIPRES, un recurso público para análisis filogenéticos. La infraestructura de computación incluye un clúster de procesamiento con tarjetas NVIDIA Tesla K20.

El trabajo más reciente del equipo en la plataforma CUDA usa tarjetas Tesla K40 y Quadro P5000. Aprovechan la gran cantidad de núcleos de procesamiento para realizar los cálculos en paralelo de forma eficiente cuando se implementan los nuevos métodos de computación.

Brotes de enfermedades

Algunos de los programas más usados en biología evolutiva han adoptado la biblioteca BEAGLE, lo que les permite a miles de científicos trabajar en otros virus causantes de enfermedades, como el VIH, el dengue o la fiebre aftosa.

Los estudios incluyen la transmisión atmosférica del virus del Dengue en Brasil, varios episodios de poliovirus en Nigeria y epidemias globales de la bacteria resistente a los medicamentos que causa la gastritis.

BEAGLE se usó en la población animal para estudiar la caracterización de los virus de la gripe porcina en América del Norte, la relación de la migración de aves acuáticas con la gripe en Corea y la dinámica de la rabia transmitida por murciélagos vampiro en Argentina, solo para nombrar algunas aplicaciones.

Vampire Bat
Murciélago vampiro

“BEAGLE se usó en diferentes estudios para contribuir al conocimiento sobre la evolución y la biología, lo que permite tomar decisiones con más información”, dijo Ayres. “El rendimiento que ofrecen las GPU es muy importante en la epidemiología, donde es necesario caracterizar agentes de enfermedades que se transmiten rápidamente.”

Cummings y Ayres ahora se concentran en aprovechar al máximo las potentes arquitecturas de los procesadores Pascal y Volta (de próxima aparición) de NVIDIA, para desarrollar nuevas formas de incrementar aún más el rendimiento. El proyecto BEAGLE recibió el aporte de diferentes científicos; por ejemplo Marc Suchard, un profesor de la UCLA, y Andrew Rambaut, un profesor de la Universidad de Edimburgo, contribuyeron a su desarrollo.

El ganador del premio Global Impact 2017 será anunciado en el evento GPU Technology Conference, que se realizará del 8 al 11 de mayo en Silicon Valley. Para registrarte en la conferencia, visita la página de registro de GTC.

Otro de los finalistas del premio Global Impact 2017 es el Instituto de Tecnología Guwahati en India.

Conoce el trabajo del ganador del premio Global Impact del año pasado.

Podcast de inteligencia artificial: el aprendizaje profundo descubre un pájaro extinto

Si te interesa la forma en que interactúan la tecnología y la biología, tienes que escuchar este episodio de nuestro podcast de inteligencia artificial. Hablamos con Matthew McKown, CEO de Conservation Metrics, acerca de la forma en que las técnicas de aprendizaje profundo ayudaron a redescubrir una especie de pájaro que se creía extinta y la forma en que la inteligencia artificial con la tecnología de las GPU permiten que los biologistas procesen enormes cantidades de datos para detectar tendencias, un logro imposible hasta el día de hoy.

Blogs similares