El Mayor Zoológico Digital: Modelo Biológico Entrenado con GPUs NVIDIA Identifica Más de Un Millón de Especies

por Zoe Kessler

El primer proyecto de biología computacional de Tanya Berger-Wolf comenzó como una apuesta con una colega: que podría construir un modelo de IA capaz de identificar cebras individuales más rápido que un zoólogo.

Ella ganó.

Ahora, la directora del Translational Data Analytics Institute y profesora en la Universidad Estatal de Ohio, Berger-Wolf aborda todo el reino animal con BioCLIP 2, un modelo base basado en biología entrenado con el conjunto de datos de organismos más grande y diverso hasta la fecha. El modelo se presentó en la conferencia de investigación sobre IA NeurIPS en 2025.

BioCLIP 2 va más allá de extraer información de imágenes. Puede distinguir los rasgos de las especies y determinar relaciones entre especies e interespecies. Por ejemplo, el modelo organizó los pinzones de Darwin por tamaño de pico, sin enseñar el concepto de tamaño, como se muestra en la imagen de abajo.

El diagrama de dispersión muestra cómo BioCLIP 2 organiza los pinzones de Darwin por tamaño de pico de izquierda a derecha.

Estas capacidades permitirán a los investigadores utilizar el modelo tanto como una enciclopedia biológica, una potente plataforma científica como una herramienta de investigación interactiva con capacidades de inferencia para ayudar a abordar un problema actual en biología de la conservación: la deficiencia de datos para ciertas especies.

«Para especies icónicas como las orcas, carecemos de datos suficientes para determinar el tamaño de la población y, para los osos polares, la población es desconocida», dijo Berger-Wolf. «Si no tenemos datos de esas especies, ¿qué esperanza tienen los escarabajos y hongos?»

Los modelos de IA pueden mejorar los esfuerzos de conservación existentes para especies amenazadas y sus hábitats al cubrir esta carencia de deficiencias de datos.

BioCLIP 2 está disponible bajo una licencia de código abierto en Hugging Face, donde se descargó más de 45.000 veces el octubre pasado. Este artículo se basa en el primer modelo BioCLIP, lanzado hace más de un año, que también fue entrenado con GPUs NVIDIA y recibió el premio al Mejor Artículo Estudiantil en la conferencia Computer Vision and Pattern Recognition (CVPR).

El artículo BioCLIP 2 se presentó en NeurIPS, celebrándose del 30 de noviembre al 5 de diciembre en Ciudad de México, y del 2 al 7 de diciembre en San Diego.

Construyendo la Baraja de Tarjetas Biológicas Más Grande Del Mundo

El proyecto comenzó con la compilación de un enorme conjunto de datos, TREEOFLIFE-200M, que comprende 214 millones de imágenes de organismos que abarcan más de 925.000 clases taxonómicas, desde monos hasta gusanos de la harina y magnolias.

Para recopilar esta enorme cantidad de datos, el equipo de Berger-Wolf en el Imageomics Institute colaboró con el Smithsonian Institution, expertos de diversas universidades y otras organizaciones relacionadas con el campo.

Estos investigadores se propusieron descubrir qué ocurriría si entrenaran un modelo biológico con más datos que nunca.

El equipo quería ver si era posible ir «más allá de la ciencia de los organismos individuales hacia la ciencia de los ecosistemas», dijo Berger-Wolf.

Tras 10 días de entrenamiento en 32 GPUs NVIDIA H100, BioCLIP 2 mostró habilidades novedosas, como distinguir entre animales adultos y juveniles, así como entre animales machos y hembras dentro de la especie, sin que se le enseñaran explícitamente estos conceptos.

También estableció asociaciones entre especies relacionadas como entender cómo las cebras se relacionan con otros equids.

«Este modelo aprende que, en todos los niveles de la taxonomía, todas estas imágenes de cebras tienen una etiqueta de género particular, y de estas imágenes de equidos, incluyendo cebras, caballos y burros, tienen un rasgo familiar particular, y así sucesivamente», dijo. «Aprende la jerarquía sin que se la digan, solo a través de estas asociaciones.»

El modelo incluso puede determinar la salud de un organismo basándose en datos de entrenamiento. Por ejemplo, separó hojas sanas de manzana o arándano de hojas enfermas, y también pudo reconocer diferentes tipos de enfermedades al generar el diagrama de dispersión que aparece a continuación.

Los diagramas de dispersión muestran que las especies vegetales están mejor separadas a medida que se entrena el modelo. Las variaciones intraespecie también forman racimos, facilitando su separación.

El equipo de Berger-Wolf utilizó un clúster de 64 GPUs NVIDIA Tensor Core para acelerar el entrenamiento de modelos, además de GPUs individuales Tensor Core para la inferencia.» Modelos base como BioCLIP no serían posibles sin la computación acelerada de NVIDIA», dijo Berger-Wolf.

Gemelos Digitales de la Fauna: El Futuro del Estudio de las Relaciones Entre Ecosistemas

El próximo proyecto de los investigadores es desarrollar un gemelo digital interactivo basado en la fauna salvaje que pueda usarse para visualizar y simular las interacciones ecológicas entre especies, así como sus formas de interactuar con el medio ambiente.

El objetivo es proporcionar una forma segura y sencilla de estudiar las relaciones entre organismos que se producen de forma natural en la naturaleza, minimizando al mismo tiempo el impacto y la perturbación en los ecosistemas.

«El gemelo digital nos permite visualizar las interacciones entre especies y situarlas en contexto, así como jugar los escenarios hipotéticos y probar nuestros modelos sin destruir el entorno real, creando la huella más ligera posible», dijo Berger-Wolf.

El gemelo digital ofrecerá a los científicos la oportunidad de explorar los puntos de vista de las especies que estudian dentro del entorno simulado, abriendo infinitas posibilidades para investigaciones ecológicas más complejas y precisas.

Eventualmente, versiones de esta tecnología podrían incluso desplegarse para uso público, como a través de plataformas interactivas en zoológicos. La gente podía explorar, visualizar y aprender sobre el entorno natural y sus muchas especies desde perspectivas completamente nuevas.

«Se me ponen los pelos de punta solo de imaginar ese escenario de un niño entrando en el zoo y diciendo, vaya, esto es lo que verías si fueras otra cebra de esa manada, o si fueras la arañita sentada en ese rascador», dijo Berger-Wolf.

Descubre más sobre BioCLIP 2.