¿Qué Es un Modelo de Machine Learning?

Cuando compras un coche, la primera pregunta es qué modelo necesitas: un Honda Civic para viajes de bajo costo, un Chevy Corvette para verse bien y moverse rápido, o tal vez una Ford F-150 para mover cargas pesadas.

Para el viaje a la IA (la tecnología más transformadora de nuestro tiempo), el motor que necesitas es un modelo de machine learning.

¿Qué Es un Modelo de ML?

Un modelo de machine learning es una expresión de un algoritmo que analiza montañas de datos para encontrar patrones o realizar predicciones. Impulsados por los datos, los modelos de ML son los motores matemáticos de la IA.

Por ejemplo, un modelo de ML para la visión de computación podría ser capaz de identificar automóviles y peatones en un video en tiempo real. Un modelo para el procesamiento de idiomas naturales podría traducir palabras y oraciones.

En el trasfondo, un modelo de machine learning es una representación matemática de los objetos y sus relaciones entre sí. Los objetos pueden ser cualquier cosa, desde un «me gusta» en una publicación de redes sociales hasta moléculas en un experimento de laboratorio.

Modelos de ML para Cada Propósito

Dado que no existen restricciones para los objetos que pueden convertirse en características de un modelo de ML, no hay límite para los usos de la IA. Las combinaciones son infinitas.

Los científicos de datos han creado familias enteras de modelos de machine learning para diferentes usos, y hay más en proceso.

Una breve taxonomía de los modelos de ML
Tipo de Modelo ML	Casos de Usos
Regresión/clasificación lineal	Patrones en datos numéricos, como hojas de cálculo financieras
Modelos gráficos	Detección de fraude o conciencia de sentimiento
Árboles de decisión/Bosques aleatorios	Predecir resultados
Redes neuronales de deep learning	Visión por computadora, procesamiento del lenguaje natural y más

Por ejemplo, los modelos lineales utilizan el álgebra para predecir las relaciones entre las variables de las proyecciones financieras. Los modelos gráficos expresan como diagramas una probabilidad, como si un consumidor elegirá comprar un producto. Tomando prestada la metáfora de las ramas, algunos modelos de ML toman la forma de árboles de decisión o grupos de árboles llamados bosques aleatorios.

En el Big Bang de la IA en 2012, los investigadores encontraron que el deep learning era una de las técnicas más exitosas para encontrar patrones y hacer predicciones. Utiliza una especie de modelo de machine learning llamado red neuronal porque se inspiró en los patrones y funciones de las células cerebrales.

Un Modelo de ML para las Masas

El deep learning tomó su nombre de la estructura de sus modelos de machine learning. Apilan capa tras capa de características y sus relaciones, formando un sándwich de héroe matemático.

Gracias a su asombrosa precisión en la búsqueda de patrones, dos tipos de modelos de deep learning, descritos en una explicación separada, están apareciendo en todas partes.

Las redes neuronales convolucionales (CNN), a menudo utilizadas en la visión de computación, actúan como ojos en los vehículos autónomos y pueden ayudar a detectar enfermedades en las imágenes médicas. Las redes neuronales recurrentes (RNN) y los transformadores, sintonizados para analizar el lenguaje hablado y escrito, son los motores de Alexa de Amazon, el Asistente de Google y Siri de Apple.

Diagram showing how a deep neural network sees. — Las redes neuronales de deep learning obtuvieron su nombre a partir de su estructura de varias capas.

Oye, Elige un Modelo Previamente Entrenado

Elegir la familia correcta de modelos, como una CNN, RNN o un transformador, es un gran comienzo. Y eso es solo el comienzo.

Si quieres participar de la competencia Baja 500, puedes modificar un buggy de dunas con amortiguadores duros y neumáticos resistentes, o puedes comprar un vehículo construido para esa carrera.

En el machine learning, eso es lo que se denomina un modelo previamente entrenado. Se ajusta en grandes conjuntos de datos de entrenamiento que son similares a los datos de tu caso de uso. Las relaciones de datos, denominadas ponderaciones y sesgos, se optimizan para la aplicación deseada.

Se necesita un enorme conjunto de datos, mucha experiencia en IA y una gran capacidad de computación para entrenar un modelo. Los compradores expertos adquieren modelos previamente entrenados para ahorrar tiempo y dinero.

¿A Quién Vas a Llamar?

Cuando compres un modelo previamente entrenado, busca un distribuidor en el que puedas confiar.

NVIDIA respalda una biblioteca en línea llamada el catálogo NGC que está lleno de modelos examinados y previamente entrenados. Abarcan todo el espectro de trabajos de IA, desde la visión de computación hasta la IA conversacional y más.

Para que los usuarios sepan lo que obtienen, muchos modelos del catálogo incluyen currículums. Son como las credenciales de una posible contratación.

El currículum del modelo te muestra el dominio para el que se entrenó el modelo, el conjunto de datos que lo entrenó, la frecuencia con la que se implementó el modelo y cómo se espera que funcione. Proporcionan la transparencia y la confianza de que estás eligiendo el modelo adecuado para tu caso de uso.

Más Recursos para los Modelos de ML

Además, los modelos de NGC están listos para el aprendizaje de transferencia. Esa es la única puesta a punto final que ajusta los modelos para las condiciones exactas de la carretera en las que viajarán: los datos de su aplicación.

NVIDIA incluso proporciona la llave para ajustar su modelo NGC. Se llama TAO y puedes registrarte para obtener acceso anticipado este software hoy mismo.

Para obtener más información, consulta:

Nuestra página web sobre modelos previamente entrenados
Una guía para el catálogo NGC
Nuestra página web sobre Tao y herramientas relacionadas
Un blog para desarrolladores sobre el uso de modelos previamente entrenados para la visión de computación para crear una aplicación de reconocimiento de gestos
Una charla de GTC 21 sobre el aprendizaje de transferencia (gratis para ver con la inscripción)