Paul Edwards está ayudando a llevar el antiguo negocio de los préstamos a la era moderna de la IA.
Edwards comenzó su carrera modelando el comportamiento animal, con un doctorado en ecología numérica. Dejó de lado su bata de laboratorio para dirigir un grupo de científicos de datos en Scotiabank, con sede en Toronto, que tiene como objetivo explorar cómo el machine learning puede mejorar las predicciones del riesgo crediticio.
El equipo cree que el machine learning puede hacer que el banco sea más rentable y permitir que más personas merecedoras de préstamos puedan recibirlos. Su objetivo es compartir a finales de este año algunas de sus técnicas con la esperanza de impulsar a la industria en general.
El Cálculo de las Calificaciones Evoluciona del Lápiz y Papel a la IA
Las nuevas herramientas comenzaron a aplicarse a las calificaciones crediticias, que datan de la década de 1950, cuando los cálculos se hacían con papel y lápiz. Antes, los ejecutivos de crédito clasificaban las respuestas de los solicitantes según unas preguntas estándar y, si el resultado superaba un umbral establecido en la calificación, el banco podía otorgar el préstamo.
Con el auge de las computadoras, los bancos reemplazaron las calificaciones crediticias físicas con las digitales. Hace décadas, se decidieron por una forma de modelado estadístico llamada “regresión logística del peso de evidencia” que se usa ampliamente hoy en día.
Uno de los grandes beneficios de las calificaciones crediticias es que son claras. Los bancos pueden explicar fácilmente sus criterios de préstamo a los clientes y los organismos reguladores. Es por eso que, en el campo del riesgo de crédito, las calificaciones son la norma para los modelos explicables.
“Podríamos hacer modelos de machine learning que sean más grandes, más complejos y precisos que una calificación crediticia, pero, en algún momento, cruzarían una línea y serían demasiado grandes para que yo se los explique a mi jefe o al organismo regulador”, dijo Edwards.
Los Modelos de Machine Learning Ahorran Millones
Entonces, el equipo buscó nuevas formas de construir calificaciones con machine learning y encontró una técnica llamada impulso.
Comenzaron con una sola pregunta en una pequeña calificación, luego agregaron una pregunta a la vez. Se detuvieron antes de agregar otra pregunta que haría que la calificación fuera demasiado compleja para explicarla o no mejoraría su rendimiento.
Los resultados no fueron más difíciles de explicar que los modelos tradicionales con peso de evidencia, pero a menudo fueron más precisos.
“Hemos utilizado el impulso para desarrollar un par de modelos de decisión y detectamos una mejora del porcentaje en comparación con el peso de la evidencia. Un pequeño porcentaje en la escala de todos los solicitantes del banco significa millones de dólares”, dijo.
XGBoost Actualizado para Acelerar los Cuadros de Mando
El equipo de Edwards comprendió el potencial para acelerar los modelos de impulso porque habían estado usando una biblioteca popular llamada XGBoost en un sistema NVIDIA DGX. El código acelerado por GPU fue muy rápido, pero carecía de una característica necesaria para generar calificaciones, una herramienta clave que necesitaban para mantener sus modelos simples.
Griffin Lacey, científico de datos sénior de NVIDIA, trabajó con sus colegas para identificar y agregar la función. Ahora es parte de XGBoost en RAPIDS, un conjunto de bibliotecas de software de código abierto para ejecutar la ciencia de datos en GPU.
Como resultado, el banco ahora puede generar calificaciones 6 veces más rápido con una sola GPU, que antes solía requerir 24 CPU, lo que establece un nuevo punto de referencia para el banco. “Terminó siendo una solución bastante fácil, pero nunca podríamos haberlo hecho nosotros mismos”, dijo Edwards.
Las GPU aceleran el cálculo de las calificaciones digitales y ayudan al banco a elevar su precisión mientras mantienen la explicabilidad de los modelos. “Cuando nuestros modelos son más precisos, las personas que merecen un crédito obtienen el crédito que necesitan”, dijo Edwards.
Llevar RAPIDS a la Era de la IA
De cara al futuro, Edwards quiere aprovechar los avances de las últimas décadas de machine learning para actualizar el mundo de las calificaciones crediticias. Por ejemplo, gracias al trabajo con NVIDIA, su equipo está desarrollando un conjunto de herramientas de Python para calificaciones con funciones que les resultarán familiares a los científicos de datos de la actualidad.
“El equipo de NVIDIA nos está ayudando a incorporar las herramientas de RAPIDS en nuestro workflow para desarrollar calificaciones, lo que permite agregar servicios modernos como la compatibilidad con Python, el ajuste de hiperparámetros y la aceleración de GPU”, dijo Edwards. “Creemos que, en seis meses, podríamos tener ejemplos de código y recetas para compartir», agregó.
Con tales herramientas, los bancos podrán modernizar y acelerar el workflow para crear calificaciones, lo que elimina la práctica actual de ajustar y probar manualmente sus parámetros. Por ejemplo, con el ajuste de hiperparámetros acelerado por GPU, una desarrolladora puede tomarse un rato para almorzar y dejar que una computadora pruebe 100000parámetros del modelo.
Con un grupo mucho más grande para elegir, los bancos podrán elegir calificaciones crediticias según la precisión, la simplicidad, la estabilidad o una combinación de todos estos factores. Esto ayuda a los bancos a garantizar que sus decisiones de préstamo sean claras y confiables y que los buenos clientes obtengan los préstamos que necesitan.
Profundizar el Deep Learning
Los científicos de datos de Scotiabank usan su sistema DGX para manejar múltiples experimentos simultáneamente. Ajustan las calificaciones, ejecutan XGBoost y refinan modelos de deep learning. “Eso realmente mejoró nuestro workflow”, dijo Edwards.
“En cierto modo, lo mejor que obtuvimos al comprar ese sistema fue toda la asistencia que obtuvimos después”, agregó, señalando las características nuevas y futuras de RAPIDS.
A largo plazo, el equipo está explorando el uso de deep learning para identificar más rápidamente las necesidades del cliente. Un modelo experimental para calcular el riesgo de crédito ya mostró una mejora del rendimiento del 20 % con respecto a la mejor calificación crediticia, gracias al deep learning.
Además, una clase emergente de modelos generativos puede crear conjuntos de datos sintéticos que imitan datos bancarios reales, pero no contienen información específica para los clientes. Eso puede abrir una puerta a colaboraciones que aceleran el ritmo de la innovación.
El trabajo del equipo de Edwards refleja el creciente interés y la adopción de IA en el sector bancario.
“El año pasado, una encuesta anual de los departamentos de riesgo crediticio mostró que cada banco participante estaba al menos explorando el machine learning y muchos lo usaban a diario”, dijo Edwards.