Modelo predictivo de riesgo de convenios de pagos TGR
Tesorería General de la República
Herramientas utilizadas
Medición de sesgos y equidad estadística Ficha de transparenciaCuestionario
¿En qué consiste el problema que buscaron solucionar a través de la ciencia de datos o inteligencia artificial?
El principal problema que la Tesorería General de la República (TGR) buscó solucionar a través de la ciencia de datos y la inteligencia artificial es la elevada y creciente tasa de caducidad de los convenios de pago, lo que impacta directamente en la recaudación fiscal y en la gestión eficiente de las deudas tributarias. Este fenómeno merma significativamente los ingresos del país, ya que una alta proporción de las obligaciones adeudadas no se concretan.
Para dimensionar el problema, las cifras son contundentes: históricamente, el 54% de los convenios terminan en caducidad, en marcado contraste con solo un 30% que se completa exitosamente. La situación se agravó considerablemente en 2022, cuando la tasa de caducidad alcanzó un preocupante 63%. En términos financieros, la magnitud es aún más alarmante: en los últimos tres años, el monto total de los convenios suscritos superó los 5 billones de pesos, de los cuales solo se ha recaudado una fracción, dejando un saldo pendiente que supera los 3.7 billones de pesos. La TGR carecía de una comprensión profunda sobre el comportamiento de los contribuyentes, desconocía qué variables determinan el cumplimiento o incumplimiento de los convenios, y no podía anticipar ni diferenciar estrategias de gestión. Las herramientas existentes, como el árbol de condonación de intereses o el clasificador de comportamiento previo, resultaban insuficientes para abordar esta complejidad.
¿Qué desafíos éticos implicaba aplicar esta tecnología? ¿Por qué?
La aplicación de modelos predictivos basados en ciencia de datos e inteligencia artificial en la gestión de convenios de pago en un organismo público como la TGR, implica varios desafíos éticos significativos como:
- Sesgos y Discriminación: El modelo aprende de datos históricos. Si estos datos reflejan sesgos inherentes en la sociedad o en los procesos administrativos previos (por ejemplo, si ciertos grupos socioeconómicos tuvieron históricamente mayores tasas de caducidad debido a factores sistémicos), el modelo podría perpetuar o incluso amplificar estos sesgos. Esto podría llevar a que, injustamente, se asigne un mayor riesgo a ciertos contribuyentes, afectando su acceso a convenios, términos de pago o estrategias de cobranza, sin que su comportamiento individual lo justifique.
- Transparencia y Explicabilidad (Caja Negra): Los modelos de Machine Learning avanzados, como XGBoost, pueden ser complejos y operar como "cajas negras", dificultando la comprensión de cómo llegan a una predicción específica. En un contexto público, donde se toman decisiones que afectan directamente la economía de los ciudadanos, la falta de transparencia sobre "por qué" un convenio es clasificado como de alto o bajo riesgo puede generar desconfianza, dificultar la rendición de cuentas y limitar la capacidad de los contribuyentes para apelar o comprender las decisiones.
¿Qué resultados obtuvieron de estos pilotos?
Respecto a la solución que se buscaba entregar, el piloto desarrolló un Modelo Predictivo de Riesgo de Convenios de Pago utilizando XGBoost, el cual fue seleccionado por tener las mejores métricas de clasificación entre los modelos probados. El objetivo era predecir la probabilidad de caducidad de un convenio al momento de ser suscrito por el contribuyente, con el fin de ofrecer condiciones de pago óptimas y aumentar la recaudación.
Los resultados del modelo muestran la siguiente distribución de predicciones:
- De un total de 216.119 convenios evaluados, el modelo predijo que 144.595 (66.9%) caducarían y 71.524 (33.1%) no caducarían.
En la matriz de confusión, para la clase "Caduca Convenio" (la clase mayoritaria):
- Verdaderos Positivos: 105.658 (48.9% del total), significando que el modelo identificó correctamente una gran cantidad de convenios que realmente caducaron.
- Falsos Negativos: 38.937 (18.0% del total), indicando convenios que caducaron pero que el modelo predijo erróneamente que no lo harían.
Para la clase "Paga Convenio" (la clase minoritaria):
- Falsos Positivos: 16.619 (7.7% del total), que son convenios que se pagaron, pero el modelo predijo incorrectamente que caducarían.
- Verdaderos Negativos: 54.905 (25.4% del total), que son convenios que se pagaron y el modelo predijo correctamente que no caducarían.
El modelo se basa en variables clave como la DEMANDA (el factor más determinante), el historial de convenios previos (caducados o terminados), el número de cuotas, el tipo de impuesto y la cantidad de folios de deuda. La clasificación del riesgo obtenida permite segmentar los convenios de pago según su probabilidad de pago, facilitando el diseño de campañas de cobranza más efectivas, priorizando segmentos de mayor riesgo con recordatorios tempranos, renegociación de convenios o incentivos para el pago. El modelo busca optimizar la gestión de cobranza, mejorando la recaudación y reduciendo la morosidad.
¿Con qué aprendizajes se queda su organización?
Principalmente nos quedamos con la importancia de la definición de las variables y el análisis particular de cada una. Adicionalmente la importancia de definir los objetivos institucionales en cuanto a la precisión de los modelos y cómo estas tecnologías si bien son muy útiles, tienen consideraciones importantes en su diseño.
En cuanto a específicamente al modelo desarrollado, se basa en variables clave como la demanda (el factor más determinante), el historial de convenios previos (caducados o terminados), el número de cuotas, el tipo de impuesto y la cantidad de folios de deuda. La clasificación del riesgo obtenida permite segmentar a los contribuyentes según su probabilidad de pago, facilitando el diseño de campañas de cobranza más efectivas, priorizando segmentos de mayor riesgo con recordatorios tempranos, renegociación de convenios o incentivos para el pago. El modelo busca optimizar la gestión de cobranza, mejorando la recaudación y reduciendo la caducidad.
¿Cuáles son los próximos pasos para la implementación de IA responsable en su proyecto?
Principalmente la operativización, pues es necesario adecuar este proceso tecnológico con las normas legales relativas a las amnistías fiscales y normativas internas. En la misma línea es necesario diseñar mecanismos de ajustes y revisión constante de los resultados arrojados, como también el diseño de mecanismos preventivos integrados con otros procesos internos como lo son la cobranza prejudicial y judicial de forma que estos procesos se vean beneficiados por la nueva operatoria.
¿Cómo fue la experiencia de trabajar de la mano con el GobLab de la UAI?
La experiencia de trabajar con GobLab de la UAI fue muy valiosa. Siempre se mantuvieron dispuestos a resolver cualquier tipo de dudas o problemas de manera oportuna. Siempre existió una excelente disposición tanto para reuniones adicionales, para dar explicaciones completas y el acompañamiento constante. También se destaca el nivel técnico de sus personas y la cordialidad de las mismas
¿Qué le diría a otro organismo público que esté interesado en trabajar con estas herramientas de código abierto, pero aún no se ha convencido?
Deben atreverse a probar estas nuevas herramientas siempre manteniendo el propósito por sobre la herramienta. La implementación de modelos predictivos, como el nuestro para la gestión de convenios de pago, ofrece la oportunidad de pasar de una gestión reactiva a una proactiva, optimizando recursos y mejorando significativamente los resultados. Es fundamental atreverse a innovar, entender el potencial de los datos y, sobre todo, abordar los desafíos éticos desde el diseño para garantizar soluciones justas y transparentes al servicio de la ciudadanía. La colaboración con expertos externos, como GobLab, puede ser un catalizador clave para el éxito en este camino.