Resultados: visualización detallada

Registro 1 de 1 para la búsqueda tipo de materia Minería de datos; modelos logísticos; credit scoring; kdd 

Estudio de Metodologías para el Seguimiento de Modelos de Credit Scoring Utilizando Regresión Logística

Tolvett Sepúlveda, Carlos Felipe
Weber Haas, Richard
Bravo Román, Cristián
L’huillier Chaparro, Gastón

2011

  • Datos de edición CyberDocs
  • Tipo de Documento Libro
  • Materia Minería de datos; modelos logísticos; credit scoring; kdd
  • Descripción
    Este trabajo de memoria tiene por objetivo realizar un estudio sobre metodologías de seguimiento para modelos de credit scoring que utilizan regresión logística como clasificador. A partir de la aplicación de dichas metodologías, se propone un marco de trabajo que permite dar solución a esta problemática.El problema de seguimiento (concept drift en inglés) corresponde a detectar cambios en un modelo de minería de datos cuando este es co ...
    Este trabajo de memoria tiene por objetivo realizar un estudio sobre metodologías de seguimiento para modelos de credit scoring que utilizan regresión logística como clasificador. A partir de la aplicación de dichas metodologías, se propone un marco de trabajo que permite dar solución a esta problemática.El problema de seguimiento (concept drift en inglés) corresponde a detectar cambios en un modelo de minería de datos cuando este es construido utilizando bases de datos no - estacionarias, es decir, conjuntos de información en los cuales nuevas observaciones son agregadas a la muestra de manera continua o periódica. Cuando esto ocurre, es común que la distribución de las variables asumida en la construcción del modelo, así como también los patrones que definen la relación entre variable objetivo y variables explicativas, se modifiquen. Esto tendrá como consecuencia que el modelo pierda su validez en las nuevas observaciones haciendo necesaria su re - calibración.El modelo de credit scoring fue desarrollado bajo la metodología de descubrimiento del conocimiento en bases de datos (KDD, por sus siglas en inglés) utilizando información de una institución financiera real. Como técnica de minería de datos para obtener las probabilidades de incumplimiento, se calibró un modelo de regresión logística, técnica estadística, que con un buen desempeño, se caracteriza por su facilidad de aplicación e interpretación. Por otra parte, los modelos de seguimiento fueron aplicados para detectar los tres posibles tipos de cambios: cambio global en el modelo, en la capacidad discriminante de las variables y en la distribución de las variables. Se obtuvo un modelo de credit scoring con una capacidad discriminante de 74.6% y un R2 de Nagelkerke de 40,1%, resultados muy satisfactorios para este universo de observaciones. Se aplicaron 11 metodologías de seguimiento con las cuales se determinó que existe un cambio significativo en el modelo de credit scoring. En base a un análisis de resultados de dichas metodologías, se definió un marco de trabajo de carácter no - supervisado y no - paramétrico, que recoge los modelos de seguimiento con mejor desempeño. Este fue validado con dos bases de datos de concept drift, determinando satisfactoriamente los cambios en los modelos de credit scoring respectivos.
  • Identificador 14740