
¿Curva ROC y Excel? ¡Si no tiene nada que ver! No del todo. En ocasiones tenemos que pintar las curvas ROC y empleamos las herramientas específicas para ello; sin embargo, es habitual que nuestros resultados sean presentados en Excel (demasiado habitual). En ese caso, creamos nuestros datos para llevarlos a Excel y realizamos nuestro gráfico. Ya tenemos nuestra tabla y hacemos algo muy parecido a lo que tenemos más arriba.
La curva ROC es un mecanismo para evaluar nuestro modelo y compara la especificidad, que es la probabilidad de clasificar mal un caso negativo, frente a la sensibilidad, que es la probabilidad de clasificar correctamente un caso positivo; es decir, falsos positivos frente a verdaderos positivos. El área bajo la curva ROC será un valor entre 0,5 y 1. Cuanto más próximo a 1, mejor será nuestro modelo. Queda pendiente una revisión “en condiciones” de las curvas ROC y de los gráficos lift, mucho mejores cuando tienes que presentar resultados en un área de negocio.
Entonces, ya tenemos el gráfico en Excel y nos piden hallar el área bajo la curva ROC. ¿Cómo hacemos esto? Mediante una simulación por método Montecarlo. Creamos números aleatorios y, si están por debajo de la curva, pues valen. Posteriormente dividimos los que valen entre todos los que tenemos y hemos obtenido un valor muy próximo al área bajo la curva ROC. En realidad, es un método para estimar el área de un polígono.
Para entender mejor cómo se realiza el proceso, os dejo un documento de Excel con datos simulados:
Curva ROC con datos simulados (XLSX). Veréis que es muy sencillo. No se puede ser más dinosaurio, pero ya verás como a más de uno se le enciende la bombilla. Saludos.