El modelo multivariante en el sector asegurador. La variable dependiente (III)

Hasta ahora estamos hablando de un concepto muy difuso que denomino «comportamiento siniestral». A la hora de ajustar un modelo estadístico, necesito una variable dependiente que será función de otras variables independientes. Las variables independientes serán los riesgos, a los que también les dedicaremos unas líneas, y la variable dependiente será el comportamiento siniestral; pero este concepto un poco difuso no lo vamos a medir en una sola variable, sino en dos: ...

20 de abril de 2010 · rvaquerizo

El modelo multivariante en el sector asegurador. Univariante vs multivariante (II)

Hace mucho tiempo se empleaban resultados univariantes en la estructura de la tarifa. Los recargos y descuentos de la prima eran función de un análisis factor a factor; no se detectaban las interacciones entre ellos. La política de tarificación no era segmentada, no se ajustaba a la realidad y nos podíamos encontrar la situación prototípica siguiente: En función del sexo, debemos incrementar a los hombres un 30% la prima base. ...

19 de abril de 2010 · rvaquerizo

Monográfico. Análisis de Factores con R (una introducción)

El análisis de factores es una técnica de reducción de datos: menor dimensión, mayor porcentaje de varianza. Distinguimos el análisis factorial exploratorio del análisis factorial confirmatorio en función del conocimiento del número de factores a obtener. Este análisis está muy relacionado con el análisis de componentes principales, pero no buscamos explicar el mayor porcentaje de varianza a partir de combinaciones lineales de variables; buscamos conjuntos de variables comunes entre sí. Este análisis supone que hay un factor intrínseco a las variables a combinar. El proceso a seguir para este tipo de análisis sería: ...

11 de febrero de 2010 · rvaquerizo

Lectura del fin de semana

Buena lectura de fin de semana. Me da vergüenza reconocer que no lo conocía; es de 2003. Me está gustando bastante: tiene una breve introducción a R y tiene una visión muy práctica. Saludos.

9 de enero de 2010 · rvaquerizo

Qué ando leyendo hoy

Páginas muy interesantes de R: R-bloggers Planet R El R-bloggers es imprescindible que esté en vuestros marcadores. Incluso soy fan en Facebook.

2 de enero de 2010 · rvaquerizo

Monográfico. `FIRST.` y `LAST.` ejemplos en DATA

Ya trabajamos en un monográfico anterior con datos agrupados en SAS. Cuando empleamos BY tenemos dos variables dentro del paso data con las que trabajaremos habitualmente: FIRST. y LAST.. A continuación vamos a plantear un ejemplo de uso para entender mejor su funcionamiento. Partimos de una simulación de una cartera de una CIA aseguradora que tiene 1.000 pólizas y está a nivel de póliza, renovación y suplemento. Para la realización de diversos análisis necesitamos marcar las pólizas de nueva producción, marcar la anualidad, determinar la prima en el momento anterior a la renovación y la prima que tienen a día de hoy. ...

2 de diciembre de 2009 · rvaquerizo

Trucos SAS. Autonumérico con PROC SQL

Rápido: me ha llegado una consulta que me preguntaba cómo crear un campo autonumérico con PROC SQL. Tenemos que emplear la función MONOTONIC(): data uno; do i = 1 to 100; output; end; run; proc sql; create table dos as select monotonic() as obs, a.* from uno a where mod(i, 2) = 0; quit; Equivale al _N_ de un paso DATA. Es una tontería, pero a un lector del blog le ha venido bien. Saludos.

6 de noviembre de 2009 · rvaquerizo

Laboratorio de código SAS. Comparativa entre IF y WHERE

Inicio hoy otra serie de mensajes para analizar el uso óptimo del código SAS. La intención es comparar distintas ejecuciones y obtener un pequeño reporte con la metodología y el tiempo empleado en su ejecución. Para evitar el efecto que pueda causar la concurrencia en un servidor con SAS, se realizarán múltiples ejecuciones. He intentado que el código que utilizo para comparar las ejecuciones sea lo más sencillo posible. Soy consciente de que se puede usar un código más “profesional”, pero lo que planteo a continuación me parece una solución equilibrada. La idea es hacer una macro que haga $N$ ejecuciones para promediar el efecto de la concurrencia. Cada método tendrá una ejecución controlada con una macrovariable con la hora del sistema. Esta información se guardará en una tabla SAS junto con el nombre del método. Al final, lo más sencillo es ordenar por el tiempo de ejecución e imprimir el resultado. ...

3 de noviembre de 2009 · rvaquerizo

Manual. Curso introducción de R. Capítulo 18: Modelos de regresión de Poisson

Cuando disponemos de un número de eventos que ocurren en un intervalo de tiempo estamos ante una variable de Poisson; además tiene que producirse que este número de eventos en intervalos sea independiente del número de eventos que ocurran fuera de ese intervalo de tiempo. En un intervalo muy pequeño, la probabilidad de que ocurra un evento es proporcional al tamaño del intervalo y, por último, la probabilidad de que ocurran dos o más eventos en un intervalo muy pequeño es prácticamente 0. Cualquier variable medida en un intervalo de tiempo o en un intervalo espacial es una variable de Poisson; también se pueden emplear para medir frecuencias en intervalos de población (casos de cáncer en poblaciones, frecuencias siniestrales…). Tiene como particularidad que la media y la varianza son iguales a $p \times s$, donde $p$ es la probabilidad de ocurrencia de un evento de Poisson en un intervalo de tiempo de tamaño unidad y $s$ es el tamaño del intervalo de tiempo o espacial en estudio. ...

23 de octubre de 2009 · rvaquerizo

Truco SAS. Transponer tablas con PROC TRANSPOSE, DATA o PROC SQL

Para transponer datasets, disponemos en SAS del PROC TRANSPOSE. El ahora escribiente no es muy partidario de emplearlo; prefiero otras metodologías para transponer conjuntos de datos SAS. Voy a trabajar con un ejemplo que os servirá para aproximaros al TRANSPOSE y para entender mejor las opciones de lectura de un paso DATA y el funcionamiento del PROC SQL. La idea es, partiendo de una tabla de hechos por meses, transponer un campo importe. Vamos a simular una tabla con esa estructura: ...

27 de agosto de 2009 · rvaquerizo