Macros SAS. Tramificar en función de una variable respuesta

Sobre la idea de “dumificar” variables he ideado un proceso para agrupar variables cuantitativas en función de una variable respuesta. Los que disponéis de herramientas de análisis más complejas tipo Enterprise Miner o Clementine ya disponéis de algoritmos y funciones que realizan esta útil tarea, además los árboles pueden trabajar con variables continuas. Pero un modelo es bueno si las variables de entrada están bien elegidas y bien construidas y como paso previo al análisis multivariante el análisis univariable es imprescindible. Tramificar una variable continua en función de una variable respuesta no va más allá de un análisis univariante, igualmente podemos tener dependencia lineal entre variables, algo que sólo detectaremos con análisis multivariables. Pero este sencillo algoritmo puede ayudarnos a conocer mejor algunas variables que deseamos introducir en nuestro modelo.

Trucos SAS. Variables dummy de una variable continua

Dumificar es crear variables dummy. Un verbo completamente inventado pero que todos los que os habéis enfrentado a la creación de una tabla de entrada para realizar modelos estadísticos vais a entender perfectamente en que consiste. Dumificar es transformar una variable continua en N variables dicotómicas. Lo entenderemos mejor con un ejemplo gráfico:

dumificar.JPG

En el ejemplo partimos de 8 registros y creamos 4 variables dicotómicas en función de una variable importe. Hemos dumificado la variable importe en 4. Parece fácil de entender el concepto. Bien, pues esto es lo que planteo hacer con SAS. La metodología que voy a emplear es la de siempre, parto de un dataset aleatorio con un identificador y un campo importe que pretendemos transformar en 5 variables (0,1). Para realizar este proceso necesitamos una macro que cuenta las observaciones de un dataset, ya la planteé con anterioridad en otro artículo del blog. De todos modos os dejo completo el código que empieza:

Bajada del precio de la vivienda en EEUU

Repasando algunos blogs imprescindibles he visto En Silicio un curioso dato publicado en Gurusblog: El precio de la vivienda en EEUU se desploma un 18%. Inmediatamente había que visitar la web de Standard & Poors para analizar el precio de la vivienda, la subida y posterior desplome, en principio me interesaban las fechas. Pero me ha sorprendido una dimensión del análisis que no se está teniendo en cuenta a la hora de estudiar el precio de la vivienda en los EEUU: La zona geográfica. Mientras hay ciudades con una subida y posterior bajada muy pronunciada hay otras donde esto se ha producido de forma más suave. Rápido gráfico en Excel:

Bajar los tipos a la japonesa. Al 0%

Leo con preocupación: El servicio de estudios del BBVA estima que el BCE bajará los tipos al 0 en los próximos meses. Esto, que puede parecer una buena noticia, al ahora escribiente le da pánico. Entiendo que esa medida es la última que debería tomar Trichet, sería LA MEDIDA necesaria si la crisis estuviera en la cúspide, al igual que se ha hecho en EEUU. «Sólo cuando el túnel esté en la más absoluta oscuridad es cuando puede volver otra vez la luz»; así empieza uno de los programas de radio más longevos de España y es una frase que define el comportamiento del BCE. Con todo esto debemos asumir que la crisis ha de empeorar y que los síntomas de mejora tienen más de «síntomas» que de «mejora».Y yo me pregunto ¿pueden bajar los tipos por debajo del 0%? No me imagino penalizar a las entidades bancarias por retener el dinero, me parece absurdo.

Me preocupa el pequeño ahorrador (II)

¿Dónde meto mi dinero? Esa es la pregunta que se hacen todos los ahorradores. Los productos financieros en los que invertir los podemos dividir en:

  • Productos de renta fija
  • Productos de renta variable
  • Productos mixtos
  • Fondos de inversión
  • Derivados

En los productos de renta fija el inversor conoce a priori la rentabilidad que le va a producir su dinero. Los más habituales son las IPF en los cuales el banco reporta una rentabilidad monetaria o en especie por mantener el dinero del inversor. También tenemos la Deuda Pública producto de gran liquidez y bajo riesgo. Las cédulas hipotecarias y las obligaciones y bonos aunque ofrecen buenas rentabilidades pueden quedar más lejos del pequeño ahorrador debido al plazo y en el caso de las cédulas da un poco de terror que el respaldo sean los activos bancarios.

Trucos SAS. Informes de valores missing

A continuación os planteo como truco SAS una duda que nos mandaba LILIANA. Ella necesitaba estudiar los valores perdidos de las tablas de una librería determinada. En este caso vamos a estudiar los missing de las variables numéricas de una librería, de forma análoga se puede hacer con las alfanuméricas. Como siempre vamos a trabajar con un ejemplo que parte de tablas generadas aleatoriamente. Comenzamos generando estas tablas:

libname datos "c:\temp\datos";
%macro aleatorios;

%do i=1 %to 5;

data datos.proyecto_&i.;

do id=1 to 200;

 if int(ranuni(0)*10) = 2 then importe1=.;

 else importe1=round(rand("uniform")*1000,.1);

 if int(ranuni(0)*10) > 0.3 then importe2=.;

 else importe2=round(rand("uniform")*130,.1);

length zona $15.;
if ranuni(0) <=.32 then zona=“España”;
else if ranuni(1) <= 0.32 then zona=“Cataluña”;
else zona=“Resto”;

La nueva burbuja de los bancos

Si vemos que nos estalla una burbuja creamos otra.

Cuando yo era pequeñito había un tipo con gafas que salía por la tele haciendo burbujas de jabón enormes:

Burbuja muerta burbuja puesta

Observesé como el tipo este genera otra burbuja de jabón a partir de una enorme, además esta nueva burbuja está llena de humo. Que magnífico espectáculo montaba este tipo, a mí me encantaba, le imitaban con Fairy y un boli Bic en la cocina de mi casa, incluso me eché algún piti que compraba en el kiosko a duro. Este artista es uno de los grandes genios de los años 80-90 a pesar de su chaleco. Pues la banca española está haciendo lo mismo que este tipo del chaleco. Las manos a la cabeza he me llevado al leer esto. Es decir, vamos a colocar deuda con el aval del estado. Esto, para mi que no soy un analista, más bien un «mindundi» que lee la prensa en internet por las mañanas me parece «pan para hoy y hambre, mucha hambre para mañana». Querer afrontar el problema del aumento de la morosidad con deuda me parece un disparate, por ejemplo el caso de Caixa Catalunya ¿Alguien va a poner freno a esto?

La Batalla de las nóminas. Seguimos buscando el dinero nuevo

Cuanta falta está haciendo el dinero nuevo.

El año pasado tuvimos la guerra de los depósitos, con lo que el pequeño ahorrador salió ganando y este año tenemos la Batalla de las nóminas:

la «Caixa» y su programa Nómina Multiestrella

Banesto con Rafa Nadal

BBVA se adapta

ING y su cuenta nómina

Y algunos más que seguro me estaré dejando. La idea es captar nuevas nóminas, pero en este caso dudo que el cliente sea el que más se ve beneficiado, sin embargo las cuentas de resultados podrán respirar más a gusto.

Trucos Excel. Trasponer con la función indirecto

Una de las tareas más comunes en Excel es la de transponer filas. En ocasiones hemos de transformar columnas en filas o viceversa:

indirecto.JPG

Es muy habitual copiar y pegar transponiendo pero esta labor es muy manual cuando manejamos hojas con gran cantidad de fórmulas y que pueden generar informes automáticos. Para transponer contamos con la ayuda de la función INDIRECTO de exce. En la ayuda se define como:

« Devuelve la referencia especificada por una cadena de texto. Las referencias se evalúan de inmediato para presentar su contenido. Use INDIRECTO cuando desee cambiar la referencia a una celda en una fórmula sin cambiar la propia formula »

Estudiad idiomas

Análisisydecisión nació como un blog dedicado a la formación de profesionales en el mundo de la inteligencia de negocio y la minería de datos. Poco a poco se ha ido transformando y junto con las secciones dedicadas a la formación sobre aplicaciones estadísticas y metodologías hay breves artículos de opinión. Bueno pues este mensaje es ambas cosas, un artículo de opinión y una sugerencia sobre el futuro de los buenos gestores de información:

Me preocupa el pequeño ahorrador (I)

El año pasado ya hice referencia a los depósitos bancarios de bajo margen. Fue el inicio de la guerra por el pasivo de los bancos y cajas, que empezaban a tomar posiciones para «fusionar» otras entidades más pequeñas que habían crecido a costa del activo y ante un escenario de incremento de la morosidad podrían encontrarse en una situación de falta de liquidez. Esto lo anuncié y se está produciendo en nuestros días.