SAS investiga la tecnología de R

Sacado de http://www.decisionstats.com/, muy interesante: A SAS spokesperson has confirmed to this blog that they have invested in the R-Core project to help build next generation algorithms. The new R powered SAS would not be sold as licenses but would be hosted on Amazon EC2, thus users pay only for the time of usage. The shift to SaaS is expected to boost SAS's revenue while at the same time helping small consultants and big clients like banks to cut costs. The official announcement had been planned for release during the RUser conference; however, the announcement was moved earlier due to rumors building up early this week due to leakages from SAS R and D (called birdie leakages). The size of the investment is expected to be more than 20 million USD; the exact amount is expected to be disclosed later. The R Core team would be using this for much needed investments in GUI development and upgradation of the website besides offering R courses in East European universities. An expectation of an annual prize for R User of The Year is also expected to take place. ...

12 de abril de 2009 · rvaquerizo

Trucos R. Leer de Excel vía RODBC

Un gran número de visitas que llegan a este sitio tienen que ver con la importación de datos. En este caso, he encontrado en YouTube un vídeo explicativo en el que nos indican de una forma muy sencilla cómo importar a R datos desde hojas Excel con el paquete RODBC: “Very easy”. Uno de mis siguientes proyectos es realizar vídeos de este tipo; bajo mi punto de vista, son muy prácticos e ilustrativos. Saludos.

12 de abril de 2009 · rvaquerizo

Macros SAS. Tramificar en función de una variable respuesta

Sobre la idea de “dumificar” variables he ideado un proceso para agrupar variables cuantitativas en función de una variable respuesta. Los que disponéis de herramientas de análisis más complejas tipo Enterprise Miner o Clementine ya disponéis de algoritmos y funciones que realizan esta útil tarea, además los árboles pueden trabajar con variables continuas. Pero un modelo es bueno si las variables de entrada están bien elegidas y bien construidas y como paso previo al análisis multivariante el análisis univariable es imprescindible. Tramificar una variable continua en función de una variable respuesta no va más allá de un análisis univariante, igualmente podemos tener dependencia lineal entre variables, algo que sólo detectaremos con análisis multivariables. Pero este sencillo algoritmo puede ayudarnos a conocer mejor algunas variables que deseamos introducir en nuestro modelo. ...

8 de abril de 2009 · rvaquerizo

Trucos SAS. Variables `dummy` de una variable continua

“Dumificar” es crear variables dummy. Un verbo completamente inventado pero que todos los que os habéis enfrentado a la creación de una tabla de entrada para realizar modelos estadísticos vais a entender perfectamente en qué consiste. Dumificar es transformar una variable continua en $N$ variables dicotómicas. Lo entenderemos mejor con un ejemplo gráfico: En el ejemplo partimos de 8 registros y creamos 4 variables dicotómicas en función de una variable importe. Hemos dumificado la variable importe en 4. Parece fácil de entender el concepto. Bien, pues esto es lo que planteo hacer con SAS. La metodología que voy a emplear es la de siempre: parto de un dataset aleatorio con un identificador y un campo importe que pretendemos transformar en 5 variables ($0, 1$). Para realizar este proceso necesitamos una macro que cuente las observaciones de un dataset (ya la planteé con anterioridad en otro artículo del blog). De todos modos, os dejo completo el código que empieza: ...

6 de abril de 2009 · rvaquerizo

Bajada del precio de la vivienda en EEUU

Repasando algunos blogs imprescindibles, he visto en En Silicio un curioso dato publicado en Gurusblog: el precio de la vivienda en EEUU se desploma un 18%. Inmediatamente había que visitar la web de Standard & Poor’s para analizar el precio de la vivienda, la subida y posterior desplome; en principio me interesaban las fechas. Pero me ha sorprendido una dimensión del análisis que no se está teniendo en cuenta a la hora de estudiar el precio de la vivienda en los EEUU: la zona geográfica. Mientras hay ciudades con una subida y posterior bajada muy pronunciada, hay otras donde esto se ha producido de forma más suave. Rápido gráfico en Excel: ...

24 de marzo de 2009 · rvaquerizo

Bajar los tipos a la japonesa. Al 0%

Leo con preocupación: El servicio de estudios del BBVA estima que el BCE bajará los tipos al 0%. Esto, que puede parecer una buena noticia, al ahora escribiente le da pánico. Entiendo que esa medida es la última que debería tomar Trichet; sería LA MEDIDA necesaria si la crisis estuviera en la cúspide, al igual que se ha hecho en EEUU. “Sólo cuando el túnel esté en la más absoluta oscuridad es cuando puede volver otra vez la luz”; así empieza uno de los programas de radio más longevos de España y es una frase que define el comportamiento del BCE. ...

23 de marzo de 2009 · rvaquerizo

Me preocupa el pequeño ahorrador (II)

¿Dónde meto mi dinero? Esa es la pregunta que se hacen todos los ahorradores. Los productos financieros en los que invertir los podemos dividir en: Productos de renta fija Productos de renta variable Productos mixtos Fondos de inversión Derivados En los productos de renta fija el inversor conoce a priori la rentabilidad que le va a producir su dinero. Los más habituales son las IPF en los cuales el banco reporta una rentabilidad monetaria o en especie por mantener el dinero del inversor. También tenemos la Deuda Pública, producto de gran liquidez y bajo riesgo. Las cédulas hipotecarias y las obligaciones y bonos, aunque ofrecen buenas rentabilidades, pueden quedar más lejos del pequeño ahorrador debido al plazo y, en el caso de las cédulas, da un poco de terror que el respaldo sean los activos bancarios. ...

22 de marzo de 2009 · rvaquerizo

Como accede Enterprise Guide a la DBMS

Un ejemplo muy gráfico de cómo accede Enterprise Guide a las DBMS: No se puede expresar mejor. Es necesario un monográfico de SQL Pass-Thru.

16 de marzo de 2009 · rvaquerizo

Trucos SAS. Informes de valores missing

A continuación, os planteo como truco SAS una duda que nos mandaba Liliana. Ella necesitaba estudiar los valores perdidos de las tablas de una librería determinada. En este caso, vamos a estudiar los missing de las variables numéricas de una librería; de forma análoga se puede hacer con las alfanuméricas. Como siempre, vamos a trabajar con un ejemplo que parte de tablas generadas aleatoriamente. Comenzamos generando estas tablas: libname datos "C:\temp\datos"; %macro aleatorios; %do i = 1 %to 5; data datos.proyecto_&i.; do id = 1 to 200; if int(ranuni(0) * 10) = 2 then importe1 = .; else importe1 = round(rand("uniform") * 1000, .1); if int(ranuni(0) * 10) > 8 then importe2 = .; else importe2 = round(rand("uniform") * 130, .1); length zona $15; if ranuni(0) <= .32 then zona = "España"; else if ranuni(1) <= .32 then zona = "Cataluña"; else zona = "Resto"; output; end; run; %end; %mend aleatorios; %aleatorios; Con este programa generamos cinco datasets aleatorios con cuatro variables; dos de ellas son importes que tendrán valores missing en determinados casos. En este punto, hemos de crear un proceso que cuente valores perdidos; podemos emplear el PROC SQL o bien el PROC FREQ definiendo primero un formato. Empleamos FREQ para crear una macro: ...

16 de marzo de 2009 · rvaquerizo

Moviéndonos a una velocidad exponencial

Impresionante vídeo sacado de GurusBlog. El futuro cambia de forma exponencial. La formación debería estar in la base de este cambio. ¿Se adaptará la educación universitaria a estos cambios? Al final, a algunos se nos tachará de reaccionarios porque no actualizamos la versión de WordPress. Y es que, si una cosa funciona… ¡Viva el Mainframe de IBM! ¡Viva el COBOL! Saludos.

9 de marzo de 2009 · rvaquerizo