SAS comienza a fijarse en R

SAS comienza a fijarse en R Interesante nocicia leída en ComputerWorld: SAS amplía las opciones de análisis avanzado para sus clientes con la nueva interfaz de software estadístico de código abierto R. La integración inicial de R en SAS estará incluida en SAS/IML Studio 3.2 (antes SAS Stat Studio) este verano. Fiel a su filosofía de escuchar a los clientes y dar respuesta a sus necesidades cambiantes, política que le han proporcionado a la compañía 33 años de crecimiento ininterrumpido, SAS da un paso más y anuncia la introducción del código R dentro del entorno de SAS. De esta forma, los desarrolladores de modelos estadísticos tendrán más opciones para extraer valor de los datos, usando la gran variedad de métodos ofrecidos por SAS a la vez que experimentan con nuevos métodos todavía no implementados en SAS con la interfaz R. ...

28 de mayo de 2009 · rvaquerizo

Trucos SAS. Muestras aleatorias con y sin reemplazamiento

Un ejemplo típico de SAS pero que creo que puede ayudar a conocer algunas funciones de SAS. Los ejemplos que planteo a continuación crean un dataset con 10.000 observaciones y sobre él vamos a crear dos subconjuntos de datos, dos muestras aleatorias del dataset de partida, una muestra sin reemplazamiento y otra muestra con reemplazamiento. Son dos ejemplos muy sencillos. Como siempre creo un dataset de forma aleatoria que me sirve de base para plantearos el truco: ...

11 de mayo de 2009 · rvaquerizo

Entrevista a Jim Goodnight fundador de SAS

Interesante entrevista a Jim Goodnight CEO y co-fundador de de SAS. A SAS no parece afectarle la crisis que están sufriendo los más importantes bancos del mundo. Se están adaptando a la nueva demanda de software para el fraude y riesgos crediticios. También están haciendo un guiño a la optimización de precios. Con estas medidas SAS no se plantea despidos siempre y cuando la recesión no empeore…

14 de abril de 2009 · rvaquerizo

SAS Global Forum 2009

Ya tenéis disponibles los «paper» del SAS Global Forum 2009. Echadle un vistazo porque siempre merecen la pena. Por otro lado se creó un blog donde tenéis algunas entrevistas todo muy típico y tópico, al fin y al cabo se trata de vender las excelencias de esta herramienta tan cara. Pero creo que la entrevista a Mike Thomas sobre plataformas móviles de información me ha despertado mucha curiosidad. Hay que reinventar el BI, es un concepto bastante obsoleto y las comunicaciones móviles pueden ser una buena base. ...

12 de abril de 2009 · rvaquerizo

Macros SAS. Tramificar en función de una variable respuesta

Sobre la idea de “dumificar” variables he ideado un proceso para agrupar variables cuantitativas en función de una variable respuesta. Los que disponéis de herramientas de análisis más complejas tipo Enterprise Miner o Clementine ya disponéis de algoritmos y funciones que realizan esta útil tarea, además los árboles pueden trabajar con variables continuas. Pero un modelo es bueno si las variables de entrada están bien elegidas y bien construidas y como paso previo al análisis multivariante el análisis univariable es imprescindible. Tramificar una variable continua en función de una variable respuesta no va más allá de un análisis univariante, igualmente podemos tener dependencia lineal entre variables, algo que sólo detectaremos con análisis multivariables. Pero este sencillo algoritmo puede ayudarnos a conocer mejor algunas variables que deseamos introducir en nuestro modelo. ...

8 de abril de 2009 · rvaquerizo

Trucos SAS. Variables `dummy` de una variable continua

Dumificar es crear variables dummy. Un verbo completamente inventado pero que todos los que os habéis enfrentado a la creación de una tabla de entrada para realizar modelos estadísticos vais a entender perfectamente en que consiste. Dumificar es transformar una variable continua en N variables dicotómicas. Lo entenderemos mejor con un ejemplo gráfico: En el ejemplo partimos de 8 registros y creamos 4 variables dicotómicas en función de una variable importe. Hemos dumificado la variable importe en 4. Parece fácil de entender el concepto. Bien, pues esto es lo que planteo hacer con SAS. La metodología que voy a emplear es la de siempre, parto de un dataset aleatorio con un identificador y un campo importe que pretendemos transformar en 5 variables (0,1). Para realizar este proceso necesitamos una macro que cuenta las observaciones de un dataset, ya la planteé con anterioridad en otro artículo del blog. De todos modos os dejo completo el código que empieza: ...

6 de abril de 2009 · rvaquerizo

Como accede Enterprise Guide a la DBMS

Un ejemplo muy gráfico de como accede Enterprise Guide a las DBMS: No se puede expresar mejor. Es necesario un monográfico de SQL Pass – Thru.

16 de marzo de 2009 · rvaquerizo

Trucos SAS. Informes de valores missing

A continuación os planteo como truco SAS una duda que nos mandaba LILIANA. Ella necesitaba estudiar los valores perdidos de las tablas de una librería determinada. En este caso vamos a estudiar los missing de las variables numéricas de una librería, de forma análoga se puede hacer con las alfanuméricas. Como siempre vamos a trabajar con un ejemplo que parte de tablas generadas aleatoriamente. Comenzamos generando estas tablas: libname datos "c:\temp\datos"; %macro aleatorios; %do i=1 %to 5; data datos.proyecto_&i.; do id=1 to 200; if int(ranuni(0)*10) = 2 then importe1=.; else importe1=round(rand("uniform")*1000,.1); if int(ranuni(0)*10) > 0.3 then importe2=.; else importe2=round(rand("uniform")*130,.1); length zona $15.; if ranuni(0) <=.32 then zona="España"; else if ranuni(1) <= 0.32 then zona="Cataluña"; else zona="Resto"; output; end; run; %end; %mend aleatorios; %aleatorios; ...

16 de marzo de 2009 · rvaquerizo

Monográficos. CALL SYMPUT imprescindible

He detectado que muchas búsquedas que llegan a Análisis y Decisión vienen por la palabra clave CALL SYMPUT. Por este motivo me he decidido a escribir este rápido monográfico sobre esta instrucción. Con un par de ejemplos podemos familiarizarnos con su funcionamiento.CALL SYMPUT es una rutina de SAS que nos permite crear macro variables durante la ejecución de un paso data, digamos que es un mecanismo que comunica el compilador del macro lenguaje SAS con el propio lenguaje SAS. El ejemplo prototípico de su uso, determinar el número de observaciones de un dataset que cumplen determinada condición: ...

16 de febrero de 2009 · rvaquerizo

Trucos SAS. Lista de datasets en macro variable

Un uso frecuente del proc sql es la generación de macro variables. En este ejemplo vamos a crear una macro variable con el nombre de los dataset de una librería SAS que empiecen por un determinado sufijo. También es un ejemplo bastante práctico del uso de las vistas de SASHELP. Creo que es un ejemplo bastante sencillo y sobre él iremos generando nuevos trucos que espero puedan serviros. Para entender mejor el truco vamos a generar 20 ficheros “ficticios” con variables aleatorias en el directorio c:\\temp de nuestro PC: ...

5 de febrero de 2009 · rvaquerizo