Truco SAS. Transponer tablas con PROC TRANSPOSE, DATA o PROC SQL

Para transponer datasets disponemos en SAS del PROC TRANSPOSE. El ahora escribiente no es muy partidario de emplearlo. Prefiero otras metodologías para transponer conjuntos de datos SAS. Voy a trabajar con un ejemplo que os servirá para aproximaros al TRANSPOSE y para entender mejor las opciones de lectura de un PASO DATA y el funcionamiento del PROC SQL. La idea es, partiendo de una tabla de hechos por meses, transponer un campo importe. Vamos a simular una tabla con esa estructura: ...

27 de agosto de 2009 · rvaquerizo

Trucos SAS. Eliminar etiquetas en los conjunto de datos SAS

Hoy planteo un ejemplo de uso de las vistas de SASHELP con los nombres de las columnas de una tabla SAS. Además sirve para conocer mejor el PROC DATASETS y la creación de macro variables con el PROC SQL. Una macro que no es de mucha utilidad pero con la que podemos empezar a aproximarnos al lenguage macro de SAS: ```sas %macro sinetiquetas(conj); data _null_; if index("&conj.",".")=0 then x="WORK"; else x=substr("&conj.",1,index("&conj.",".")+1) ; call symput('libreria',x); y=substr("&conj.",index("&conj.",".")+1,length("&conj.")) ; call symput('tabla',y); proc sql noprint; select compress(name||"=''") into:l1 separated by " " from sashelp.vcolumn where libname=upcase("&libreria.") and memname=upcase("&tabla.") ; quit; proc datasets lib=&libreria. nolist; modify &tabla.; label &l1.; quit; %mend; Primero buscamos con un paso data si es una tabla temporal o permanente. Creamos una macro variable con los nombres de las variables preparadas para eliminar etiquetas (var1=»). Las etiquetas las quitamos con DATASETS y MODIFY. La macro sólo necesita como parámetro la tabla sobre la que deseamos eliminar las etiquetas. A pesar de ser un truco fácil seguro que más de uno se precompila esta macro en sus sesiones SAS.

17 de agosto de 2009 · rvaquerizo

Equivalencias entre PROC `SQL` y DATA en las uniones de tablas SAS

Muchos de los que llegan a programar con SAS son grandes expertos en SQL. Cuando dominas perfectamente un lenguaje es difícil acostumbrarse a otro. Por ello quiero plantear un artículo que estudie los tipos de uniones mediante pasos DATA y su análogo con el PROC SQL. Con ello espero que los profesionales que manejan el lenguaje SQL entiendan mejor el paso DATA. En mi línea habitual creo dos dataset y manejo ejemplos. ...

12 de agosto de 2009 · rvaquerizo

En MERGE, ¿mejor IF o WHERE?

Cuando programo en SAS algún paso data como unión con MERGE a modo de filtro empleo habitualmente IF en vez de WHERE. ¿El motivo? Mejor lo vemos en ejemplos. Voy a generar dos datasets aleatorios de 2 millones de registros cada uno. Tendrán un campo autonumérico y un campo aleatorio que toma valores entre 0 y 1: options fullstimer; data uno; do i = 1 to 2000000; aleatorio1=ranuni(9); output; end; run; data dos; do i = 1 to 2000000; aleatorio2=ranuni(2); output; end; run; Empleamos la opción fullstimer de SAS que nos ofrece unas estadísticas más detalladas de cada ejecución en el log, fundamentalmente nos interesa el tiempo real de ejecución. Los datasets aleatorios tienen las mismas observaciones y una estructura muy parecida. La idea es comparar el uso de IF frente a WHERE en un MERGE. Realizamos uniones horizontales entre ambas tablas y filtraremos sólo las observaciones con un valor del autonumérico i par, lo haremos de 3 formas pofibles y analizaremos el log: ...

11 de agosto de 2009 · rvaquerizo

Truco SAS. Transformación EBCDIC (Mainframe)

Hay ocasiones en las que tenemos que leer directamente de entornos Mainframe ficheros DB2, conocemos la estructura de esos ficheros y necesitamos leerlos vía FTP. Para ello tenemos que tener en cuenta la transformación EBCDIC (Extended Binary Coded Decimal Interchange Code ) a ASCII (American Standard Code for Information Interchange), esta transformación requiere las siguientes equivalencias entre formatos: Decimales empaquetados: PD5. -> S370FPD5. Enteros binarios: IB5. -> S370FIB5. Caracter: 5. ->EBCDIC5. Numérico con 0: Z5. -> S370FZDU5. De modo que para leer el fichero del Mainframe haremos: ...

15 de julio de 2009 · rvaquerizo

Manual. Curso introducción de R. Capítulo 17: Análisis Cluster con R (y III)

Ante el exito de los mensajes dedicados al análisis cluster la nueva entrega del manual de R la dedicaremos de nuevo al análisis de agrupamiento. Como es habitual trabajaremos con un ejemplo que podéis desgargaros aquí. Partimos de un archivo de texto delimitado por tabuladores con 46 frutas y la información que disponemos es: Nombre Intercambio de hidratos de carbono por gramo Kilocalorías Proteinas Grasas (información obtenida de www.diabetesjuvenil.com) El primer paso será crear un objeto en R que recoja los datos en el análisis. Para ello vamos a emplear la función read.table que deberá tener los parámetros adecuados al fichero de texto que deseamos leer: ...

8 de junio de 2009 · rvaquerizo

Muestreo de datos con R

Recientemente, hubo una entrada en este blog sobre cómo realizar muestreos aleatorios en tablas SAS. En ésta vamos a ver cómo se procedería con R. Consideraremos el conjunto de datos iris —de dimensión 150 x 5— y extraeremos 60 filas con distintos procedimientos. Para el muestreo aleatorio simple sin repetición , basta con hacer: indices <- sample( 1:nrow( iris ), 60 ) iris.muestreado <- iris[ indices, ] Para relizar un muestreo aleatorio simple con repetición , basta con sustituir la variable indices anterior por ...

4 de junio de 2009 · cgbellosta

Trucos SAS. Pasar de caracter a numérico y viceversa

Llega un gran número de visitas a AyD buscando como transformar en SAS variables caracter a numéricas y viceversa. Pero estas visitas están muy poco tiempo y me he planteado que los mensajes que hay dedicados al uso de PUT e INPUT no son claros. Por este motivo planteo un truco SAS de transformación de variables muy corto y concreto. Como es habitual lo vemos con ejemplos: Transformar de caracter a numérico: ...

3 de junio de 2009 · rvaquerizo

Participaciones Preferentes de las Cajas de Ahorro

Iba a escribir un mensaje alertando de las nuevas emisiones de Participaciones Preferentes de las Cajas de Ahorro pero me he encontrado con este foro en elConfidencial.com Atentos a los comentarios de jrwwpu17 , simplemente una lección magistral de conocimiento de la red comercial de un banco. Merece la pena leer todos sus comentarios y aprender. Así empieza: Ahora bien, el tocomocho va a ser mayúsculo entre jubilados, principal público objetivo de estas emisiones. Dentro de dos años les veremos con las cacerolas en las oficinas de las cajas. Al tiempo… ...

26 de mayo de 2009 · rvaquerizo

Trucos Excel. Eliminar referencias del tipo IMPORTARDATOSDINAMICOS

A la hora de referenciar en Excel celdas de tablas dinámicas es muy molesto encontrarnos con referencias del tipo «+IMPORTARDATOSDINAMICOS("CLIENTES"; F3;"POTENCIAL";2)» El IMPORTARDATOSDINAMICOS puede resultarnos muy molesto para trabajar con fórmulas que normalmente arrastramos. Para evitar este problema hemos de colocar en la barra de herramientas el botón «Generar GetPivotData». Esto lo hacemos ubicándonos en una barra de herramientas y con el botón derecho nos vamos a Personalizar y entre los botones de datos tenemos el Generar GetPivotData, como vemos en la figura adjunta. Lo seleccionamos y lo pulsamos cuando deseemos no tener la dichosa fórmula del IMPORTARDATOSDINAMICOS y podemos hacer fórmulas más habituales. ...

21 de mayo de 2009 · rvaquerizo