Macros (fáciles) de SAS. Número de observaciones de un dataset

Con esta macro podréis identificar el número de observaciones de UN CONJUNTO DE DATOS SAS. No funciona con tablas Oracle, Informix, DB2,… me gustaría dejarlo claro. Al emplear la función de I/O OPEN junto con ATTRN y CLOSE no realizamos un conteo de observaciones. Al final el proceso crea una macro variable que se llama NOBS y que podremos usar en nuestra sesión SAS. %macro observaciones(datos); /*EL NUMERO DE OBS LO VAMOS A METER EN UNA MV GLOBAL*/ %global nobs; /*ABRIMOS EL CONJUNTO DE DATOS PARA VER SUS CARACTERISTICAS*/ %let datosid = %sysfunc(open(&datos)); /*SI ESTA ABIERTO ENTONCES LA FUNCION ATTRN NOS DA LA NOBS*/ %if &datosid %then %do; %let nobs =%sysfunc(attrn(&datosid,NOBS)); /*CERRAMOS EL CONJUNTO DE DATOS*/ %let rc = %sysfunc(close(&datosid));%end; %mend ; Fácil y rápida. Si alguien tiene problemas con su uso que lo comunique en el blog. Seguro que es de gran utilidad. Saludos.

24 de noviembre de 2010 · rvaquerizo

La importancia del parámetro HASHEXP

Ésta es la última entrada (de momento) sobre objetos hash en SAS. Quiero analizar la importancia que tiene el parámetro hashexp a la hora de crear el objeto hash cuando deseamos ordenar un conjunto de datos. Para ello, he realizado un experimento con SAS cuyo código podéis descargaros aquí. Es un código de calidad muy baja pero que da como resultado el siguiente gráfico: Se trata de un experimento en el que ordenamos un dataset con siete variables y diferentes tamaños; se miden los tiempos de ordenación para exponentes 2, 5, 10 y 20. Se realizan dos réplicas del experimento para evitar algún problema puntual con el equipo (deberían hacerse más, pero tarda mucho) y el resultado de la combinación entre tamaño-exponente nos da como resultado un tiempo de ejecución que graficamos. ...

16 de noviembre de 2010 · rvaquerizo

Laboratorio de código SAS. Ordenaciones con HASH vs. PROC SORT

Hace pocas fechas vimos el código SAS empleado para la realización de ordenaciones de conjuntos de datos SAS mediante algoritmos de hash. Ya os comuniqué que era una forma más eficiente, y hoy quería demostraros tal eficiencia con un laboratorio de código SAS. La situación es la siguiente: creamos un dataset con 1.000.000 de registros y 13 variables, y comparamos un PROC SORT con una ordenación mediante objetos hash; medimos tiempos y determinamos qué método es más eficiente. ...

15 de noviembre de 2010 · rvaquerizo

Objetos hash para ordenar tablas SAS

A partir de la versión 9.1 de SAS se incluyeron los objetos hash. Hace tiempo ya demostramos su eficiencia en el cruce de tablas y hoy quería mostraros cómo se programa una ordenación empleando hash. La verdad es que estoy saboreando mis últimos días con SAS v9.2; en breve volveré a una versión muy anterior. El código, en mi opinión, es muy sencillo y, como es habitual, tenemos un ejemplo ilustrativo: ...

12 de noviembre de 2010 · rvaquerizo

Abreviar código en Enterprise Guide

En Enterprise Guide de SAS podemos ahorrarnos código empleando las abreviaturas del editor. Yo no lo recomiendo porque nuestros códigos sólo podrán ser ejecutados con nuestros equipos, pero Guide es una herramienta pensada para los usuarios y no para el desarrollo de código. Sobre un programa de Guide pulsamos sobre Programas -> Añadir abreviaturas y aparece la siguiente ventana: En la ilustración que os pongo hemos creado la abreviatura ps que equivale a proc sql. Con ello, cada vez que en el editor de programas de Guide pongamos ps veremos lo siguiente: ...

11 de noviembre de 2010 · rvaquerizo

Trucos SAS. Ejecutar un código si existe una tabla o un fichero

Esta duda me llegó hace unos días. Se trataba de ejecutar un código si existía determinado fichero o determinada tabla. Para hacer esto, os planteo una posible metodología que yo utilizaba cuando programaba SAS en una gran entidad bancaria con Enterprise Guide 1; por aquel entonces hacía maravillas con la “castaña” del Guide v1. Entre ellas, unas macros que contenían una sentencia condicional que ejecutaba un código en función de la función (bonita expresión) EXIST o FILEEXIST. Lo que yo hacía era algo parecido a esto: ...

10 de noviembre de 2010 · rvaquerizo

Macros (fáciles) de SAS. Normaliza un texto rápido

¿Tienes que normalizar un texto con SAS? Llevas dos horas buscando funciones de texto con la ayuda y te has crispado. En una macro y de forma muy rápida, os planteo un muestrario de funciones con las que podéis normalizar (un poco) un texto. Ésto es algo que tuve que hacer la otra mañana; no es muy sofisticado pero puede seros de utilidad: %macro prepara(varib); &varib. = translate(&varib., "AEIOU", "ÁÉÍÓÚ"); &varib. = tranwrd(&varib., "NUM", "NUMERO"); &varib. = tranwrd(&varib., "CONT", "CONTABLE"); &varib. = tranwrd(&varib., "IMP ", "IMPORTE "); &varib. = tranwrd(&varib., " POR ", " "); &varib. = tranwrd(&varib., " DE ", " "); &varib. = tranwrd(&varib., " EN ", " "); &varib. = tranwrd(&varib., " LOS ", " "); &varib. = tranwrd(&varib., " AL ", " "); &varib. = tranwrd(&varib., " EL ", " "); &varib. = tranwrd(&varib., " ULTIMOS 12 ", " 12 "); &varib. = tranwrd(&varib., " ULTIMOS 3 ", " 3 "); &varib. = tranwrd(&varib., " ULTIMO MES ", " MES "); &varib. = tranwrd(&varib., " TRANSACCIOENES ", " TRANSACCIONES "); call prxchange(prxparse('s/([A-ZÑa-zñ 0-9]*)([^A-Za-zÑñ 0-9]*)/$1/'), -1, &varib.); %mend; En realidad es una sucesión de TRANWRD, pero destacaría el uso de la función TRANSLATE para eliminar tildes en nuestras vocales y el uso de CALL PRXCHANGE, del que ya tuvimos un aperitivo hace tiempo. ...

8 de noviembre de 2010 · rvaquerizo

Duda de SAS. Longitud de la parte decimal de un número

Una búsqueda que me ha llegado: longitud de la parte decimal de un número con SAS. Nos sirve para recordar (me gusta insistir en el tema) cómo transformamos números en caracteres con SAS. La función PUT es la que realiza esta tarea: data _null_; y = 67.34123432; x = length(scan(put(y, best32.), 2, ".")); put x =; run; Transformamos un número a texto. Con SCAN buscamos la parte decimal, puesto que el separador será el .. Y con LENGTH tenemos la longitud resultante del texto obtenido. No sé para qué puede servir esto, pero ahí os planteo cómo se resuelve.

27 de octubre de 2010 · rvaquerizo

Macros (fáciles) de SAS. Busca duplicados

Una macro muy sencilla que ha aparecido en un programa de funcionalidades y que busca registros duplicados en tablas SAS. Es muy sencilla y a alguien puede serle útil y para eso estamos, para compartir conocimientos aunque sean sencillos. Pocos somos los que compartimos nuestro conocimiento y encima poniendo nuestro dinero, en fin, que me distraigo del tema. %macro busca_duplicados ( dataset, campo); proc sql; create table duplicados (where=(frec>1)) as select &campo., count(*) as frec from &dataset. group by 1; quit; %mend; No pongo ni ejemplo de uso, muy fácil. Pero ya verás como alguien le saca partido. Y todo esto de forma altruista, insisto, que si no me valoro yo no me valora nadie. Saludos.

7 de octubre de 2010 · rvaquerizo

La función LAG de SAS

La función LAG de SAS nos devuelve el valor de la observación $n - i$ de la variable indicada. Me explico con un ejemplo: data lagn; do i = 1 to 10; lag_1 = lag(i); lag_2 = lag2(i); lag_3 = lag3(i); lag_4 = lag4(i); lag_5 = lag5(i); lag_6 = lag6(i); output; end; run; Esto produce: LAG(i) nos da el valor de i para la observación anterior, LAG2(i) nos da el valor de las 2 observaciones anteriores… In el caso de encontrarnos en las primeras observaciones, el valor que devuelve es el missing. Con ella podemos evitar trabajar con RETAIN a la hora de hacer sumas acumuladas: ...

1 de octubre de 2010 · rvaquerizo