La importancia del parámetro HASHEXP

Ésta es la última entrada (de momento) sobre objetos hash en SAS. Quiero analizar la importancia que tiene el parámetro hashexp a la hora de crear el objeto hash cuando deseamos ordenar un conjunto de datos. Para ello, he realizado un experimento con SAS cuyo código podéis descargaros aquí. Es un código de calidad muy baja pero que da como resultado el siguiente gráfico: Se trata de un experimento en el que ordenamos un dataset con siete variables y diferentes tamaños; se miden los tiempos de ordenación para exponentes 2, 5, 10 y 20. Se realizan dos réplicas del experimento para evitar algún problema puntual con el equipo (deberían hacerse más, pero tarda mucho) y el resultado de la combinación entre tamaño-exponente nos da como resultado un tiempo de ejecución que graficamos. ...

16 de noviembre de 2010 · rvaquerizo

Laboratorio de código SAS. Ordenaciones con HASH vs. PROC SORT

Hace pocas fechas vimos el código SAS empleado para la realización de ordenaciones de conjuntos de datos SAS mediante algoritmos de hash. Ya os comuniqué que era una forma más eficiente, y hoy quería demostraros tal eficiencia con un laboratorio de código SAS. La situación es la siguiente: creamos un dataset con 1.000.000 de registros y 13 variables, y comparamos un PROC SORT con una ordenación mediante objetos hash; medimos tiempos y determinamos qué método es más eficiente. ...

15 de noviembre de 2010 · rvaquerizo

Trucos Excel. Mapa de España por provincias

Pongo a vuestra disposición un archivo Excel que nos permite la realización del siguiente gráfico: En este link podéis descargaros el archivo. He elegido formato Excel 2003 para el archivo; de este modo lo podréis utilizar muchos de vosotros. Si alguien desea el formato 2007, que lo diga. De momento es una primera versión a la que iré añadiendo un mayor número de funcionalidades. Se trata de un gráfico en el que podemos variar el color de cada una de las provincias mediante la siguiente macro: ...

15 de noviembre de 2010 · rvaquerizo

Objetos hash para ordenar tablas SAS

A partir de la versión 9.1 de SAS se incluyeron los objetos hash. Hace tiempo ya demostramos su eficiencia en el cruce de tablas y hoy quería mostraros cómo se programa una ordenación empleando hash. La verdad es que estoy saboreando mis últimos días con SAS v9.2; en breve volveré a una versión muy anterior. El código, en mi opinión, es muy sencillo y, como es habitual, tenemos un ejemplo ilustrativo: ...

12 de noviembre de 2010 · rvaquerizo

Abreviar código en Enterprise Guide

En Enterprise Guide de SAS podemos ahorrarnos código empleando las abreviaturas del editor. Yo no lo recomiendo porque nuestros códigos sólo podrán ser ejecutados con nuestros equipos, pero Guide es una herramienta pensada para los usuarios y no para el desarrollo de código. Sobre un programa de Guide pulsamos sobre Programas -> Añadir abreviaturas y aparece la siguiente ventana: En la ilustración que os pongo hemos creado la abreviatura ps que equivale a proc sql. Con ello, cada vez que en el editor de programas de Guide pongamos ps veremos lo siguiente: ...

11 de noviembre de 2010 · rvaquerizo

Trucos SAS. Ejecutar un código si existe una tabla o un fichero

Esta duda me llegó hace unos días. Se trataba de ejecutar un código si existía determinado fichero o determinada tabla. Para hacer esto, os planteo una posible metodología que yo utilizaba cuando programaba SAS en una gran entidad bancaria con Enterprise Guide 1; por aquel entonces hacía maravillas con la “castaña” del Guide v1. Entre ellas, unas macros que contenían una sentencia condicional que ejecutaba un código en función de la función (bonita expresión) EXIST o FILEEXIST. Lo que yo hacía era algo parecido a esto: ...

10 de noviembre de 2010 · rvaquerizo

Macros (fáciles) de SAS. Normaliza un texto rápido

¿Tienes que normalizar un texto con SAS? Llevas dos horas buscando funciones de texto con la ayuda y te has crispado. En una macro y de forma muy rápida, os planteo un muestrario de funciones con las que podéis normalizar (un poco) un texto. Ésto es algo que tuve que hacer la otra mañana; no es muy sofisticado pero puede seros de utilidad: %macro prepara(varib); &varib. = translate(&varib., "AEIOU", "ÁÉÍÓÚ"); &varib. = tranwrd(&varib., "NUM", "NUMERO"); &varib. = tranwrd(&varib., "CONT", "CONTABLE"); &varib. = tranwrd(&varib., "IMP ", "IMPORTE "); &varib. = tranwrd(&varib., " POR ", " "); &varib. = tranwrd(&varib., " DE ", " "); &varib. = tranwrd(&varib., " EN ", " "); &varib. = tranwrd(&varib., " LOS ", " "); &varib. = tranwrd(&varib., " AL ", " "); &varib. = tranwrd(&varib., " EL ", " "); &varib. = tranwrd(&varib., " ULTIMOS 12 ", " 12 "); &varib. = tranwrd(&varib., " ULTIMOS 3 ", " 3 "); &varib. = tranwrd(&varib., " ULTIMO MES ", " MES "); &varib. = tranwrd(&varib., " TRANSACCIOENES ", " TRANSACCIONES "); call prxchange(prxparse('s/([A-ZÑa-zñ 0-9]*)([^A-Za-zÑñ 0-9]*)/$1/'), -1, &varib.); %mend; En realidad es una sucesión de TRANWRD, pero destacaría el uso de la función TRANSLATE para eliminar tildes en nuestras vocales y el uso de CALL PRXCHANGE, del que ya tuvimos un aperitivo hace tiempo. ...

8 de noviembre de 2010 · rvaquerizo

Trucos Excel. Archivos de un directorio con una macro

Puede resultarnos útil tener todos los archivos de un directorio en una tabla de Excel. Si estamos documentando un proceso, si nos dan un gran número de ficheros y tenemos que realizar procesos repetitivos sobre ellos, si queremos tener inventariados nuestros programas… Para esto os planteo una macro bien sencilla que recorre un directorio y nos escribe los elementos que encuentra en él. El código Visual Basic para la macro en Excel no puede ser más sencillo: ...

2 de noviembre de 2010 · rvaquerizo

Duda de SAS. Longitud de la parte decimal de un número

Una búsqueda que me ha llegado: longitud de la parte decimal de un número con SAS. Nos sirve para recordar (me gusta insistir en el tema) cómo transformamos números en caracteres con SAS. La función PUT es la que realiza esta tarea: data _null_; y = 67.34123432; x = length(scan(put(y, best32.), 2, ".")); put x =; run; Transformamos un número a texto. Con SCAN buscamos la parte decimal, puesto que el separador será el .. Y con LENGTH tenemos la longitud resultante del texto obtenido. No sé para qué puede servir esto, pero ahí os planteo cómo se resuelve.

27 de octubre de 2010 · rvaquerizo

Emisión de bonos de la Generalitat Catalana. ¿Cómo permiten esto?

Iba a alertar sobre la emisión de bonos de la Generalitat. Pero en Gurusblog ya lo han hecho por mí. Además, su exposición es magistral. La expresión “tienes más peligro que los bonos de Rumasa” ha cambiado; ahora hay que decir “tienes más peligro que las emisiones de Montilla”. El caso es que no entiendo cómo permiten semejante engaño.

26 de octubre de 2010 · rvaquerizo