La importancia del parámetro HASHEXP

Ésta es la última entrada (de momento) sobre objetos hash en SAS. Quiero analizar la importancia que tiene el parámetro hashexp a la hora de crear el objeto hash cuando deseamos ordenar un conjunto de datos. Para ello, he realizado un experimento con SAS cuyo código podéis descargaros aquí. Es un código de calidad muy baja pero que da como resultado el siguiente gráfico: Se trata de un experimento en el que ordenamos un dataset con siete variables y diferentes tamaños; se miden los tiempos de ordenación para exponentes 2, 5, 10 y 20. Se realizan dos réplicas del experimento para evitar algún problema puntual con el equipo (deberían hacerse más, pero tarda mucho) y el resultado de la combinación entre tamaño-exponente nos da como resultado un tiempo de ejecución que graficamos. ...

16 de noviembre de 2010 · rvaquerizo

Laboratorio de código SAS. Ordenaciones con HASH vs. PROC SORT

Hace pocas fechas vimos el código SAS empleado para la realización de ordenaciones de conjuntos de datos SAS mediante algoritmos de hash. Ya os comuniqué que era una forma más eficiente, y hoy quería demostraros tal eficiencia con un laboratorio de código SAS. La situación es la siguiente: creamos un dataset con 1.000.000 de registros y 13 variables, y comparamos un PROC SORT con una ordenación mediante objetos hash; medimos tiempos y determinamos qué método es más eficiente. ...

15 de noviembre de 2010 · rvaquerizo