Test de Levene con SAS

El test de Levene se aplica para contrastar la igualdad de varianzas. Es un análisis de la varianza de las desviaciones de los valores muestrales respecto a una medida de tendencia central. Parte de la hipótesis nula de igualdad de varianzas. Para realizar este test en SAS emplearemos el PROC GLM en combinación con la opción HOVTEST. En la línea habitual, vemos un ejemplo: data datos; input presion @@; if _n_ <= 5 then grupo = 1; else if _n_ <= 10 then grupo = 2; else if _n_ <= 15 then grupo = 3; else if _n_ <= 20 then grupo = 4; else grupo = 5; datalines; 180 172 163 158 147 173 158 170 146 152 175 167 158 160 143 182 160 162 171 155 181 175 170 155 160 ; run; proc glm data=datos; class grupo; model presion = grupo; means grupo / hovtest; ods select HOVFTest; quit; Vemos que se trata de un código sencillo donde modelizamos con GLM la variable dependiente con la variable grupo y en MEANS indicamos con HOVTEST que deseamos que se realice el test de Levene; con ODS seleccionamos sólo esa salida. Este código podemos parametrizarlo y crear una macro que nos permita replicarlo: ...

7 de mayo de 2012 · rvaquerizo

R portable para Windows

Miguel Ángel Rodríguez pone a nuestra disposición una versión portable de R para Windows: https://stat.ethz.ch/pipermail/r-help-es/2012-April/003841.html Creo que será muy útil para aquellos que estáis comenzando a trabajar con R. La instalación es muy sencilla y os puede ahorrar mucho trabajo y tiempo. Desde estas líneas, agradecer a Miguel Ángel el trabajo.

24 de abril de 2012 · rvaquerizo

La distribución tweedie

Reconozco que hace muy poco tiempo que trabajo con las distribuciones Tweedie. Un viejo dinosaurio que trabaja sobre todo con SAS se hace el sordo cuando le hablan de la distribución Tweedie. Quizá sea el trabajo con SAS el que me ha nublado. Pero ahora que empiezo a trabajar con otras herramientas… Para comprender mejor la base teórica para este tipo de distribuciones os enlazo a la Wikipedia. Pero despierta mi interés debido a que se puede considerar una gamma con punto de masa en el 0; ¡toma aberración matemática! Aspecto interesante. ...

23 de abril de 2012 · rvaquerizo

Trucos SAS. Errores y formatos

Un truco SAS que puede ayudar a todos aquellos que estén empezando a programar en SAS. Hay ocasiones en que trabajamos con datasets que tienen formatos y nos encontramos con el error: «formato FMT no se ha encontrado o no se ha podido cargar». ¿Qué hacer? Lo primero es jugar con la opción FMTERR: options nofmterr; Esta opción de SAS nos permite trabajar con conjuntos de datos SAS con formatos aunque no estén cargados, porque no se tienen en cuenta los errores. Por otro lado, podemos emplear PROC DATASETS para eliminar todos los formatos (entrada y/o salida) de un conjunto de datos SAS; el código es el siguiente: ...

19 de abril de 2012 · rvaquerizo

Trucos SAS. Pasar fecha a carácter en SAS

Pasar números a carácter en SAS es un tema reiterativo tanto en entradas al blog como en búsquedas. Pero se le puede dar otra vuelta de tuerca. Se trata de transformar fechas a variables alfanuméricas, pero en este caso vamos a poner las fechas en formato español. Ejecutad este ejemplo en SAS: data uno; y = '30jan11'd; c0 = put(y, ddmmyy10.); c1 = upcase(put(y, ESPDFDD.)); c2 = upcase(put(y, ESPDFDE.)); c3 = upcase(put(y, ESPDFDN.)); c4 = upcase(put(y, ESPDFDT.)); c5 = upcase(put(y, ESPDFDWN.)); c6 = upcase(put(y, ESPDFMN.)); c7 = upcase(put(y, ESPDFMY.)); c8 = upcase(put(y, ESPDFWDX.)); c9 = upcase(put(y, ESPDFWKX.)); run; Imagino que todos tenéis el NLS de SAS instalado y no tenéis problemas con estos formatos. Resumamos qué nos ofrece cada una de estas transformaciones: ...

11 de abril de 2012 · rvaquerizo

Trucos Excel. Mapa de México por Estados

Hoy os presento la versión inicial del mapa de México por Estados Federales para que lo podáis usar en Excel, PowerPoint, Word o alguna de las herramientas habituales de ofimática. Se trata de un archivo Excel con macros que os podéis descargar en este enlace. La hoja Mapa contiene una serie de shapes que están nombrados para poder cambiar de color en función de una variable tramo. Este Excel inicial está preparado para poder pintar hasta cinco tramos; si deseáis más tramos, tenéis que meteros en el código de Visual Basic que modifica el color de cada uno de los 32 shapes que componen el mapa; posteriormente lo repasamos de forma rápida. Por otro lado, tenemos la división de los estados, el nombre de los shapes y los tramos que previamente habremos preparado. Este ejemplo no pinta nada concreto. ...

7 de abril de 2012 · rvaquerizo

Sobremuestreo y pesos a las observaciones. Ahora con R

De nuevo volvemos a la entrada de ayer para replicar el código SAS utilizado en R. Se trata de realizar tres modelos de regresión logística con R para estudiar cómo influyen en los parámetros el uso de un conjunto de datos con sobremuestreo o el uso de un conjunto de datos donde asignamos pesos a las observaciones. El programa es sencillo pero tiene un uso interesante de la librería sampling. Aquí tenéis el código: ...

27 de marzo de 2012 · rvaquerizo

En la regresión logística ¿el sobremuestreo es lo mismo que asignar pesos a las observaciones?

Hoy vamos a volver sobre el tema del sobremuestreo. Respondemos a un lector, Roberto, que hace mucho tiempo planteó una duda al respecto. La duda se puede resumir: en un modelo logístico, ¿equivale entrenar un modelo con las observaciones sobremuestreadas a entrenar el modelo poniendo un peso a cada observación? Esta cuestión nunca me la había planteado. Siempre había realizado un sobremuestreo de las observaciones adecuando la población de casos negativos a la población de casos positivos. Si estás habituado a trabajar con Enterprise Miner de SAS, es habitual asignar pesos a las observaciones para realizar el proceso de sobremuestreo. ¿Obtendremos distintos resultados? ...

26 de marzo de 2012 · rvaquerizo

Mapa de España por provincias en HTML

Nueva entrada en el blog dedicada a mapas, esta vez con HTML. Se trata de un mapa de España por provincias lo más sencillo posible. Es una imagen gif en blanco con el mapa de España; la imagen tiene un link para cada provincia. El link corresponde al identificador numérico de la provincia, los dos primeros dígitos del código postal. El resultado lo podéis ver y guardar en este enlace. No incluye las Ciudades Autónomas. No es un mapa muy vistoso, es lo más sencillo posible; sois vosotros los que tenéis que darle el formato que más se adecúe a vuestras necesidades. ...

13 de marzo de 2012 · rvaquerizo

Mapas con R en Omnia sunt Communia!

EXCEPCIONAL serie monográfica de mensajes del blog Omnia sunt Communia! sobre la realización de mapas con R: Parte I: mapa de la distribución de votos de las elecciones 2011 en España. Gran trabajo con los datos de mapas municipales del INE. Parte II: mapas de puntos de colores. Increíble el mapa de densidad de población. Parte III: mapas en formato SVG. Representación de datos en SVG con R; muy importante para todos aquellos que deseáis trabajar con mapas de provincias o comunidades. La serie monográfica es toda una referencia. Me atrevería a decir que es la mejor serie sobre la realización de mapas con R que circula por la red, por sencillez y practicidad. En breves días espero aportar mi granito de arena con otro tipo de mapa, pero mucho más sencillo. ...

4 de marzo de 2012 · rvaquerizo