Transformar variables en SAS. Carácter a numérico

Muchas visitas a este sitio son búsquedas de Google que plantean la problemática que surge al transformar variables carácter a numéricas y viceversa con SAS. Las palabras habituales son “transformar texto a número SAS”, “cómo paso de variable string a numérica en SAS”, “pasar de carácter a fecha en SAS”, “SAS transformar fecha numérica en texto”… son todas búsquedas que han generado mucho tiempo de estancia en el sitio, a pesar de que no existía un mensaje específico. En el siguiente monográfico vamos a tratar estas conversiones. De esta forma, se crearán una serie de dos posts que pueden ser un interesante material de consulta para profesionales y estudiantes que trabajen con SAS. ...

3 de diciembre de 2008 · rvaquerizo

Macros SAS. Hacer 0 los valores missing de un dataset

La siguiente macro de SAS nos permite transformar los valores perdidos (missing) en valor 0 para todas las variables de un dataset. Para todas, para todas las numéricas. Esto es muy importante porque en ocasiones es necesario distinguir el valor 0 del valor missing (.). Pero puede ser muy práctica si vamos a emplear procedimientos que han de distinguir valores perdidos o, simplemente, si deseamos que nuestra tabla tenga otro aspecto. ...

27 de noviembre de 2008 · rvaquerizo

Truco Excel. Nuestra propia función redondear en Excel

Hay operaciones que pueden ser muy habituales de hacer con Excel y para las que necesitaríamos una función propia que las realizara. A continuación, vamos a plantear una situación en la que es especialmente útil crear una función específica y guardarla en el libro de macros personal para utilizarla en nuestras sesiones. En este caso concreto, vamos a crear una función que nos redondee un número a 0 o 0,5; es decir, 6,3 valdría 6 y 6,7 valdría 6,5. Para realizarlo sin una función específica emplearíamos múltiples funciones de Excel, por ejemplo: ...

21 de noviembre de 2008 · rvaquerizo

Macros SAS. Transformar un numérico a fecha

A continuación, vamos a plantear una macro de SAS bastante sencilla que nos permitirá transformar valores numéricos del tipo 20080607 (fechas en formato AAAAMMDD pero que son numéricas) a valores fecha en SAS que nos permitirán realizar operaciones. Siguiendo el sistema de todos los mensajes de AyD, trabajaremos con ejemplos para estudiar su utilidad. Partimos de dos fechas en formato AAAAMMDD y deseamos realizar una diferencia entre ellas: data _null_; y = 20070101; m = 20080110; dif = m - y; put "Diferencia incorrecta: " dif; run; En el log obtenemos que la diferencia entre estas dos fechas es 10009; necesitamos transformarlas en variables numéricas pero del tipo fecha. Tenemos múltiples posibilidades para realizar esta transformación, pero en este caso voy a emplear la función de creación de fecha en SAS MDY(mes, día, año). ...

20 de noviembre de 2008 · rvaquerizo

Trabajo con fechas SAS. Formatos de fecha SAS más utilizados

En esta nueva entrega del monográfico de fechas SAS, vamos a estudiar algunos formatos. Un formato es la forma en la que visualizamos una variable. El valor 17327 es un número sin significado aparente, pero el 20 de junio de 2007 es una fecha comprensible. En la anterior entrega estudiamos cómo SAS guarda las fechas como variables numéricas (número de días transcurridos desde el 1 de enero de 1960). Las fechas-hora se guardan como el número de segundos transcurridos. Con los distintos formatos, nosotros podremos visualizar estas variables numéricas de SAS. Por ejemplo: ...

10 de noviembre de 2008 · rvaquerizo

Manual. Curso introducción de R. Capítulo 12: Análisis de la varianza. Diseños bifactoriales

En esta nueva entrega del manual de R vamos a ver un modelo ANOVA que analiza dos fuentes de variación. Si recordamos, en el capítulo 11 estudiamos la diferencia entre los tratamientos que seguían determinados pacientes: teníamos una variable respuesta en función de una variable factor, el diseño factorial aleatorizado. En este caso, vamos a tener la variable respuesta en función de dos factores y podrá existir una interacción entre ambos, con lo que la tabla ANOVA será del siguiente modo: ...

4 de octubre de 2008 · rvaquerizo

Manual. Curso introducción de R. Capítulo 10: Funciones gráficas en regresión lineal

En esta nueva entrega del manual de R vamos a trabajar con más ejemplos de regresión lineal haciendo especial mención a las posibilidades gráficas de R. El ejemplo de partida será el mismo empleado en el capítulo 9. Ejemplo 10.1: Si recordamos en el capítulo 9 en el ejemplo 9.2 hicimos un modelo para predecir las notas finales a partir de las notas de los exámenes previos, el test y la puntuación del laboratorio. Teníamos una variable dependiente que era la nota final y cuatro variables regresoras. Vimos que el modelo presentaba múltiples lagunas (multicolinealidad, un modelo con un r cuadrado bajo,…). Pues ahora hemos de mejorar el modelo. Es difícil mejorarlo en precisión porque no tenemos más variables regresoras en el conjunto de datos por eso podemos mejorarlo haciéndolo más sencillo y recogiendo una cantidad de información lo más grande posible con un modelo lo más reducido posible, es decir, vamos a seleccionar un modelo de regresión. Para hacer esto contamos con la función step que selecciona el modelo a partir del criterio de información de Akaike (AIC, siglas en inglés). Creamos un estadístico que permite decidir el orden de un modelo. AIC toma en consideración tanto la medida en que el modelo se ajusta a las series observadas como el número de parámetros utilizados en el ajuste. Buscamos el modelo que describa adecuadamente las series y tenga el mínimo AIC. Comencemos a trabajar con R, el primer paso será obtener y preparar el conjunto de datos: ...

3 de octubre de 2008 · rvaquerizo

Manual. Curso introducción de R. Capítulo 11: Introducción al análisis de la varianza (ANOVA)

Para realizar la introducción al análisis de la varianza (ANOVA) con R comenzaremos estableciendo unos conceptos básicos. Lo primero que hacemos es plantear una hipótesis que va a motivar un experimento, elegimos el diseño para nuestro experimento y recogemos los datos y los analizamos mediante el análisis de la varianza que consiste en descomponer la variabilidad total de los datos en sumandos cada uno de ellos asignable a una fuente de variación; posteriormente ya sacamos conclusiones. Lo que se expone a continuación viene recogido en los libros: ...

3 de octubre de 2008 · rvaquerizo

Como influyen los números máquina en nuestros programas

Es imposible no cometer un error a la hora de ajustar un número de máquina, ya que todos los números tienen un espacio asignado y números con infinitos decimales no se pueden almacenar en memoria correctamente. Este «pequeño» error puede influir en nuestra programación. Vamos a crear una función en R que nos permita ejemplificar cómo pueden influir los errores de aproximación de los números de máquina en la programación. La siguiente función realiza la operación aritmética 1.1/11, 3.3/33… y, mediante la función ifelse, creamos una condición: ...

1 de octubre de 2008 · rvaquerizo

Trucos SAS. Operar con fechas YYYYMM típicas de particiones Oracle

Este truco va orientado a programadores SAS que estén habituados a trabajar con Oracle. El SAS Tip de hoy nos permite parametrizar a la perfección la lectura de tablas históricas particionadas. En estos casos, podemos crear parámetros con macrovariables de SAS para leer las tablas Oracle sin necesidad de modificar manualmente las fechas de partición. Un ejemplo Sin parametrizar: proc sql; create table maximo as select idcliente, max(importe) as importe_semestral from ora.tabla where f_particion in (200801, 200806, 200812); quit; Parametrizado: proc sql; create table maximo as select idcliente, max(importe) as importe_semestral from ora.tabla where f_particion in (&mes_menos_6., &mes., &mes_mas_6.); quit; Con este ejemplo queda claro nuestro objetivo. En el siguiente paso DATA veremos las funciones que vamos a emplear para trabajar con fechas de partición AAAAMM (las más habituales): ...

1 de octubre de 2008 · rvaquerizo