Trucos Excel (y SAS). Complemento para cambiar la configuración regional

Pasar salidas de SAS a Excel trae de cabeza a muchos usuarios. A este blog llegan un gran número de visitas desde Google con términos del tipo “importar datos de SAS a Excel”, “conectar SAS a Excel”, “cambiar la configuración regional con macros”… Hoy quería ayudaros un poco con esta problemática. Bueno, en realidad os va a ayudar el compañero Salva, que hace unos meses me pasó un complemento de Excel tremendamente útil para aquellos que movemos datos entre SAS y Excel. Para trabajar con este complemento, sólo tenéis que descargarlo en este enlace y activar el complemento en Opciones de Excel > Administrar complementos. Una vez hayamos hecho ésto, tendremos en nuestra pestaña de complementos lo siguiente: ...

25 de noviembre de 2011 · rvaquerizo

Revisión de las III Jornadas de R

El día 18 de noviembre finalizaron las III jornadas de R y mis impresiones no pueden ser más positivas. A nivel organizativo todo funcionó a la perfección, algo muy meritorio teniendo en cuenta que los organizadores no son expertos en el tema y es muy difícil organizar un evento con 200 personas inscritas. En cuanto a la participación, destacaría el gran número de asistentes y sus distintos ámbitos de procedencia. El contenido, lejos de parecer abrumador (muchas presentaciones de 10 minutos), al final se hacía muy ameno, aunque algunos ponentes eran considerablemente más aburridos que otros; en fin, no estábamos para divertirnos, pero algunos se limitaban a contar fórmulas. Los talleres han sido un éxito. También quería agradecer a la EOI las aulas que pusieron a disposición del evento. Creo que el pilar del éxito de las Jornadas ha sido la EOI por instalaciones, ubicación y disposición. ...

21 de noviembre de 2011 · rvaquerizo

Trucos SAS. Trasponer con SQL para torpes

Trasponer datos con SAS es un tema que genera un gran número de consultas en Google; por lo tanto, genera un gran número de visitas a este blog. Ya hay un monográfico al respecto, pero hoy quería volver a contar la trasposición de datos con SQL y SAS, pero a un nivel más bajo para que sea lo más sencillo posible. En el ejemplo partimos de una tabla con 3 variables: un id_cliente, un campo tipo y un campo precio. Cada tipo tiene un precio y necesitamos que nuestro dataset tenga un registro por id_cliente y 3 precios, uno por cada tipo. El ejemplo en código SAS: ...

21 de noviembre de 2011 · rvaquerizo

Segundo día en las III jornadas de R

Comenzamos el segundo día de las jornadas. Esto promete: el paquete brew para la automatización de informes. Una aplicación muy clara hacia el mundo empresarial. Por cierto, la organización un 10.

18 de noviembre de 2011 · rvaquerizo

¡Por fin en las III jornadas de R!

Ya estamos en las III Jornadas. Están a punto de comenzar. Continúo en Twitter. De momento la respuesta de la gente es muy positiva; la sala se está llenando (mucho).

17 de noviembre de 2011 · rvaquerizo

El sobremuestreo ¿mejora mi estimación?

El sobremuestreo (oversampling) es una técnica de muestreo que se emplea habitualmente cuando tenemos una baja proporción de casos positivos en clasificaciones binomiales. Los modelos pueden “despreciar” los casos positivos por ser muy pocos y nuestro modelo no funcionaría. Para incrementar el número de casos positivos se emplea el sobremuestreo. Ejemplos habituales pueden ser los modelos de fraude: un 99% de las compras son correctas y un 1% son fraudulentas. Si realizo un modelo sin tratar este desequilibrio, el algoritmo puede estar seguro al 99% de que todas las compras son correctas, ignorando el fraude. En este caso hemos de realizar un sobremuestreo para incrementar nuestros casos de fraude y poder detectar los patrones. ...

6 de noviembre de 2011 · rvaquerizo

Comparamos los programas electorales de PP y PSOE con R

Replicamos el post anterior sobre el análisis del programa electoral del PP y lo comparamos con el programa electoral del PSOE. Programas electorales que presentan estos partidos políticos españoles de cara a las elecciones del 20-N. No vamos a entrar en el contenido de ambos programas; sólo nos limitamos a representar gráficamente su contenido con nubes de palabras. Programa del PSOE: Programa del PP: Esto que veis es el análisis más completo que hay sobre los programas electorales. Lo malo (o lo bueno) es que cada uno ha de sacar sus propias conclusiones. Yo he sacado alguna impresión interesante. ...

3 de noviembre de 2011 · rvaquerizo

Análisis del programa electoral del Partido Popular antes de las elecciones en España

Ya empleamos R en alguna entrada anterior para analizar textos. Ahora nos metemos con el programa electoral del Partido Popular a 20 días de las elecciones en España. En este enlace podéis descargaros el programa. Lejos de lo insustanciales que suelen ser este tipo de documentos y alguna frase mítica del tipo «Crecimiento sin empleo no es recuperación», nos limitaremos a contar las palabras que emplean en este programa mediante técnicas de Text Mining. ...

1 de noviembre de 2011 · rvaquerizo

Chart Tools un add in imprescindible para Excel

El add-in JWalk Chart Tools de Excel, que os podéis descargar aquí, nos ofrece una serie de funcionalidades que pueden ayudarnos a trabajar con gráficos en Excel. Una vez descargado y activado el add-in, al seleccionar un gráfico podemos emplear este complemento. En la primera pestaña podemos añadir etiquetas personalizadas a nuestros gráficos de Excel, algo que ya realizamos con macros: Basta con seleccionar la serie y elegir el rango de datos que contiene las etiquetas. Para trabajar con etiquetas tenemos otro add-in de Excel que os recomiendo que descarguéis: el XY Chart Labeler. ...

28 de octubre de 2011 · rvaquerizo

Trucos SAS. Operaciones con tablas de dimensiones con SAS

Algunos llaman a las tablas de dimensiones tablas de lookup; yo me niego. Con SAS ya hemos visto cómo crear cruces de tablas de dimensiones con tablas de hechos a través de formatos; bajo mi punto de vista, el método más eficiente. Pero hoy quería traeros un ejemplo de cruce de tabla pequeña con tabla grande a través de array multidimensionales con SAS. Se trata de guardar los valores de la tabla pequeña en un array temporal multidimensional cuando leemos la tabla grande. Para ilustrar esta tarea, he preparado un ejemplo: ...

25 de octubre de 2011 · rvaquerizo