Esto si es un gráfico interactivo

Más gráficos de burbujas, pero esta vez interactivos. Interesante exposición de Hans Rosling sobre la evolución de la esperanza de vida en 200 países durante 2 siglos. Realmente espectacular y didáctico.

6 de diciembre de 2010 · rvaquerizo

Gráficos de burbuja con R

El otro día en R-bloggers leí este post. Entonces busqué información sobre estos gráficos con R en español y sólo encontré ayuda para realizarlos con Excel. Es verdad que el enlace que os pongo es más que suficiente para realizar los gráficos de burbuja, pero en pocas líneas puedo ilustrar mejor un ejemplo y proponeros varias formas de crearlo. La primera de ellas emplea la función symbols y genera el siguiente gráfico: ...

5 de diciembre de 2010 · rvaquerizo

Montemos un sistema de información en nuestro equipo (II)

Vamos a empezar a subir archivos a la BBDD. Evidentemente, lo primero que tenemos que hacer es crearnos una BBDD en Postgres. Con el PGAdmin creamos una nueva base de datos; disponemos de varias opciones, en nuestro caso no modificamos ninguna y creamos BD. Ya tenemos una BBDD funcionando y a la hora de conectarnos a ella tendremos que asignarle las propiedades necesarias para su correcto funcionamiento: Ya tenemos dispuesta la BBDD y ya podemos empezar a subir tablas. Para ello, ya os comenté que usaríamos el Data Integration de Pentaho (antes conocido como Kettle). La intención que tengo al montar este pequeño sistema de información es disponer de una serie de tablas para la realización de modelos estadísticos con R. Podría tener mi equipo lleno de ficheros de texto, de Excel y algún Access por ahí, pero es eso lo que pretendo evitar; con esto me garantizo un orden y un correcto acceso a mis tablas. Para comenzar a trabajar quiero subir una tabla del repositorio de datos UCI. Quiero seguir trabajando con el paquete e1071 de R y estoy analizando qué tablas son las que más se adecúan a mis objetivos; para ello tendré que cargar algunas y comprobar si los datos se adecúan a mis propósitos. ...

3 de diciembre de 2010 · rvaquerizo

Dos siglos de gráficos estadísticos 1750-1950

Visita virtual a la exposición del INE: «Dos siglos de gráficos estadísticos, 1750-1950». Si tenéis ocasión, no os la perdáis.

27 de noviembre de 2010 · rvaquerizo

Montemos un sistema de información en nuestro equipo (I)

Un poco de bricolaje. Se trata de crear un sistema de información sin coste y que nos permita almacenar nuestros datos con orden y coherencia, crear informes y realizar modelos matemáticos bajo Windows. Es perfectamente replicable para Linux. También estoy abierto a sugerencias, ya que tampoco soy ningún experto en el tema y podemos crear un debate interesante. El sistema que planteo se va a sustentar en tres pilares fundamentales que os podéis descargar de forma gratuita en los enlaces creados: ...

27 de noviembre de 2010 · rvaquerizo

Macros (fáciles) de SAS. Número de observaciones de un dataset

Con esta macro podréis identificar el número de observaciones de UN CONJUNTO DE DATOS SAS. No funciona con tablas Oracle, Informix, DB2,… me gustaría dejarlo claro. Al emplear la función de I/O OPEN junto con ATTRN y CLOSE no realizamos un conteo de observaciones. Al final el proceso crea una macro variable que se llama NOBS y que podremos usar en nuestra sesión SAS. %macro observaciones(datos); /*EL NUMERO DE OBS LO VAMOS A METER EN UNA MV GLOBAL*/ %global nobs; /*ABRIMOS EL CONJUNTO DE DATOS PARA VER SUS CARACTERISTICAS*/ %let datosid = %sysfunc(open(&datos)); /*SI ESTA ABIERTO ENTONCES LA FUNCION ATTRN NOS DA LA NOBS*/ %if &datosid %then %do; %let nobs =%sysfunc(attrn(&datosid,NOBS)); /*CERRAMOS EL CONJUNTO DE DATOS*/ %let rc = %sysfunc(close(&datosid));%end; %mend ; Fácil y rápida. Si alguien tiene problemas con su uso que lo comunique en el blog. Seguro que es de gran utilidad. Saludos.

24 de noviembre de 2010 · rvaquerizo

¿Proyectos de NOSQL en España?

Quería aprovechar que esta bitácora se lee en muchas empresas y universidades para buscar algún proyecto en NOSQL en España. Hace tiempo que estoy interesado en bases de datos no relacionales. La verdad es que no concibo una base de datos que no sea relacional; por ese mismo motivo me interesa tanto el tema. Si el paradigma del dinosaurio (yo) no es capaz de entender qué aporta el NOSQL, entonces es una tecnología muy a tener en cuenta. ...

16 de noviembre de 2010 · rvaquerizo

La importancia del parámetro HASHEXP

Ésta es la última entrada (de momento) sobre objetos hash en SAS. Quiero analizar la importancia que tiene el parámetro hashexp a la hora de crear el objeto hash cuando deseamos ordenar un conjunto de datos. Para ello, he realizado un experimento con SAS cuyo código podéis descargaros aquí. Es un código de calidad muy baja pero que da como resultado el siguiente gráfico: Se trata de un experimento en el que ordenamos un dataset con siete variables y diferentes tamaños; se miden los tiempos de ordenación para exponentes 2, 5, 10 y 20. Se realizan dos réplicas del experimento para evitar algún problema puntual con el equipo (deberían hacerse más, pero tarda mucho) y el resultado de la combinación entre tamaño-exponente nos da como resultado un tiempo de ejecución que graficamos. ...

16 de noviembre de 2010 · rvaquerizo

Laboratorio de código SAS. Ordenaciones con HASH vs. PROC SORT

Hace pocas fechas vimos el código SAS empleado para la realización de ordenaciones de conjuntos de datos SAS mediante algoritmos de hash. Ya os comuniqué que era una forma más eficiente, y hoy quería demostraros tal eficiencia con un laboratorio de código SAS. La situación es la siguiente: creamos un dataset con 1.000.000 de registros y 13 variables, y comparamos un PROC SORT con una ordenación mediante objetos hash; medimos tiempos y determinamos qué método es más eficiente. ...

15 de noviembre de 2010 · rvaquerizo

Trucos Excel. Mapa de España por provincias

Pongo a vuestra disposición un archivo Excel que nos permite la realización del siguiente gráfico: En este link podéis descargaros el archivo. He elegido formato Excel 2003 para el archivo; de este modo lo podréis utilizar muchos de vosotros. Si alguien desea el formato 2007, que lo diga. De momento es una primera versión a la que iré añadiendo un mayor número de funcionalidades. Se trata de un gráfico en el que podemos variar el color de cada una de las provincias mediante la siguiente macro: ...

15 de noviembre de 2010 · rvaquerizo