Trucos Excel. Unir varios Excel en uno

Tenía pendiente revisar una de las entradas más visitadas del blog. Trata la problemática de unir varios Excel en uno sólo. En el caso concreto servía para unir varios Excel generados por SAS a través de una macro en SAS. En la entrada de hoy quiero trabajar con un ejemplo que os podéis descargar aquí en formato rar. De los archivos que comparto el más interesante el que llamamos unir_varios_excel.xlsm se trata de un archivo Excel para macros que contiene un par de macros más que interesantes. Un pantallazo de este libro de Excel: ...

21 de septiembre de 2011 · rvaquerizo

Univariantes de campos de nuestra BBDD con kettle

El kettle no sólo puede servirnos para subir y bajar tablas a nuestra BBDD. También puede ayudarnos a describir las tablas de nuestras BBDD de una forma muy sencilla. El paso Univariate Statistics será nuestro aliado para esta sencilla tarea. Lo primero que tenemos que hacer es crear una conexión a nuestra BBDD. Hace tiempo ya hablamos de esta labor con Postgres. Una vez creada la conexión comprobamos su correcto funcionamiento y el primer paso será una Entrada Tabla donde seleccionaremos la tabla que deseamos describir: ...

12 de septiembre de 2011 · rvaquerizo

Análisis de textos con R

Vamos a replicar un ejemplo ya presentado con WPS en esta misma bitácora. Tratamos de hacer algo tan sencillo como contar palabras y para ello empleamos de nuevo un debate del Congreso de los Diputados de España. Estas intervenciones las transformamos en un fichero de texto que vosotros podéis descargaros de este link. Bien, partimos de un archivo de texto de Windows y con él vamos a crear un data frame de R que contendrá las palabras empleadas en esa sesión del Congreso español. Pasamos a analizar el código empleado: ...

5 de septiembre de 2011 · rvaquerizo

Lecciones de economía de un ignorante. La prima de riesgo (y la madre que la parió)

El término prima de riesgo está todo el día y a todas horas en los informativos españoles. La bolsa baja porque la prima de riesgo sube, ahora baja, ahora estamos por encima de Italia, luego por debajo, los franceses asustados,… En fin «los mercados» nos tienen asustados porque están locos, algunos llaman a esto volatilidad que suena más técnico. Y los menos puestos os preguntaréis ¿que es la prima de riesgo? Pues aquí estoy yo para transmitir mi ignorancia. Me centro en la zona Euro. ...

7 de agosto de 2011 · rvaquerizo

Árboles de decisión con SAS Base (con R por supuesto)

Con SAS Base podemos hacer árboles de decisión porque tenemos R. Así de sencillo. Vamos a utilizar SAS para gestionar nuestros datos y R será la herramienta que utilicemos para la realización del modelo de árbol de decisión. Posteriormente emplearemos las reglas generadas por el modelo para etiquetar a nuestros clientes en SAS. Con esta entrada pretendo ilustrar una serie de ejemplos en los que comunico SAS con R. Una herramienta nos sirve para el tratamiento de datos y la otra la utilizaremos para realizar modelos que no están al alcance de SAS. Para realizar esta comunicación SAS-R os planteo la creación en SAS de ficheros de texto con las instrucciones en R y la ejecución en modo batch de R con ese código creado en SAS. Aquí tenéis punto por punto el ejemplo: ...

12 de julio de 2011 · rvaquerizo

Trucos Excel. Mapa de España por provincias (mejores versiones)

Nuestro lector Jose Antonio tiene una nueva versión del mapa de España por provincias con Excel. Mejores y más comprensibles macros, el problema de León y las Canarias solventados y aparecen Ceuta y Melilla. En palabras del autor tenemos: El libro contiene varios botones: uno para agrupartodas las formas en una sola y poder ampliar el mapa y otros tres para cambiar los colores, dos de ello en función de tramos de una variable (población de las provincias y población por provincias de edad de 0 a 4 años, datos obtenidos del INE padrón 2010), el último para poner todas las provincias en blanco). He creado un mapa nuevo porque el que tienes en la página presenta el problema de León que está en dos formas y es mejor una forma para manejarla con código. No me he preocupado mucho por el tema de la estética, la idea de este libro es presentar varias formas de manejar un mapa por código. Aparecen representadas las ciudades autónomas de Ceuta y Melilla pero si se mantienen las escalas apenas se ven los colores de relleno. Baleares, Las Palmas y Santa Cruz de Tenerife aparecen como grupos porque en la estadística del INE vienen con esta agrupación pero si se dispone de datos a nivel de cada isla se pueden deshacer los grupos. ...

3 de julio de 2011 · rvaquerizo

Un repaso a los paquetes de R `solaR`, `chron`, `directlabels` y gráficos de densidades con `lattice`

Y además vamos a analizar si de verdad llueve más los fines de semana en Madrid. Hace tiempo que me gustaría estudiar la influencia de la contaminación en algunos fenómenos atmosféricos. Por supuesto no tengo tiempo para elaborar un estudio de ese tipo. La base de este estudio iba a ser el paquete solaR. Por otro lado quería elaborar un monográfico sobre el paquete chron que contiene funciones muy interesantes para el manejo de fechas. Sin tiempo es imposible, por ello nos vamos a acercar a estos dos paquetes con un ejemplo y de propina os presento directlabels otro paquete muy interesante para añadir etiquetas a nuestros gráficos. ...

22 de mayo de 2011 · rvaquerizo

Macros (fáciles) de SAS. Eliminar outliers en una variable

Hace tiempo ya os propuse una chapuza para eliminar outliers de forma multivariante. Por supuesto quedabaeliminar outliers en una variable. Recortar los valores extremos en aquellas variables cuantitativas que deseemos. Para ello os propongo una macro que no considero muy compleja y que os analisisaré con mayor detalle, pero lo primero la macro al completo: %macro elimina_outliers( varib, /*VARIABLE PARA ELIMINAR EL OUTLIER*/ entrada,/*DATASET DE ENTRADA*/ salida, /*DATASET DE SALIDA, PUEDE SER EL MISMO DE ENTRADA*/ corte_inferior, /*% DE CORTE INFERIOR*/ corte_superior);/*% DE CORTE SUPERIOR*/ *******************************************************************; *CREAMOS LOS PERCENTILES; data _null_; call symput ("lim1",compress(0+&corte_inferior.)); call symput ("lim2",compress(100-&corte_superior.)); run; *PREPARAMOS MV CON LOS NOMBRES QUE OBTENDREMOS DEL PROC UNIVARIATE; data _null_; call symput ('nom_lim1',compress("P_"||tranwrd("&lim1.",'.','_'))); call symput ('nom_lim2',compress("P_"||tranwrd("&lim2.",'.','_'))); run; *EL UNIVARIATE GENERA UNA SALIDA SOLO CON LOS PERCENTILES DESEADOS; proc univariate data=&entrada. noprint; var &varib.; output out=sal pctlpre=P_ pctlpts=&lim1.,&lim2.; quit; *CREAMOS MV CON LOS CORTES DESEADOS; data _null_; set sal; call symput("inf",&nom_lim1.); call symput("sup",&nom_lim2.); run; *REALIZAMOS EL FILTRO; data &salida.; set &entrada.; if &varib.>&inf. and &varib.<&sup.; run; proc delete data=sal;run; %mend; Su ejemplo de uso correspondiente: ...

16 de mayo de 2011 · rvaquerizo

Lecciones de economía de un ignorante. Poniendo fecha a la intervención de España

España no es Grecia - Expansión, España no es Irlanda: expertos opinan - Cinco Días y por supuesto España no es como Portugal - El Economista Observador. En realidad España es como las tres anteriores juntas y va a ser intervenida por el BCE a no ser que se volviera a la peseta. Los motivos son los de siempre pero me gustaría destacar el problema del endeudamiento : Este Muchos lo sabíamos, otros no querían verlo y los extranjeros lo acaban de descubrir - Investors Conundrum pone los pelos de punta. El gasto público disparado y el gasto privado disparado, esto es culpa de un modelo de estado que no se sostiene (desde los tiempos de Solchaga) y de un modelo de crecimiento demasiado arriesgado (desde los tiempos de Rato). El lío no sólo se debe a una burbuja yo creo que es una falta de rigor técnico y que va a llevar a la intervención de España. Un amigo mío decía: si le debes 5.000 euros al banco tienes un problema, si le debes 300.000 el problema lo tiene el banco. Si cae España cae un modelo económico. No cae un modelo político porque ese nunca ha llegado a funcionar. ...

21 de abril de 2011 · rvaquerizo

Trucos Excel. Poner etiquetas en gráficos de dispersión

Una macro de Visual Basic muy sencilla es la única forma de etiquetar gráficos de dispersión que me he encontrado. Si alguien encuentra otro modo más sencillo de hacerlo que lo comente en estas líneas. La intencion es llegar a este gráfico: No es que sea un gran gráfico, recordad que está hecho en Excel, pero nos permite ver como se distribuyen los paises en función de la renta per cápita y el número de horas trabajadas al año. Además podemos identificarlos perfectamente, como es el caso de Luxemburgo, como siempre. Los datos para realizar este gráfico están en la web de la OCDE. Nos los descargamos en Excel y tenemos una tabla de esta forma: ...

11 de abril de 2011 · rvaquerizo