Truco SAS. Un vistazo a ficheros planos muy grandes

¿Alguna vez no habéis podido abrir un fichero de texto muy grande para comprobar si tiene cabeceras o conocer el separador de campos? Es habitual emplear para esto el gran UltraEdit. Pero podemos emplear el PROC FSLIST de SAS para poder hacer esta tarea, y se nos abrirá de inmediato una vista del fichero en una ventana de nuestra sesión SAS. La sintaxis es muy sencilla: proc fslist fileref="Z:\temp\archivo_enorme.txt"; run; Este sencillo código nos abrirá las primeras líneas del archivo en un instante y así podremos comprobar si tiene cabeceras o el separador que utiliza. Esto nos facilitaría la importación del fichero a tabla SAS. Saludos.

20 de agosto de 2012 · rvaquerizo

Fechas importantes para las IV Jornadas de Usuarios de R

Hay que tener en cuenta las siguientes fechas para todos aquellos que deseéis participar: 16 de septiembre de 2012: Fecha límite para el envío de abstracts. 21 de octubre de 2012: Fecha límite para la aceptación de abstracts. Las IV Jornadas de Usuarios de R tendrán lugar en el CREAL los días 15 y 16 de noviembre de 2012. Hay en marcha una competición de análisis de datos con R; cuando tenga conocimiento de las bases y las fechas, os las comunico. ...

7 de agosto de 2012 · rvaquerizo

Trucos Excel. Gráficos dot plot, representando un ranking gráficamente

Los gráficos de puntos (dot plots) son muy prácticos para representar de una forma visual rankings (por ejemplo). En Excel, su realización no es inmediata como con otras herramientas (R, por ejemplo). Para ilustrar el ejemplo, se van a presentar los 20 primeros puestos de la lista TIOBE de mayo de 2012 (la entrada estaba en la nevera). Entramos en la lista y, sin más, copiamos y pegamos los datos de tabla HTML a tabla Excel: ...

6 de agosto de 2012 · rvaquerizo

Solventamos los peligros del análisis cluster con SVM

Retomamos un asunto tratado en días anteriores: los peligros de realizar un análisis de agrupamiento basado en las distancias entre observaciones. ¿Cómo podemos evitar este problema? Empleando máquinas de vectores de soporte, traducción de Support Vector Machines (SVM). Esta técnica de clasificación, de la que ya hablamos en otra entrada, nos permite separar observaciones con base en la creación de hiperplanos que las separan. Una función kernel será la que nos permita crear estos hiperplanos; en el caso que nos ocupa, tenemos solo dos variables y necesitamos crear líneas de separación entre observaciones. En la red tenéis una gran cantidad de artículos sobre estas técnicas. ...

1 de agosto de 2012 · rvaquerizo

Ya están en marcha las IV jornadas de usuarios de `R` en España

En esta dirección tenéis toda la información necesaria: [http://www.r-es.org/IV+Jornadas](http://www.r-es.org/IV+Jornadas) Para variar soy el último en hacerme eco de tan magno evento al que espero asistir, siempre digo lo mismo y no voy.

19 de julio de 2012 · rvaquerizo

Un peligro del análisis cluster

Quería plantearos un ejemplo de análisis cluster para observar el peligro que tiene agrupar observaciones in base a grupos homogéneos creados con distancias multivariantes. Para ilustrar el ejemplo, trabajamos con R; creamos grupos in base a dos variables, lo que nos facilita los análisis gráficos. Simulamos el conjunto de datos con el que trabajamos: # GRUPO 1 x <- runif(500, 70, 90) y <- runif(500, 70, 90) grupo1 <- data.frame(cbind(x, y)) grupo1$grupo <- 1 # GRUPO 2 x <- runif(1000, 10, 40) y <- runif(1000, 10, 40) grupo2 <- data.frame(cbind(x, y)) grupo2$grupo <- 2 # GRUPO 3 x <- runif(3000, 0, 100) y <- runif(3000, 0, 100) grupo3.1 <- data.frame(cbind(x, y)) grupo3.1$separacion <- (x + y) grupo3.1 <- subset(grupo3.1, separacion >= 80 & separacion <= 140, select = -separacion) grupo3.1 <- subset(grupo3.1, y > 0) grupo3.1$grupo <- 3 # UNIMOS TODOS LOS GRUPOS total <- rbind(grupo1, grupo2, grupo3.1) plot(total$x, total$y, col = c(1, 2, 3)[total$grupo]) Los grupos parecen claros: ...

16 de julio de 2012 · rvaquerizo

Sentencia Test-Achats

A pesar del título, no voy a hablar del principio de igualdad de trato entre hombres y mujeres en el acceso a bienes y servicios y su suministro, que regula los factores actuariales para tarificar en función del sexo. Sólo me he ido a Rastreator.com y he tarificado a una mujer de 32 años con un vehículo de los más vendidos. La fecha de hoy es 06/07/2012. En diciembre de 2012 volveré a recuperar esta entrada y hablaré del derecho. Saludos.

6 de julio de 2012 · rvaquerizo

Lecciones de economía de un ignorante: Solución: ¡TRABAJAR MÁS Y COBRAR MENOS!

Mi buen amigo David lleva varios días realizando un interesante análisis de la situación económica actual. Hoy quiero concentrar en pocas líneas este análisis. La hecatombe bancaria se produce debido al incremento de la morosidad; sin embargo, ésta es una situación que ya hemos vivido: Fuente: Morosidad - El País David se pregunta: “¿Qué pasó para que a partir del 93 un indicador de situaciones de crisis como la morosidad bajara de forma tan espectacular como subió?”. La respuesta en: ...

28 de junio de 2012 · rvaquerizo

Lecciones de economía de un ignorante. España está salvando a Alemania, pero Alemania no está salvando Europa

Observemos cuánto le cuesta financiarse a España y cuánto le cuesta financiarse a Alemania en el último año. Ya hablamos de cómo crear este gráfico: El plan le ha salido a Alemania. Se financia a un $1,5%$, mientras que España se financia al $7%$. Así funciona Europa. Algo falla. Algo huele mal. No es Europa quien ha salido al rescate de España, sino que parece que es España la que está amortiguando la crisis de deuda pública. ¿El motivo? Está menos expuesta, no necesita emitir tanta deuda para financiarse como Alemania. Pero el problema de todo esto es que a Alemania se le ha ido de las manos y está mirando al otro lado. ¿Y cómo se frena esto? Desde la intervención política sobre eso que denominan MERCADOS. Por una vez pienso que este problema no lo solucionan los tecnócratas; esto se soluciona impidiendo que un inversor pueda hundir un país. Lo que pasa es que no se atreven, y eso es lo que se me escapa.

17 de junio de 2012 · rvaquerizo

Lecciones de economía de un ignorante. Los bancos pierden dinero para favorecer a unos y luego los salvamos todos

Si pintamos con Excel una línea con el Euribor a 6 meses y otra línea con el interés medio a un año de los depósitos bancarios, tenemos: La fuente de datos es: EURIBOR 6M (SDW - ECB) Interés medio depósitos España (SDW - ECB) Los datos del interés medio los suministra el Banco de España. Sé que no son datos 100% comparables, pero sirven para este argumento. Hasta 2009 los intereses que daban los bancos estaban por debajo del precio del dinero. Después, los bancos están dando dinero a pérdidas. ...

7 de junio de 2012 · rvaquerizo