Atentos a los intervalos de confianza

Un intervalo de confianza es la zona en la que me fío de lo que estimo. Cuanto más amplia es esa zona menos me fío de lo que estimo, y cuanto más estrecha, más me fío de lo que estimo. Lo que pasa es que un intervalo de confianza, por definición, empieza con la famosa expresión: «dada una población de media $\mu$ y desviación típica $\sigma$…» ¡¡¡FU FU FU FU FU FU!!! ...

26 de julio de 2013 · rvaquerizo

Ya están en marcha las V Jornadas de R

Una noticia por todos conocida: ya están en marcha las V Jornadas de R. Esta vez son en Zaragoza, el 12 y 13 de diciembre. En el siguiente enlace tenéis toda la información: http://r-es.org/V+Jornadas Creo que no podré ir debido a la política de vacaciones tan anticuada que tienen algunas compañías. Saludos.

23 de julio de 2013 · rvaquerizo

Mapa Excel por distritos de Barcelona

De nuevo, agradecer a Manel Pla su colaboración con la bitácora. En esta ocasión, pone a nuestra disposición un mapa de Barcelona por barrios que podéis descargaros en el siguiente enlace: Relación de distritos de Barcelona (XLS) Sigue la misma línea de todos los mapas para Excel colgados en esta web, así que no es muy difícil su manejo. Pero si tenéis dudas o problemas, contactad. Agradecer a Manel su colaboración con este gran mapa de Barcelona en Excel. Saludos.

9 de junio de 2013 · rvaquerizo

Trucos SAS. Ordenar las variables de un dataset

Para cambiar el orden de las variables en un conjunto de datos SAS, hemos de emplear RETAIN antes de SET. Este truco es la respuesta a una duda planteada en el blog. Con un vistazo rápido al ejemplo entenderemos la sintaxis: data datos; do i = 1 to 20; importe1 = ranuni(8) * 100; importe2 = ranuni(3) * 100; importe3 = ranuni(1) * 100; id = put(i, z5.); output; end; drop i; run; data datos_reordenados; retain id importe3; set datos; run; Como vemos, RETAIN nos permite reordenar las variables del dataset independientemente del tipo de variable que estemos manejando. También podríamos emplear algún otro tipo de sentencia, pero es recomendable usar RETAIN; como vemos, no es necesario poner el total de las variables. Saludos.

30 de mayo de 2013 · rvaquerizo

Manual para realizar mapas en Excel con archivos SVG

Nueva documentación que nos ha mandado nuestro compañero Manel Pla. Se trata de un manual para la creación de mapas en Excel con el método del que ya hablamos una vez en el blog. El resultado del trabajo de Manel ya lo conocéis. A continuación tenéis el enlace con la descarga del manual: [Manual de creación de mapas en color para Excel (PDF)](/images/2013/05/CREACIO MAPA VALLES EN COLORS.pdf) Con colaboración sí que se puede dotar de más contenido al blog. Muchas gracias, Manel. Saludos.

17 de mayo de 2013 · rvaquerizo

SAS vs WPS. Diferencias de precio

Minequest tiene una actualización de los costes en software si se utiliza SAS o se utiliza WPS. Como vemos, es sustancialmente más económico emplear WPS. Y si hablamos de instalación en cliente/servidor, la diferencia se incrementa. En breve hablaré de las posibilidades estadísticas que ofrece WPS. De todos modos, visitad http://www.teamwpc.co.uk/products/wps y veréis los nuevos procedimientos que tiene la V3.

17 de mayo de 2013 · rvaquerizo

Video resumen del III Encuentro del Sector Seguros

Interesante vídeo que resume el III Encuentro del Sector Seguros en España. Pocos de los entrevistados usan el tiempo futuro y probablemente lo hagan por precaución. Me gusta que se hable de la solvencia, resultados técnicos, gestión de riesgos o suficiencia de prima. También se habla de low cost, pero se trata como algo coyuntural. Me sorprende que no se hable de la sostenibilidad de las pensiones.

15 de mayo de 2013 · rvaquerizo

Trabajando con factores en R. Attach frente a within

Un ejemplo de trabajo con datos en R. Transformamos factores de dos formas distintas. Por un lado empleamos within con recode de la librería car y, por otro lado, empleamos el mítico attach. Manejo de datos con within: library(car) # Supongamos que tenemos un data frame llamado datos datos <- within(datos, { reconocimientos2 <- recode(num_awards, "0='Sin reconocimiento'; 1='1 reconocimiento'; else='Más de un reconocimiento'") }) Manejo de datos con attach / detach: attach(datos) datos$math_cat[math < 50] <- "D" datos$math_cat[math >= 50 & math < 60] <- "C" datos$math_cat[math >= 60 & math < 75] <- "B" datos$math_cat[math >= 75] <- "A" detach(datos) No voy a entrar en qué es más óptimo, tarda menos y demás. En mi opinión es mejor utilizar within; parece más “pulcro” y la verdad es que la función recode nos facilita mucho el trabajo; pero, como siempre, tenemos múltiples posibilidades con R, por eso es R. Saludos.

14 de mayo de 2013 · rvaquerizo

Búsquedas de SQL frente a búsquedas de Hadoop

Ese gráfico está sacado de Google Trends. Representa la comparativa entre las búsquedas de SQL y Hadoop en Google. La caída del SQL frente al ligero ascenso del Hadoop. ¿Llegarán a converger estas dos líneas? Seguramente no. Hadoop parará su ascenso, pero SQL no parará su descenso. ¿A qué esperas para dejar de ser un dinosaurio?

30 de abril de 2013 · rvaquerizo

Mapa de Catalunya en Excel por comarcas

Nuevo mapa en Excel a la colección de esta web. Se trata de un mapa de Cataluña por comarcas que funciona a las mil maravillas y que nos ha pasado nuestro lector Manel Pla. Hay que reconocer que es un trabajo excelente, muy trabajado y sencillo de utilizar; incluso podéis pintar distintas medidas. Seguro que será de mucha utilidad. Además de este gráfico, Manel también nos ha pasado un mapa de Barcelona que colgaré en los próximos días. La verdad es que con estos lectores da gusto tener el blog. ...

29 de abril de 2013 · rvaquerizo