Nueva edición del Curso Básico de R

Tenemos buenas noticias para todos aquellos que se quieran introducir en el mundo de R. El curso que se puso en marcha hace unos 9 meses tiene una nueva edición. Además, se incorpora al equipo de formadores (formado por Juan José Gibaja y Carlos Gil) Juan Pablo Braña. No hace falta desear éxito: está garantizado. Para más información A Q U Í. Retuitead, compartid, pulsar “Me Gusta” para que tenga el mayor alcance posible. Saludos.

5 de febrero de 2013 · rvaquerizo

¿Cómo medir la presencia de R en el mercado del análisis de datos?

Mientras comía hoy, he estado leyendo el The Forrester Wave™: Big Data Predictive Analytics Solutions, Q1 2013, un informe sobre las herramientas de análisis predictivo con mayor presencia en el mercado. Las herramientas de SAS e IBM son las mejor paradas en el estudio: Típico gráfico bivariable con «pelotitas». No voy a entrar en la calidad del gráfico ni de la segmentación representada. Pero es difícil saber dónde quedaría R; tenemos a la gente de Revolution Analytics, pero, en mi opinión, no sirve para medir la presencia de R. Es evidente que tampoco es la intención de esta gente medir el uso de software no comercial, pero eso se averigua leyendo el análisis, no viendo los títulos. De momento, me seguiré quedando con TIOBE. Saludos.

14 de enero de 2013 · rvaquerizo

Nuevo curso de estadística con R

De nuevo Juanjo Gibaja y Carlos Gil ponen en marcha un nuevo curso de estadística con R. Gratuito y abierto a todo aquel que desee inscribirse. En la web de Carlos podéis encontrar más información acerca de este nuevo curso. El nombre ahora es Introducción a la Estadística Moderna con R. Viendo cómo funcionó el anterior curso, el éxito está garantizado; y en este caso, la temática es más interesante si cabe, por lo que le auguro aún mayor éxito. ...

23 de octubre de 2012 · rvaquerizo

Cuánto dinero pierdo jugando a la lotería. Una simulación poco seria con R

Esta pantalla es muy habitual en mi televisor todos los jueves por la noche. Son los resultados de la Lotería Nacional de España, el sorteo de los jueves. Mi mujer insiste en comprar lotería para dejar de ser pobres. No es una buena opción. Aunque, por lo menos, ahora compramos lotería nacional. Antes jugábamos a eso de la Bonoloto; las probabilidades de que te toque son menores que la cantidad de sustancias dopantes que le encontraron al gran Alberto Contador. Eso lo entendió, pero había que jugar. ¿Y cuánto nos cuesta jugar? ...

18 de septiembre de 2012 · rvaquerizo

Fechas importantes para las IV Jornadas de Usuarios de R

Hay que tener en cuenta las siguientes fechas para todos aquellos que deseéis participar: 16 de septiembre de 2012: Fecha límite para el envío de abstracts. 21 de octubre de 2012: Fecha límite para la aceptación de abstracts. Las IV Jornadas de Usuarios de R tendrán lugar en el CREAL los días 15 y 16 de noviembre de 2012. Hay en marcha una competición de análisis de datos con R; cuando tenga conocimiento de las bases y las fechas, os las comunico. ...

7 de agosto de 2012 · rvaquerizo

Solventamos los peligros del análisis cluster con SVM

Retomamos un asunto tratado en días anteriores: los peligros de realizar un análisis de agrupamiento basado en las distancias entre observaciones. ¿Cómo podemos evitar este problema? Empleando máquinas de vectores de soporte, traducción de Support Vector Machines (SVM). Esta técnica de clasificación, de la que ya hablamos en otra entrada, nos permite separar observaciones con base en la creación de hiperplanos que las separan. Una función kernel será la que nos permita crear estos hiperplanos; en el caso que nos ocupa, tenemos solo dos variables y necesitamos crear líneas de separación entre observaciones. En la red tenéis una gran cantidad de artículos sobre estas técnicas. ...

1 de agosto de 2012 · rvaquerizo

Ya están en marcha las IV jornadas de usuarios de `R` en España

En esta dirección tenéis toda la información necesaria: [http://www.r-es.org/IV+Jornadas](http://www.r-es.org/IV+Jornadas) Para variar soy el último en hacerme eco de tan magno evento al que espero asistir, siempre digo lo mismo y no voy.

19 de julio de 2012 · rvaquerizo

Un peligro del análisis cluster

Quería plantearos un ejemplo de análisis cluster para observar el peligro que tiene agrupar observaciones in base a grupos homogéneos creados con distancias multivariantes. Para ilustrar el ejemplo, trabajamos con R; creamos grupos in base a dos variables, lo que nos facilita los análisis gráficos. Simulamos el conjunto de datos con el que trabajamos: # GRUPO 1 x <- runif(500, 70, 90) y <- runif(500, 70, 90) grupo1 <- data.frame(cbind(x, y)) grupo1$grupo <- 1 # GRUPO 2 x <- runif(1000, 10, 40) y <- runif(1000, 10, 40) grupo2 <- data.frame(cbind(x, y)) grupo2$grupo <- 2 # GRUPO 3 x <- runif(3000, 0, 100) y <- runif(3000, 0, 100) grupo3.1 <- data.frame(cbind(x, y)) grupo3.1$separacion <- (x + y) grupo3.1 <- subset(grupo3.1, separacion >= 80 & separacion <= 140, select = -separacion) grupo3.1 <- subset(grupo3.1, y > 0) grupo3.1$grupo <- 3 # UNIMOS TODOS LOS GRUPOS total <- rbind(grupo1, grupo2, grupo3.1) plot(total$x, total$y, col = c(1, 2, 3)[total$grupo]) Los grupos parecen claros: ...

16 de julio de 2012 · rvaquerizo

Curso básico de R

Meritoria iniciativa de: jjgibaja.net datanalytics.com/blog O, lo que es lo mismo, Juan José Gibaja y Carlos J. Gil Bellosta. Me hago eco de la noticia un poco tarde. Es curioso cómo hay personas que comparten de forma altruista su conocimiento; aunque me creáis exagerado, es el camino para que todos seamos un poco mejores: el conocimiento no el derecho. Ya escribiré sobre el tema si tengo tiempo. Acceded al curso aquí —> http://cursorbasico.usar.org.es/ ...

5 de junio de 2012 · rvaquerizo

La distribución tweedie

Reconozco que hace muy poco tiempo que trabajo con las distribuciones Tweedie. Un viejo dinosaurio que trabaja sobre todo con SAS se hace el sordo cuando le hablan de la distribución Tweedie. Quizá sea el trabajo con SAS el que me ha nublado. Pero ahora que empiezo a trabajar con otras herramientas… Para comprender mejor la base teórica para este tipo de distribuciones os enlazo a la Wikipedia. Pero despierta mi interés debido a que se puede considerar una gamma con punto de masa en el 0; ¡toma aberración matemática! Aspecto interesante. ...

23 de abril de 2012 · rvaquerizo