Trucos R. El paquete `classInt` para clasificar variables continuas

El paquete classInt de R últimamente está muy presente en mis programas y me gustaría dedicarle unas líneas para que podáis ver algunas de sus posibilidades a la hora de clasificar variables continuas, además estas posibilidades unidas con RColorBrewer nos permiten crear gráficos muy atractivos. Instalamos y clasificamos un vector de ejemplo: aleatorio <- abs(rnorm(100,50,30)) summary(aleatorio) grupos <- 4 clases <- classIntervals(aleatorio, grupos, style="quantile") clases style: quantile one of 156,849 possible partitions of this variable into 4 classes [1.225299,29.19317) [29.19317,51.55524) [51.55524,72.06471) [72.06471,118.6466] 25 25 25 25 Partimos un vector aleatorio en 4 clases en función de sus cuantiles y creamos un lista clases que contiene nuestra tabla y entre sus atributos destaca brks que indica los puntos de corte, en el caso de los cuantiles tenemos: ...

2 de julio de 2015 · rvaquerizo

Juego de modelos de regresión con R

Os propongo un juego con R. El juego parte de unos datos aleatorios que he generado con R (los que veis arriba) que dividimos en entrenamiento y test. Sobre el conjunto de datos de entrenamiento he realizado varios modelos y valoro las predicciones gráficamente sobre los datos de test. El juego consiste en asociar cada resultado gráfico de test a cada código de R correspondiente y justificar brevemente la respuesta. ...

28 de junio de 2015 · rvaquerizo

Nueva reunión del grupo de usuarios de R en Madrid

Nueva cita para el martes 12 de mayo en el MediaLab con el grupo de usuarios de R en Madrid. En esta ocasión Pedro Concejero hará la presentación “Clasificación de películas con el dataset Movielens – técnicas de factorización en R”. Los datasets de Movielens son un clásico de la investigación en recomendadores (https://movielens.org/ http://grouplens.org/datasets/movielens/). Muy recientemente (abril 2015) se ha liberado el último dataset con 20 millones de valoraciones de más de 26 mil películas por parte de casi 140 mil evaluadores. Las técnicas de reducción de dimensionalidad, o factorización, son la base para el desarrollo de recomendadores, pero también permiten extraer agrupaciones de contenidos similares por las preferencias de los evaluadores, se pueden interpretar también como “géneros aprendidos”. En esta charla veremos la aplicación de las técnicas de factorización y los retos que supone abordar este dataset, todo ello con las múltiples herramientas analíticas que ofrece R. ...

11 de mayo de 2015 · rvaquerizo

Curso de iniciación a R en Kschool de Carlos Gil

Carlos Gil Bellosta va a impartir en Kschool un programa profesional de iniciación a R. En el siguiente link tenéis más información al respecto: http://kschool.com/cursos/programa-profesional-de-iniciacion-r/ Como podéis ver en el programa podréis trabajar con manipulación de datos, automatización de informes e incluso segmentación sin faltar las posibilidades gráficas de R. Muy interesante para introducirse a R.

24 de abril de 2015 · rvaquerizo

Mapas estáticos municipales para estados de México. Con R y con Excel

Podemos pintar mapas municipales de México con la ayuda de R y Excel. Esta entrada está en la línea de otra anterior para hacer esta misma tarea con mapas de España. Disponemos de los datos en Excel y tenemos instalado R y la librería sp. El objeto R con los mapas de México lo podemos encontrar en http://www.gadm.org/country seleccionamos Mexico y R Spatial Poligons Data Frame y debemos descargarnos el objeto de nivel 2. Comenzamos el trabajo con R: ...

20 de marzo de 2015 · rvaquerizo

Mapas municipales de España en R, con la ayuda de Excel

El escribir sobre el BDT de Madrid me ha hecho recordar mi trabajo con statial data de R. Los mapas de statial data los podemos obtener de forma gratuita de http://www.gadm.org/country y en este caso vamos a descargarnos para España un SpatialPolygonsDataFrame específico para R de nivel 4 que está a nivel municipal (repito nivel todas las veces necesarias), el archivo que os debéis descargar se llamará ESP_adm4.RData. Si buscáis un poco en google encontraréis documentación acerca de este tipo de archivos de R y veréis que se pueden hacer maravillas. En este caso quiero hacer un ejemplo lo más sencillo posible, muy artesanal y casero. Con un poco de imaginación podréis complicarlo o incluso hacer una herramienta en Excel que hiciera mapas con R. ...

20 de febrero de 2015 · rvaquerizo

Aprendiendo Shiny. La función shinyUI seguida de fluidPage o fluidRow

Con shinyUI creamos el interface de nuestra app de shiny y cuando la usamos inmediatamente ponemos fluidPage o fluidRow (por lo menos en estos primeros acercamientos). Utilizaremos una u otra en función del diseño que deseamos. Los argumentos que pueden tener fluidPage o fluidRow son múltiples. Algunos de los que estoy usando: titlePanel. Imprescindible, sirve para poner títulos a nuestra app headerPanel. Para titular nuestro panel wellPanel para introducir tablas con formato. Podremos jugar con css para cambiar los formatos. Elementos para modificar valores como: sliderInput. Nos permite crear los slider como hemos visto en los ejemplos textInput. Para introducir texto «libre» selectInput. Crea un combo checkboxInput. Obvio …. actionButton mainPanel. Es el cuerpo de nuestra app y puede estar compuesto de: plotOutput tabPanel nos permite poner tablas HTML si deseamos crear salidas más complejas podemos usar mainPanel y tabular nuestras salidas. Por ejemplo un cuadro de mando A muy grandes rasgos esto es lo que podemos empezar a hacer con nuestro interfaz. Cada vez me recuerda más a SAS AF o appDev Studio lenguaje de programación que tengo más olvidado que el JCL. No es programar en R, aunque no es tan difícil como mi querido Tclk. Saludos.

13 de febrero de 2015 · rvaquerizo

Aprendiendo shiny. server.R ui.R

Sigo con shiny y RStudio aver que cosas soy capaz de hacer. Hay dos elementos básicos a la hora de crear aplicaciones con shiny: server.R es el lugar donde definimos la función server. Es necesario empezar a familiarizarnos con el lenguaje de shiny. ui.R es el user interface es el lugar donde definimos lo que vamos a ver con nuestra aplicación. El elemento fundamental de server.R es shinyServer(función) en los ejemplos que he estado viendo la función tiene una entrada y una salida. Imagino que podremos dar más complejidad a estas funciones. De momento una entrada y una salida. En ui.R es donde definimos la salida en HTML que deseamos para nuestra aplicación en el tutorial de shiny podéis ver muchas posibilidades. La función principal para crear estos interfaces es shinyUI(definición del interface). No parece complicado de definir el interface con unos conocimientos básicos de HTML y conociendo el código específico de shiny. Ya no programamos tanto con R, ahora programamos con shiny. ...

2 de febrero de 2015 · rvaquerizo

Aprendiendo shiny con vosotros

No queda otro remedio. Necesito actualizarme un poco y comenzar a usar shiny y espero poder llegar a publicar en el blog las aplicaciones resultantes. No sé si seré capaz pero allá vamos. Lo primero es tener Rstudio instalado y empezar a escribir: install.packages(«shiny») system.file(«examples», package=»shiny») Ya podemos ver los ejemplos de un modo muy sencillo: runExample(«05_sliders») # slider bars Aparece una app que podemos ver tanto en RStudio como en nuestro navegador. Si modificamos las barras cambian los números de la tabla de la derecha. Muy sencillo. Para comenzar a trabajar debemos conocer dos códigos de R que están guardados en su correspondiente carpeta. Son server.R y ui.R que podemos abrir en la carpeta [deWindows] C:\Users\fulanito\Documents\R\win-library\3.1\shiny\examples\05_sliders Sin embargo nosotros vamos a copiar y pegar esta carpeta en la misma ubicación pero le damos el nombre prueba y abrimos server.R ...

1 de febrero de 2015 · rvaquerizo

Cuando paralelizar procesos con R era otra cosa

Allá en noviembre de 2011 en las III jornadas de usuarios de R en España José Ramón Díaz Uriarte nos habló de paralelizar procesos con R, los principios de ese concepto que han denominado Big Data: http://usar.org.es/pdfs/Diaz_Uriarte-final.pdf Han avanzado los tiempos en el mundo de R y de la paralelización de procesos. Y es quizá lo que hará que R sobreviva frente a otras herramientas que no se han subido al carro por ser encapsuladas y “oscuras” (se me ocurren algunas). El problema es que perdemos mucho tiempo montando complejos sistemas, tiempo que podría ser empleado en un trabajo que aportara más valor. Necesitamos oír la expresión “yo no paralelizo a mi me paralelizan”. Ese será el momento de R. ¿Lo conseguirá Microsoft? ¿Lo conseguirá Yhat?

27 de enero de 2015 · rvaquerizo