R | Análisis y Decisión

Trucos R. El paquete `classInt` para clasificar variables continuas

El paquete classInt de R últimamente está muy presente en mis programas y me gustaría dedicarle unas líneas para que podáis ver algunas de sus posibilidades a la hora de clasificar variables continuas; además, estas posibilidades, unidas con RColorBrewer, nos permiten crear gráficos muy atractivos. Instalamos y clasificamos un vector de ejemplo: library(classInt) aleatorio <- abs(rnorm(100, 50, 30)) summary(aleatorio) grupos <- 4 clases <- classIntervals(aleatorio, grupos, style = "quantile") clases style: quantile one of 156,849 possible partitions of this variable into 4 classes [1.225299,29.19317) [29.19317,51.55524) [51.55524,72.06471) [72.06471,118.6466] 25 25 25 25 Partimos un vector aleatorio en 4 clases en función de sus cuantiles y creamos una lista clases que contiene nuestra tabla y, entre sus atributos, destaca brks, que indica los puntos de corte; en el caso de los cuantiles tenemos: ...

Juego de modelos de regresión con R

Os propongo un juego con R. El juego parte de unos datos aleatorios que he generado con R (los que veis arriba) que dividimos in entrenamiento y test. Sobre el conjunto de datos de entrenamiento he realizado varios modelos y valoro las predicciones gráficamente sobre los datos de test. El juego consiste in asociar cada resultado gráfico de test a cada código de R correspondiente y justificar brevemente la respuesta. ...

Nueva reunión del grupo de usuarios de R en Madrid

Nueva cita para el martes 12 de mayo en el MediaLab con el grupo de usuarios de R en Madrid. En esta ocasión, Pedro Concejero hará la presentación “Clasificación de películas con el dataset Movielens – técnicas de factorización en R”. Los datasets de Movielens son un clásico de la investigación en recomendadores (https://movielens.org/, http://grouplens.org/datasets/movielens/). Muy recientemente (abril 2015) se ha liberado el último dataset con 20 millones de valoraciones de más de 26 mil películas por parte de casi 140 mil evaluadores. Las técnicas de reducción de dimensionalidad, o factorización, son la base para el desarrollo de recomendadores, pero también permiten extraer agrupaciones de contenidos similares por las preferencias de los evaluadores; se pueden interpretar también como “géneros aprendidos”. En esta charla veremos la aplicación de las técnicas de factorización y los retos que supone abordar este dataset, todo ello con las múltiples herramientas analíticas que ofrece R. ...

Curso de iniciación a R en Kschool de Carlos Gil

Carlos Gil Bellosta va a impartir en KSchool un programa profesional de iniciación a R. En el siguiente enlace tenéis más información al respecto: http://kschool.com/cursos/programa-profesional-de-iniciacion-r/ Como podéis ver en el programa, podréis trabajar con manipulación de datos, automatización de informes e incluso segmentación, sin faltar las posibilidades gráficas de R. Muy interesante para introducirse a R. Saludos.

Mapas estáticos municipales para estados de México. Con R y con Excel

Podemos pintar mapas municipales de México con la ayuda de R y Excel. Esta entrada está en la línea de otra anterior para hacer esta misma tarea con mapas de España. Disponemos de los datos en Excel y tenemos instalado R y la librería sp. El objeto R con los mapas de México lo podemos encontrar en http://www.gadm.org/country; seleccionamos México y R Spatial Poligons Data Frame, y debemos descargarnos el objeto de nivel 2. Comenzamos el trabajo con R: ...

Mapas municipales de España en R, con la ayuda de Excel

Escribir sobre el BDT de Madrid me ha hecho recordar mi trabajo con spatial data de R. Los mapas de spatial data los podemos obtener de forma gratuita de http://www.gadm.org/country y, en este caso, vamos a descargarnos para España un SpatialPolygonsDataFrame específico para R de nivel 4, que está a nivel municipal. El archivo que os debéis descargar se llamará ESP_adm4.RData. Si buscáis un poco en Google encontraréis documentación acerca de este tipo de archivos de R y veréis que se pueden hacer maravillas. En este caso, quiero hacer un ejemplo lo más sencillo posible, muy artesanal y casero. Con un poco de imaginación podréis complicarlo o incluso hacer una herramienta en Excel que hiciera mapas con R. ...

Aprendiendo Shiny. La función shinyUI seguida de fluidPage o fluidRow

Con shinyUI creamos la interfaz de nuestra app de shiny y cuando la usamos inmediatamente ponemos fluidPage o fluidRow (por lo menos en estos primeros acercamientos). Utilizaremos una u otra en función del diseño que deseamos. Los argumentos que pueden tener fluidPage o fluidRow son múltiples. Algunos de los que estoy usando: titlePanel: Imprescindible, sirve para poner títulos a nuestra app. headerPanel: Para titular nuestro panel. wellPanel: Para introducir tablas con formato. Podremos jugar con CSS para cambiar los formatos. Elementos para modificar valores como: sliderInput: Nos permite crear los slider como hemos visto en los ejemplos. textInput: Para introducir texto «libre». selectInput: Crea un combo. checkboxInput: Obvio. …. actionButton mainPanel: Es el cuerpo de nuestra app y puede estar compuesto de: plotOutput tabPanel: Nos permite poner tablas HTML. Si deseamos crear salidas más complejas podemos usar mainPanel y tabular nuestras salidas. Por ejemplo, un cuadro de mando. A muy grandes rasgos esto es lo que podemos empezar a hacer con nuestra interfaz. Cada vez me recuerda más a SAS AF o AppDev Studio, lenguajes de programación que tengo más olvidados que el JCL. No es programar en R, aunque no es tan difícil como mi querido Tcl/Tk. Saludos.

Aprendiendo shiny. server.R ui.R

Sigo con Shiny y RStudio a ver qué cosas soy capaz de hacer. Hay dos elementos básicos a la hora de crear aplicaciones con Shiny: server.R es el lugar donde definimos la función server. Es necesario empezar a familiarizarnos con el lenguaje de Shiny. ui.R es el user interface, el lugar donde definimos lo que vamos a ver con nuestra aplicación. El elemento fundamental de server.R es shinyServer(función); en los ejemplos que he estado viendo, la función tiene una entrada y una salida. Imagino que podremos dar más complejidad a estas funciones. De momento, una entrada y una salida. En ui.R es donde definimos la salida en HTML que deseamos para nuestra aplicación; en el tutorial de Shiny podéis ver muchas posibilidades. La función principal para crear estos interfaces es shinyUI(definición del interface). No parece complicado de definir el interface con unos conocimientos básicos de HTML y conociendo el código específico de Shiny. Ya no programamos tanto con R, ahora programamos con Shiny. ...

Aprendiendo shiny con vosotros

No queda otro remedio. Necesito actualizarme un poco y comenzar a usar Shiny, y espero poder llegar a publicar en el blog las aplicaciones resultantes. No sé si seré capaz, pero allá vamos. Lo primero es tener RStudio instalado y empezar a escribir: install.packages("shiny") library(shiny) system.file("examples", package = "shiny") Ya podemos ver los ejemplos de un modo muy sencillo: runExample("05_sliders") # slider bars Aparece una app que podemos ver tanto en RStudio como en nuestro navegador. Si modificamos las barras, cambian los números de la tabla de la derecha. Muy sencillo. Para comenzar a trabajar debemos conocer dos códigos de R que están guardados en su correspondiente carpeta. Son server.R y ui.R, que podemos abrir en la carpeta de Windows (ruta aproximada) C:\Users\fulanito\Documents\R\win-library\x.x\shiny\examples\05_sliders. Sin embargo, nosotros vamos a copiar y pegar esta carpeta en una nueva ubicación, le damos el nombre prueba y abrimos server.R: ...

Cuando paralelizar procesos con R era otra cosa

Allá en noviembre de 2011, en las III Jornadas de Usuarios de R en España, José Ramón Díaz Uriarte nos habló de paralelizar procesos con R, los principios de ese concepto que han denominado Big Data: http://usar.org.es/pdfs/Diaz_Uriarte-final.pdf Han avanzado los tiempos en el mundo de R y de la paralelización de procesos. Y es quizá lo que hará que R sobreviva frente a otras herramientas que no se han subido al carro por ser encapsuladas y «oscuras» (se me ocurren algunas). El problema es que perdemos mucho tiempo montando complejos sistemas, tiempo que podría ser empleado en un trabajo que aportara más valor. Necesitamos oír la expresión «yo no paralelizo, a mí me paralelizan». Ese será el momento de R. ¿Lo conseguirá Microsoft? ¿Lo conseguirá Yhat?