Quiero aprender Big Data

Hoy me han dicho esto. Y mi respuesta ha sido un correo electrónico con estas dos imágenes. El Big Data Landscape 2013: Y un Big Data Landscape de 2016: ¿Se puede “aprender” Big Data? Aprende qué se puede hacer con los datos y aprende R. Como recomendación: di bigdaita, así parece que controlas.

20 de enero de 2017 · rvaquerizo

Función de R para geolocalizar IP

El proyecto freegeoip tiene su propia función en R para poder crear un data.frame con la geolocalización de las IPs. La función la podéis encontrar en este enlace y tiene un funcionamiento muy sencillo: library(rjson) localizacion1 <- freegeoip('23.89.204.150') localizacion2 <- freegeoip(c('106.78.232.100', '174.6.153.88')) Resulta que no recordaba su existencia y ya tenía algo parecido en XML… pero siempre hay alguien que lo ha hecho antes con R. Saludos.

28 de diciembre de 2016 · rvaquerizo

Mover elementos de un mapa con QGIS. Ejemplo mover Canarias

Para modificar shapefiles estaba acostumbrado a usar R; sin embargo, poco a poco estoy usando más QGIS para este tipo de tareas. Lo primero que tengo que comentaros es que no sé QGIS, no tengo ni idea; lo uso solo para visualizar mapas porque es más cómodo que R, pero poco a poco me estoy acostumbrando a usarlo. Hoy quería mostraros cómo he realizado una tarea muy habitual cuando hacemos mapas de España: mover las Islas Canarias para que queden más cerca de la Península. El proceso lo he presentado para torpes con QGIS (como yo mismo). Lo primero es abrir el shapefile con QGIS y nos encontraremos con algo parecido a esto: ...

22 de diciembre de 2016 · rvaquerizo

Bucle de fechas con SAS para tablas particionadas

Partimos de un mes inicial hasta un mes final; es necesario crear una tabla SAS con dos variables: el inicio del mes y el final del mes. El trabajo con fechas en SAS, como todos sabemos, es una tarea un poco ardua. El título de la entrada también es un poco peculiar, pero es la respuesta a la duda que planteaba un lector: Cogemos dos fechas en formato `yyyymmaa` Ej: 20150101 a 20160131 Necesito una salida como la siguiente: 20150101 20150131 20150201 20150228 20150301 20150331 20150401 20150430 ... 20161101 20161130 20161201 20161231 Para que los datos pedidos en este periodo salgan en una tabla por mes con un PROC SQL ya diseñado que funciona, pero sin particionarlo en una tabla por mes en el log. Se me han ocurrido varias formas de hacerlo, pero a continuación os planteo la siguiente. Como referencia, hemos de irnos a una entrada anterior del blog, una entrada del 2008 cuando puse en marcha analisisydecision.es. ...

20 de diciembre de 2016 · rvaquerizo

Truco Excel. Repetir un campo a partir de otro que define el número de repeticiones

En realidad necesitamos repetir filas, pero el número de repeticiones está parametrizado por otro campo. Partimos de un rango donde la primera columna es un valor que necesita ser repetido el número de filas que nos indica la segunda columna. Es una duda que planteaba un lector del blog: Hola, a ver si me podéis ayudar: quiero repetir cada fila el número de veces que hay en cada celda que le corresponde. Es decir, tengo una variable Nombre (Columna A) y otra Frecuencia (Columna B). ...

17 de diciembre de 2016 · rvaquerizo

Financiación del Grupo de Usuarios de R de Madrid

El Grupo de Usuarios de R de Madrid no ha renovado el patrocinio con Revolution Analytics y, para la financiación de los gastos que genera, se ha lanzado una edición de tazas con el logo del grupo. Las tazas cuestan 9,99 € y se ha hecho una tirada de 100; del precio de estas tazas, la mitad iría para dicha financiación. Para reservar, solo tienes que rellenar este formulario web: ...

15 de noviembre de 2016 · rvaquerizo

Como obtener los centroides de municipios con SAS. Mapas con SGPLOT

Un amigo y lector del blog me ha pedido un mapa de códigos postales donde poder identificar los centroides para andar calculando distancias a otros puntos. Yo no tengo un mapa de España por códigos postales para poder usar con fines comerciales, pero sí cuento en el blog cómo poder obtenerlo bajo ciertas condiciones. Lo que sí puedo contar a Juan es cómo hacer un mapa por municipios con SAS; aunque ya he hablado de ello, hay ciertos aspectos que pueden ser interesantes. Y todo empieza donde siempre: http://www.gadm.org/country, la web donde tenemos los mapas «libres» por países. Seleccionáis Spain y el formato shapefile; una vez descargados los mapas en vuestros equipos, empezamos con el trabajo en SAS: ...

9 de noviembre de 2016 · rvaquerizo

De estadístico a minero de datos a científico de datos…

Hace unos meses estuve en un data beers que organizó Accenture, que más parecía una reunión de viejas glorias de Neo Metrics, y hablé sobre la transformación de un dinosaurio a un científico de datos; por cierto, me llamó la atención cómo el resto de compañeros hicieron sus presentaciones con software del siglo pasado, y eso que yo era el dinosaurio… Hoy ha salido una noticia sobre el uso de la información de Facebook para tarificar en seguros que define hacia dónde quiero ir y los problemas con los que he de lidiar. Así que hoy voy a escribir sobre mí y la transformación del dinosaurio al científico de datos. ...

3 de noviembre de 2016 · rvaquerizo

Truco SAS. Limpieza de tabuladores con expresiones regulares

Un lector necesita eliminar tabuladores de una cadena de texto y no le están funcionando las funciones habituales; sugiero emplear expresiones regulares. En mi entorno de SAS sí está funcionando: data ejemplo; length frase $50.; input frase $50.; cards; Hola este es un ejemplo"""""" Hola es te es un ejemplo_________ Hola este es un ejemplo++++++++ ; run; data ejemplo_limpio; set ejemplo; call prxchange(prxparse('s/([A-ZÑa-zñ 0-9]*)([^A-Za-zÑñ 0-9]*)/$1/'), -1, frase); run; Como se ve en el ejemplo, también se carga los caracteres especiales; tened en cuenta eso. Saludos.

3 de noviembre de 2016 · rvaquerizo

Aprende rstats de forma presencial por muy poco

Ha llegado al Grupo de Usuarios de R de Madrid el siguiente curso de R: Os anuncio el siguiente curso de análisis estadístico de datos en R. I Jornadas de Análisis Estadísticos de Datos en R: Un enfoque práctico. A celebrarse: Del 14 al 17 de noviembre de 2016. En Fuenlabrada (Madrid). De 16:00 a 19:00. Plazo de preinscripción: 20 de octubre al 4 de noviembre. Precio matrícula: 35 €. Existe la posibilidad de beca para conseguir matrículas de 10 €. ...

31 de octubre de 2016 · rvaquerizo