Análisis y Decisión

Gracias a okbstudio ya tenemos nuestro propio seguimiento del COVID19 en España

El equipo de okbstudio, gracias a los datos de Datadista (y a un servidor), ha creado este espectacular seguimiento de los datos del COVID19 en España: https://covid19.inapp.io/ Uno de los mejores seguimientos que hay para los datos en España, que va a ir mejorando con la inclusión de nuevas dimensiones y que incluye el siguiente gráfico: #Quedateencasa

Los pilares de mi simulación de la extensión del COVID19

No debería publicar esta simulación de la extensión del COVID19 o coronavirus porque puede disparar alarmas, provocar insultos, levantar ampollas… el caso es que yo llevo 7 días de aislamiento más que el resto de España porque sólo había que ver los datos de Italia para saber lo que iba a pasar y no avise a nadie para no disparar alarmas, provocar insultos, levantar ampollas… Y AL FINAL YO TENÍA RAZÓN. Así que os voy a exponer el motivo por el cual estoy muy asustado; bueno, hoy quiero mostraros el inicio de una simulación mala y sin fundamento que estoy realizando sobre la extensión en España del COVID19. Para hacerla vamos a emplear la siguiente información: ...

Transformar todos los factores a carácter de mi data frame de R

En muchas ocasiones no quiero factores en mi data.frame cuando trabajo con R. Y estoy en mi derecho de poner una entrada sobre una de las tareas que más realizo y de la que siempre se me olvida el cómo la realizo; tardo menos en buscarlo en www.analisisydecision.es que entre mis programas: df <- data.frame(lapply(df, as.character), stringsAsFactors = FALSE) Todos los elementos factor ahora son character.

Mapa del COVID-19 por Comunidades Autónomas con R (más #rstats)

Estoy muy activo en Twitter con el #covid-19 estos días y eso está dando lugar a algunas entradas en el blog. Sin embargo, he parado esa actividad porque el número de casos no me parece el indicador adecuado para medir la verdadera incidencia de la pandemia. Empiezo a tener posibles casos entre personas conocidas y no se realiza ningún test, permanecen en casa y son casos no informados. Sin embargo, quería que esta entrada sirviera de homenaje a la gente de Datadista que está recogiendo datos y realizan un seguimiento del número de camas ocupadas, uno de los mejores indicadores. Además sigo mi labor formativa con rstats, hoy toca: ...

Evolución del número de casos de coronavirus

Seguimos a vueltas con la (ya) pandemia y R, y hoy quería traeros unos buenos ejemplos de uso de dplyr para preparar datos. Se trata de ver una evolución del número de casos diarios para saber en qué punto tanto España como Italia pueden frenar el crecimiento de los casos de coronavirus; se trata de crear este gráfico: Se observa cómo países como China o Corea vivieron un fuerte crecimiento que ahora se ha transformado en una caída del número de casos de coronavirus, pero parece que Irán se ha estabilizado en 1000 casos diarios; mientras, Italia y España siguen en fase de crecimiento, por lo que no se espera que el comportamiento sea similar a China o Corea y es probable que el número de casos siga aumentando. ...

Estimación de la evolución de casos del coronavirus en España

Ayer escribí sobre la obtención de los datos del coronavirus con R y después me disponía a escribir sobre modelos de regresión no lineal, hacer una estimación del coronavirus en España… Pero estuve hablando con una amiga residente en Italia y allí el número de casos está dos semanas por delante de España; bueno, dos semanas exactamente no, 10 días: library(lubridate) library(ggplot2) library(dplyr) library(reshape2) datos <- read.csv2("https://raw.githubusercontent.com/CSSEGISandData/COVID-19/master/csse_covid_19_data/csse_covid_19_time_series/time_series_19-covid-Confirmed.csv", sep = ',') fechas <- seq(as.Date("2020/01/22"), as.Date(today() - 1), "days") fechas_chr <- substr(as.character.Date(fechas), 6, 10) # Se asume que el csv tiene el formato adecuado para asignar estos nombres # En este caso, simplificamos la lógica de nombres para el ejemplo names(datos) <- c("Provincia", "Pais", "Latitud", "Longitud", fechas_chr) esp_ita <- data.frame(fecha = fechas_chr) esp_ita$Espania <- as.numeric(t(datos %>% filter(Pais == "Spain") %>% select(all_of(fechas_chr)))) esp_ita$Italia <- as.numeric(t(datos %>% filter(Pais == "Italy") %>% select(all_of(fechas_chr)))) p <- ggplot(esp_ita, aes(x = fecha)) + geom_line(aes(y = Espania, group = 1, color = "España")) + geom_line(aes(y = Italia, group = 1, color = "Italia")) + scale_color_manual(values = c("España" = "red", "Italia" = "blue")) + xlab("") + ylab("") + theme(axis.text.x = element_text(angle = 90)) p ...

Seguimiento del coronavirus en España por Comunidad Autónoma. Extraer información de un PDF con R

Una entrada anterior del blog ha dado lugar a una conversación interesante en Twitter: Evolución del número de casos de #coronavirusEspana una analogía con Italia https://t.co/GhWtlFL3Df — Raul Vaquerizo (@r_vaquerizo) March 11, 2020 Es necesario obtener los datos del Ministerio y estos datos se hallan en un PDF. Bien, tendremos que leer el PDF y crear un data frame para poder trabajar con estos datos. Para leer el PDF vamos a emplear el paquete de R tabulizer y la función extract_tables, pero necesitamos algo de talento. ...

Seguir los datos del coronavirus en España con Rstats

No he podido evitarlo: os traigo unas líneas de código en R para seguir la evolución del coronavirus en España (podéis filtrar cualquier país). Me hubiera gustado hacer un scraping de la página Worldometers, sin embargo me ha parecido más sencillo leer directamente los datos del repositorio de la Universidad Johns Hopkins (https://github.com/CSSEGISandData/COVID-19), cuya actualización es diaria. También existe ya un paquete en R denominado coronavirus, pero su funcionamiento a veces es irregular. ...

Truco Excel. Calculadora desde la barra de herramientas de acceso rápido

Hace tiempo que no ponía trucos de Excel y el de hoy es muy sencillo, pero que a mí me ha sido de especial utilidad: un acceso a la calculadora para esos cálculos rápidos que siempre he hecho con la calculadora de sobremesa. Se trata de añadir un acceso a la Calculadora de Windows desde la barra de herramientas de acceso rápido. Vamos a personalizar la barra: Y desde ese menú nos vamos a “Más comandos…”. Se abre un cuadro de diálogo que nos sugiere elementos a añadir, pero la calculadora saldrá si queremos ver todos los elementos disponibles: ...

Cloud words con R. Trabajar con la API del Europe PMC con R

Hace años ya tuvimos nubes de palabras en el blog y ya era hora de ir actualizando algunas cosas. Además, quería aprovechar y presentaros un paquete de R que nos permite consultar la API del Europe PMC. Para quien no sepa qué es el Europe PMC, podemos decir que es un buscador de documentos y artículos científicos (que ahora todo el mundo molón llama papers) y que tiene una API a la que podemos acceder desde R mediante el paquete europepmc. ...