youtube-dl para descargar videos y mplayer para pasar esos vídeos a imágenes

Si deseamos descargar vídeos de Youtube tenemos youtube-dl pero podemos descargar de otras web y en esta entrada vamos a ver como. Además podemos transformar esas entradas en fotogramas, esto es útil a la hora de analizar imágenes, podríamos estudiar la presencia de una marca en un partido de fútbol, identificar las matrículas que pasan delante de determinada cámara u otros casos de uso. Y en uno de esos casos precisamente J.L. Cañadas del blog hermano Muestrear no es Pecado me ha descubierto la librería youtube-dl y la creación de scripts para transformar videos en imágenes que posteriormente podemos analizar. El caso de mplayer es distinto, lo conocía, Cañadas me ha descubierto el ffmpeg que ofrece más posibilidades. ...

11 de enero de 2021 · rvaquerizo

Mi curriculum con RMarkdown y pagedown

Me he puesto a actualizar mi currículum y a la vez estoy aprendiendo markdown; en ese proceso, José Luis Cañadas me dijo: «usa pagedown». No era yo fan de RMarkdown, pero me estoy reconvirtiendo. Me está pasando con markdown algo parecido a lo que me pasó con el picante: no me gustaba hasta que lo probé y, desde entonces, me encanta. ¿Por qué lo probé? Porque había decidido tomarme un tiempo sabático para elaborar una serie de cursos, webinars y actualizar la web, que son 12 años sin modificaciones. Tras tres meses sabáticos estoy harto de no trabajar: son 25 años seguidos trabajando, 20 gestionando datos y otros 5 en los que hice de todo (hasta servir en la Armada). No soy capaz de estar sin trabajar; el primer paso es elaborar un resumen de mi vida profesional y dar un nuevo formato, porque llevo con el mismo unos 12 años. ...

21 de diciembre de 2020 · rvaquerizo

Entender una blockchain con R

Una introducción de bajo nivel (sin entrar mucho en tecnología) a los blockchain con R. Es una entrada destinada a comprender qué es un blockchain desde otro punto de vista, no sólo criptografía o criptomoneda: podemos poner información que sólo conoce el origen. ¿Os imagináis si pusieran a disposición de los científicos de datos información sobre todos los españoles identificados por NIF y si tiene o no coronavirus? Los científicos de datos podrían trabajar de forma anónima con esos datos y ayudar a establecer las zonas libres de COVID-19, persona a persona de forma perfectamente anónima. Aunque no se descarta que algún cabestro se dedicara a desencriptar… ...

9 de abril de 2020 · rvaquerizo

Gráficos de calendarios con series temporales

Cuando se realizan gráficos de series temporales se emplean gráficos de líneas donde el eje X contiene la fecha y el eje Y contiene el valor a representar. Hoy quiero traer al blog otra forma de representar series temporales: los gráficos de calendario y su realización con R. Para ilustrar el ejemplo, vamos a emplear las cotizaciones históricas del índice bursátil IBEX 35: library(quantmod) library(ggplot2) library(reshape2) library(dplyr) library(lubridate) # Obtenemos las cotizaciones del IBEX 35 desde 2010 getSymbols('^IBEX', from = '2010-01-01') # data.frame de trabajo df <- data.frame(date = index(IBEX), IBEX) Mediante quantmod extraemos las cotizaciones del IBEX y creamos un data.frame de trabajo que llamamos df. Vamos a realizar dos tipos de gráficos: un mapa de calor por años, meses, semanas y días, y un calendario de un año puntual. ...

11 de enero de 2020 · rvaquerizo

El análisis de supervivencia en R para segmentar el churn

El análisis de supervivencia es uno de los olvidados por el Machine Learning y la nueva forma de ver el oficio. A la regresión logística sí la damos algo de recorrido porque aparece en scikit-learn (con sus cositas); sin embargo, el análisis de supervivencia no tiene ese cartel porque, en el momento que trabajas con un gran número de variables, estos modelos “empiezan a echar chispas”. Sin embargo, ofrecen una serie de gráficos y resultados que, más allá de la estimación, nos describen problemas y pueden servirnos para segmentar poblaciones en base a la duración hasta la ocurrencia de un evento. ...

24 de diciembre de 2019 · rvaquerizo

Me rindo, es necesario trabajar en Agile

Agile sounds good y representa todo eso que critico. Tenía compuesta y preparada una canción que versiona el “Me cago en el amor” de Tonino Carotone, “Me cago en el Agile” se llamaba. ¿Por qué este cambio de opinión tan radical? Porque no se trabaja de forma horizontal, se trabaja de forma vertical y cada uno hace la guerra por su cuenta. Me voy a mi terreno: Agile Analytics. ...

23 de diciembre de 2019 · rvaquerizo

Los parámetros del modelo GLM como relatividades, como recargos o descuentos

Los modelos GLM son muy empleados en el ámbito actuarial para la obtención de modelos de riesgo; estos modelos de riesgo son los elementos fundamentales en el cálculo de tarifas. Y ¿qué es una tarifa? Imaginad el precio del seguro de vuestra vivienda: bueno, pues es un cálculo en el que, partiendo de un precio base, se van añadiendo recargos y descuentos en función del tipo de riesgo que se quiera asegurar (recargos y descuentos en función de los metros cuadrados, de la ubicación de la vivienda, de las calidades de construcción…). Esta es una visión muy simplista porque, al final, se tienen múltiples garantías y es necesaria la combinación de ellas, pero se puede entender de ese modo: un precio base al que recargamos o descontamos precio. Estos recargos y descuentos se denominan frecuentemente relatividades, y hoy quiero acercaros a la obtención de esas relatividades y cómo un modelo GLM se transforma en el precio de un seguro. ...

7 de noviembre de 2019 · rvaquerizo

Los principales problemas de los españoles. Animaciones con R y gganimate

La realización de gráficos animados con R, gganimate y ggplot2 es algo que quiero empezar a trabajar en mis visualizaciones de datos; una buena forma de llamar la atención. Para ilustrar el ejemplo, he recogido los datos que publica mensualmente el CIS con las tres principales preocupaciones de los españoles, que podéis encontrar en este enlace. Por cierto, este enlace tiene toda la pinta de ser una salida en SAS; no me parece muy apropiado, pero no diré nada porque imagino que serán lectores del blog. ...

26 de agosto de 2019 · rvaquerizo

Crear archivo csv desde SAS con Python

Con la librería sas7bdat de Python podemos leer archivos SAS y crear directamente un data.frame; es la mejor librería para hacerlo: si la tabla SAS que deseáis leer está comprimida (compress = yes), con pandas no podréis hacerlo. Pero tengo que agradecer a mi compañero Juan que me haya descubierto la función convert_file para pasar directamente el archivo SAS a CSV: es más eficiente y parece que consume menos recursos del equipo. La sintaxis es muy sencilla: ...

25 de agosto de 2018 · rvaquerizo

Diagramas de Voronoi con spatial de python

En breve «mis cachorros», como llamo a un grupo de los mejores Data Scientists de Europa (de los que tengo que hablar algún día), se van a enfrentar a un problema que probablemente tengan que resolver con análisis geométricos muy complejos. Para despertarles la curiosidad (sé que me leen), hoy traigo al blog una entrada que nos aproxima al método de interpolación geométrica más sencillo: al diagrama de Voronoi. Con scipy.spatial (https://docs.scipy.org/doc/scipy-0.18.1/reference/generated/scipy.spatial.Voronoi.html), podemos trabajar con estos diagramas: ...

8 de diciembre de 2017 · rvaquerizo