Truco Excel. Producto cartesiano de dos campos

Hacía tiempo que no ponía trucos en Excel y hoy os traigo un truco que puede ser de utilidad cuando tenéis que hacer combinaciones. Se trata de realizar el producto cartesiano mediante una macro de Excel; además, os pongo el enlace al propio Excel para que podáis rellenar los campos a cruzar. No creo que haga falta describir qué es un producto cartesiano de dos campos, pero de forma resumida se puede decir que es crear el total de pares de esos dos campos, un “todos con todos”; es útil cuando quieres hacer combinaciones (como ya he dicho). ...

14 de abril de 2019 · rvaquerizo

Recopilación Data Science Cheat Sheet

No sé cómo me ha llegado esta recopilación de Cheat Sheets para la Ciencia de Datos, pero viendo el trabajo que realizan algunas personas aún es posible creer en la humanidad. Disfrutad del enlace y ya estamos todos siguiendo el git de este gran tipo: https://github.com/abhat222/Data-Science–Cheat-Sheet

2 de abril de 2019 · rvaquerizo

El desarrollo de la Inteligencia Artificial, un paralelismo con el desarrollo de la aviación

Estoy en el claustro de profesores del Máster de la UNED en Big Data y Business Analytics y, revisando la documentación, las clases teóricas y las clases prácticas, he decidido incluir una diapositiva que establece un paralelismo entre el desarrollo de la Inteligencia Artificial (IA) y el desarrollo de la aviación. Este paralelismo se me ocurrió tras una conversación con una de esas personas que trabajan en este negocio y son íntegras y honradas (empezamos a quedar pocos). El caso es que he añadido la siguiente imagen en la formación: ...

22 de marzo de 2019 · rvaquerizo

¿Qué nos pasa con R? (de nuevo)

Hace años ya sorprendió R situándose muy arriba en la lista TIOBE de lenguajes de programación; subió en los años siguientes y ahora nos encontramos con una sorprendente bajada en el índice: ¿Volvemos a tener complejo por usar R? A veces tengo la sensación de que no eres un “pro” si no usas Python. Debe ser que determinados frameworks funcionan mejor en otros lenguajes, o no, pero nos da vergüenza usar R (de nuevo). Saludos.

9 de marzo de 2019 · rvaquerizo

Longitud de las frases del `Quijote` con `rstats`

Siempre he querido hacer cosas con rstats y el Quijote y ayer se me ocurrió medir la longitud de las frases del Quijote y crear un histograma que describa esta longitud. Aunque confieso que no me lo he leído, me he quedado en el capítulo 7 u 8 (no recuerdo) el caso es que me pareció hipnótico con sus ritmos, es musical. Además tengo muchas ganas de meter mano al proyecto Gutemberg porque esos ritmos, esa musicalidad, el uso de palabras esdrújulas,… me llama la atención. Bueno, al lío, todo el código está subido al repositorio por si lo queréis, pero hay algunas funciones y algunas ideas que me parecen interesantes. ...

27 de febrero de 2019 · rvaquerizo

Ya no nos interesa el GDPR

GDPR en Google Trends un pico en mayo de 2018 y desaparece el interés. Será porque todas las compañías se han adecuado a ese marco general legislativo y no es necesario trabajar más en ello o será porque seguimos en modo «preproducción». En cualquier caso es probable que esta legislación haya nacido anticuada, https://www.elconfidencial.com/tecnologia/2019-02-13/bankia-cuenta-on-ley-proteccion-de-datos-infraccion_1821530/ e incluso es probable que no sea necesaria. Y recuerda, legislar también nos cuesta dinero.

20 de febrero de 2019 · rvaquerizo

Gráfico con eje secundario en ggplot2

Los gráficos con eje secundario o con dos ejes son un tema que ya he puesto en el blog en varias ocasiones, hay un ejemplo con R que tenía sus problemas y hay un ejemplo con Python y matplotlib que particularmente me gusta por elegancia y sencillez. En esta entrada vamos a repetir el ejercicio y vamos a realizar un gráfico de columnas y líneas con 2 ejes, primario y secundario pero con ggplot2. Este tipo de gráficos son muy utilizados por los actuarios para representar frecuencias o siniestralidades y exposición. Para ilustrar el ejercicio vamos a emplear los mismos datos que usamos en el ejemplo con matplotlib pero vemos paso a paso cómo realizaríamos el gráfico: ...

13 de febrero de 2019 · rvaquerizo

Simple tricks for `rstats`

In my Twitter account, I usually post some simple R tricks, things that come up when I’m working and don’t cost much to share in 2 minutes, in case I can help someone. I just realized that they are really useful and that having them scattered on Twitter is a problem, so I thought I’d collect them in a blog post to make them easier to find (even for me). Here are some of those tricks: ...

11 de febrero de 2019 · rvaquerizo

Muestrear no es pecado

Hace unos días que nació la web de José Luis Cañadas y ya está añadida a los enlaces de AyD; desde aquí nos hacemos eco de esta nueva bitácora: https://muestrear-no-es-pecado.netlify.com/ Seguiremos muy de cerca a JL porque es un tipo de esos que merece ser escuchado por cómo mezcla pragmatismo y rigor, dos de las principales características que tienen que tener los científicos de datos y que últimamente están vilipendiadas.

5 de febrero de 2019 · rvaquerizo

Las mujeres son más inteligentes pero no están en puestos directivos

A raíz de una noticia sobre la reestructuración del consejo directivo de un gran banco in España, donde solo una mujer ha sido elegida entre los 12 puestos de dirección general, me ha surgido la oportunidad para explicar qué es una distribución de probabilidad, qué es una distribución normal y qué es la media y la desviación típica. Aquí tenéis in Python un código que simula el IC de los hombres y el IC de las mujeres; no me he complicado mucho la vida ni he buscado datos al respecto, pero leyendo un poco creo que deben de parecerse mucho a esto: ...

3 de febrero de 2019 · rvaquerizo