Análisis y Decisión

Mapa España por Comunidades Autónomas con Google Studio

Continúo evaluando métodos para crear mapas con software que no sea de pago e intentando que la dificultad sea mínima. En este caso, quería mostraros y poner a vuestra disposición un mapa de España por Comunidades Autónomas; además, os dejo acceso libre a los datos que usa el mapa para que vosotros mismos podáis realizar el trabajo. Voy a pasaros dos enlaces: uno con los datos, donde tenemos cifras de pruebas PCR por 100.000 habitantes a nivel de comunidad autónoma (por representar algo); es ahí donde debéis incluir los datos que deseáis representar gráficamente. El otro enlace es el dashboard simple hecho con Data Studio que veis al inicio de la entrada, que contiene un mapa con el formato que en este momento necesito. Este trabajo es meramente experimental, porque pongo a disposición de todos tanto el mapa como la Hoja de Google; veremos lo que tarda en dejar de funcionar. ...

Leer fichero de texto de ancho fijo con Python Pandas

Es muy habitual trabajar con archivos CSV, pero en ocasiones disponemos de ficheros de texto con determinado formato o con ancho fijo para las columnas. Hace tiempo ya escribí sobre la lectura de archivos CSV con Python y Pandas, pero en esta ocasión vamos a leer archivos que no tienen un separador. Evidentemente tienen que darnos el formato del archivo; en este caso, para ilustrar el ejemplo, vamos a pasar un código en R a un código en Python. ...

Leer una tabla en PDF con Excel (a través de R)

Hay situaciones en las que tenemos datos in PDF y los necesitamos exportar a Excel para graficar o cruzar esos datos. In ocasiones es mejor meter esos datos a mano, otras veces disponemos de un software de pago que nos permite realizar esa tarea y también hay páginas web que nos permiten cambiar el formato del PDF. In nuestro caso, simplemente necesitamos una tabla que está in formato PDF para disponer de esos datos in Excel; más sencillo: copiar del PDF y pegar in Excel esa tabla. Si está in texto, el PDF se puede complicar y, si está in modo imagen, más. Si empleas Windows, esta entrada puede ser de utilidad, ya que usando R podrás hacer esta tarea de copiar PDF y pegar Excel de un modo más rápido; te cuento paso por paso en vídeo. ...

Trucos Excel. Convertir texto en un resultado o fórmula

Es posible que en Excel tengamos fórmulas que provengan de la concatenación de algunas celdas y necesitemos ejecutar o crear una fórmula. En este caso, he encontrado una función muy sencilla que podemos añadir a nuestro libro de macros personal o directamente a nuestro libro. La función es genial y sencilla, y proviene de este foro: https://www.mrexcel.com/board/threads/eval-function-without-the-morefunc-add-in.62067/ Function Eval(Ref As String) Application.Volatile Eval = Evaluate(Ref) End Function Tiene muchos años, pero podéis comprobar que funciona perfectamente. Esta solución me parece más elegante que otras, aunque es probable que Microsoft haya optado por incluir una función que haga esta labor; lo desconozco. Saludos.

La importancia del valor predictivo positivo en las pruebas diagnósticas

El valor predictivo positivo es un dato olvidado cuando realizamos una prueba diagnóstica o (mejor dicho) cuando empleamos este método de medir la potencia de mi modelo. En ocasiones, un modelo parece excepcional pero cabe preguntarse si un buen modelo puede hacernos perder dinero. Además, conviene incidir en la necesidad de calibrar los modelos y medir su comportamiento predictivo y su «comportamiento económico». Este vídeo es continuación del que tenemos en la anterior entrada del blog. Espero despertar alguna conciencia e incidir sobre la importancia de medir económicamente el comportamiento de un modelo. La historia que se cuenta es real y supuso un buen proyecto para la compañía en la que trabajaba; no haciendo modelos, pero sí instalando un nuevo entorno de detección de fraude. Saludos.

Principales elementos en las pruebas diagnósticas

Primer vídeo que subo. Ilustro de modo sencillo algunos elementos de las pruebas diagnósticas con un ejemplo sencillo que podéis reproducir en cualquier hoja de cálculo. No soy precisamente un experto en este tipo de análisis, pero me han sido útiles en algunos momentos de mi vida profesional; además, esa visión “simplista” de las cosas puede ayudar a muchos a comprender conceptos más complejos. Si tiene éxito continuaré hablando sobre razones de probabilidad. Gracias.

Tratamiento y procesado de imágenes con R y `magick`

Estoy preparando la batalla entre geometría e inteligencia artificial, batalla que está perdida porque tengo que dar de comer a mis chavales y, si tengo que ir a vender un producto, queda más comercial contar lo que se supone que hace la inteligencia artificial y no contar lo que hacen vectores, direcciones, puntos en el espacio… eso lo cuentan en la educación secundaria y no es “disruptivo”. Sin embargo, aprovecho para contar historia del abuelo: el único proyecto serio basado en inteligencia artificial en el que he estado involucrado se resolvió gracias a la geometría y a las mejoras que se propusieron en el reconocimiento óptico; las redes convolucionales nos provocaron un problema. Inicialmente es mejor plantear una solución sencilla. ...

Expandir un data frame de R con tidyr

En alguna entrada del blog ya he tratado sobre la expansión de un conjunto de datos, pero quería tener una entrada específica. Es algo que se puede programar mediante bucles (tarda una vida) o bien podemos usar la función expand del paquete tidyr. Viendo un ejemplo y los conjuntos de datos generados, vais a entender el propósito de la expansión de tablas: se trata de un inicio y un fin, y deseamos que se genere una secuencia de observaciones sucesivas dado ese inicio y ese fin. A modo de ejemplo ilustrativo: ...

Optical Character Recognition (OCR) con R y tesseract

Una pincelada sobre Optical Character Recognition con R. El paquete tesseract de R permite aplicar el reconocimiento óptico de caracteres con R de una forma bastante sencilla; es uno de los múltiples líos en los que me estoy metiendo; si llega a buen puerto, pondré más. Tenemos esta imagen: Necesitamos tanto el paquete tesseract como el magick y, ejecutando en R: library(tesseract) library(magick) img <- image_read("/images/2020/06/prueba_OCR.png") str(img) cat(image_ocr(img)) El resultado del OCR es el siguiente: ...

Latent semantic analysis y la importancia de las matemáticas

Vivimos «días extraños», tan extraños que in España se están planteando prescindir de la asignatura de matemáticas en la enseñanza obligatoria. Es evidente que las personas que gobiernan hoy (25/05/2020) España habrían suspendido matemáticas. Sin embargo, es curioso que haya pocos matemáticos ejerciendo cargos políticos, ¿puede ser que los matemáticos no tengan esa vocación por mejorar la vida de los demás? En fin, esta crítica a la ignorancia numérica y al egoísmo matemático me sirve de «extraña introducción» al Latent Semantic Analysis (LSA); como siempre, los aspectos teóricos los podéis encontrar in otros sitios. Y todo este conjunto de frases inconexas hilan con la entrada en el blog de mi amigo J.L. Cañadas in Muestrear no es pecado porque reducción de dimensionalidad, el lenguaje y la importancia de las matemáticas es, in realidad, el Latent Semantic Analysis. ...