Truco Python. Pasar múltiples archivos pdf a texto

Estoy realizando un trabajo de scraping de archivos que genera una entidad estatal en .pdf y es necesario transformar esos archivos .pdf en archivos .txt para un análisis de minería de textos. Los archivos que genera esta entidad estatal me los he descargado vía php y los he alojado en una carpeta específica, por lo que será necesario recorrer esa carpeta e ir cambiando de .pdf a texto cada archivo de esa carpeta (y subcarpetas); por ello el truco se divide en dos partes. ...

2 de febrero de 2024 · rvaquerizo

Resultados de La Liga con rstats. Estudiando gráficamente rachas

Vamos a crear un gráfico con rstats que recoja los resultados de La Liga equipo a equipo para poder estudiar rachas e “intuir” cómo puede ser la segunda vuelta. Además, este ejercicio es un buen uso del paquete worldfootballR y la función de ggplot2 geom_tile; además me va a servir para animarme esta segunda vuelta para que el Espanyol no sufra. La web que vamos a emplear para el trabajo es FBRef. Empezamos. ...

1 de marzo de 2023 · rvaquerizo

De una tabla en forma de matriz a una tabla con una columna. Funciones COINCIDIR y BUSCARV en Excel

En Excel nos encontramos con la necesidad de transformar matrices a columnas. El tema de la transposición con Excel ya se ha visto en el blog con anterioridad, siendo el pasar de varias columnas a una con código una de las entradas con más visitas de este sitio. El caso es que, en este caso, no es tan importante la transposición como la búsqueda de la celda mediante BUSCARV. La tarea que se expone es la siguiente: ...

18 de enero de 2023 · rvaquerizo

Enviar correos electrónicos con rstats. Librería emayili

En este trabajo se va a enviar un correo electrónico automático mediante RStats; para ello se empleará la librería de R emayili. Esta librería evita el uso de Java. Además, se adjuntará un archivo Excel a un correo electrónico; ese archivo se genera mediante openxlsx, que tampoco requiere Java, lo que evita problemas cuando no se tiene bien configurado Java en el entorno de R (por diversos motivos). Para ilustrar el ejemplo, se emplea el conocido data.frame iris y se enviarán vía email distintos subconjuntos de ese data.frame. ...

27 de septiembre de 2022 · rvaquerizo

Medidas dinámicas con Power BI

Se abre una nueva categoría en el blog dedicada al uso de herramientas para la elaboración de cuadros de mando y dashboards. En esta primera entrega trabajaremos con Power BI y la creación de medidas dinámicas para ver en un mismo gráfico una medida u otra en función de una segmentación. No es una labor “inmediata”; por ello he preferido ilustrar el trabajo con un vídeo donde, de forma velada, se pueden intuir mejoras y trucos a aplicar. ...

29 de julio de 2021 · rvaquerizo

Truco Excel. Repetir celdas en función de los valores de otra celda

En alguna ocasión me habéis planteado cómo repetir celdas en Excel en función del valor de una celda; es decir, repetir una celda tantas veces como nos indica otra celda. Disponía de una versión con fórmulas más complejas que programar el proceso en Visual Basic; si alguien está interesado, cuelgo un ejemplo en Excel sin describir el funcionamiento porque es muy complejo; quizá en el futuro retome esas fórmulas e intente simplificar el proceso. ...

4 de febrero de 2021 · rvaquerizo

Leer una tabla en PDF con Excel (a través de R)

Hay situaciones en las que tenemos datos in PDF y los necesitamos exportar a Excel para graficar o cruzar esos datos. In ocasiones es mejor meter esos datos a mano, otras veces disponemos de un software de pago que nos permite realizar esa tarea y también hay páginas web que nos permiten cambiar el formato del PDF. In nuestro caso, simplemente necesitamos una tabla que está in formato PDF para disponer de esos datos in Excel; más sencillo: copiar del PDF y pegar in Excel esa tabla. Si está in texto, el PDF se puede complicar y, si está in modo imagen, más. Si empleas Windows, esta entrada puede ser de utilidad, ya que usando R podrás hacer esta tarea de copiar PDF y pegar Excel de un modo más rápido; te cuento paso por paso en vídeo. ...

14 de septiembre de 2020 · rvaquerizo

Trucos Excel. Convertir texto en un resultado o fórmula

Es posible que en Excel tengamos fórmulas que provengan de la concatenación de algunas celdas y necesitemos ejecutar o crear una fórmula. En este caso, he encontrado una función muy sencilla que podemos añadir a nuestro libro de macros personal o directamente a nuestro libro. La función es genial y sencilla, y proviene de este foro: https://www.mrexcel.com/board/threads/eval-function-without-the-morefunc-add-in.62067/ Function Eval(Ref As String) Application.Volatile Eval = Evaluate(Ref) End Function Tiene muchos años, pero podéis comprobar que funciona perfectamente. Esta solución me parece más elegante que otras, aunque es probable que Microsoft haya optado por incluir una función que haga esta labor; lo desconozco. Saludos.

10 de septiembre de 2020 · rvaquerizo

Truco Excel. Calculadora desde la barra de herramientas de acceso rápido

Hace tiempo que no ponía trucos de Excel y el de hoy es muy sencillo, pero que a mí me ha sido de especial utilidad: un acceso a la calculadora para esos cálculos rápidos que siempre he hecho con la calculadora de sobremesa. Se trata de añadir un acceso a la Calculadora de Windows desde la barra de herramientas de acceso rápido. Vamos a personalizar la barra: Y desde ese menú nos vamos a “Más comandos…”. Se abre un cuadro de diálogo que nos sugiere elementos a añadir, pero la calculadora saldrá si queremos ver todos los elementos disponibles: ...

9 de marzo de 2020 · rvaquerizo

Ejecutar un código al iniciar la sesión de R

A raíz de una conversación en Twitter, os traigo un pequeño truco de R para aquellos que tenéis funciones predefinidas y que tenéis que cargarlas al iniciar las sesiones de R: es como ejecutar el código nada más abrir R. En mi caso, el código que quiero ejecutar son una serie de utilidades que tengo guardadas en C:\carpeta; con source("C:/carpeta/Utils.R", encoding = "UTF-8"), R cargaría todo el código R alojado en ese script de R, y necesito que se ejecute el script al inicial la sesión de R; no quiero poner esa línea al principio de cada programa. Lo primero que tenemos que hacer es buscar dónde tenemos instalado R; una vez hayamos accedido a la correspondiente carpeta, vamos a la subcarpeta /etc y tenemos un archivo llamado Rprofile.site; lo abrimos con un editor de texto: ...

30 de julio de 2019 · rvaquerizo