Optical Character Recognition (OCR) con R y tesseract
Una pincelada sobre Optical Character Recognition con R. El paquete tesseract de R permite aplicar el reconocimiento óptico de caracteres con R de una forma bastante sencilla; es uno de los múltiples líos en los que me estoy metiendo; si llega a buen puerto, pondré más. Tenemos esta imagen: Necesitamos tanto el paquete tesseract como el magick y, ejecutando en R: library(tesseract) library(magick) img <- image_read("/images/2020/06/prueba_OCR.png") str(img) cat(image_ocr(img)) El resultado del OCR es el siguiente: ...