A lo largo de el último, mes hemos estado interactuando de forma muy constante con Tesseract OCR y sus funcionalidades. Los orígenes de los OCR y su reciente
- Home
- |
- Category: PyTesseract
A lo largo de el último, mes hemos estado interactuando de forma muy constante con Tesseract OCR y sus funcionalidades. Los orígenes de los OCR y su reciente
En un artículo publicado recientemente hablamos sobre cómo traducir texto usando una combinación de OCR y NLP.No obstante, en aquella ocasión nuestro lenguaje de partida siempre era el
Tesseract es una herramienta muy poderosa y versátil, con facetas que se extienden más allá del simple “escaneado” de texto en una imagen. Ya vimos en artículos previos
En los últimos artículos sobre Tesseract, una de las constantes con las que nos hemos topado es la inhabilidad de la librería de procesar imágenes que no presenten
Otra de las configuraciones que podemos aplicar a Tesseract tiene que ver con el filtrado de qué caracteres queremos permitir, y cuáles queremos prohibir. En inglés, nos referimos