Recientemente hemos aprendido a aplicar OCR de muchas maneras con la ayuda de Tesseract. Sin embargo, como ocurre en la mayoría de los campos de las ciencias de la
- Home
- |
- Category: Reconocimiento Óptico de Caracteres
Recientemente hemos aprendido a aplicar OCR de muchas maneras con la ayuda de Tesseract. Sin embargo, como ocurre en la mayoría de los campos de las ciencias de la
Sabemos cómo localizar y extraer texto de imágenes en condiciones ideales usando Tesseract. También sabemos cómo usar EAST para localizar texto en circunstancias más complejas, con la ayuda
Tesseract es una herramienta con muchas facetas.Hasta este punto, la hemos utilizado principalmente para extraer texto de una imagen, así como obtener información sobre la escritura y la
En un artículo publicado recientemente hablamos sobre cómo traducir texto usando una combinación de OCR y NLP.No obstante, en aquella ocasión nuestro lenguaje de partida siempre era el
Tesseract es una herramienta muy poderosa y versátil, con facetas que se extienden más allá del simple “escaneado” de texto en una imagen. Ya vimos en artículos previos
En los últimos artículos sobre Tesseract, una de las constantes con las que nos hemos topado es la inhabilidad de la librería de procesar imágenes que no presenten
Como descubrimos en el post anterior, es posible usar Tesseract directamente sin especificar configuraciones adicionales o específicas. No obstante, si revisas dicho artículo nuevamente, te percatarás de que
Después de haber aprendido sobre los orígenes y utilidad de OCR como campo de estudio, así como haber instalado Tesseract en nuestros ordenadores, el siguiente paso es crear
Las siglas OCR, que significan Optical Character Recognition, se usan para referirnos a una familia de técnicas, algoritmos y dispositivos especialmente diseñados para convertir imágenes en texto. Dicho