OCR, Reconocimiento Óptico de Caracteres
El Reconocimiento Óptico de Caracteres (OCR, por sus siglas en inglés) es una tecnología que permite convertir diferentes tipos de documentos, como documentos en papel escaneados, archivos PDF o imágenes captadas por una cámara, entre otros, en documentos cuyos datos son editables y con opción de búsqueda. Esta tecnología se utiliza para escanear y reconocer caracteres e, incluso, códigos de barras en cualquier tipo de documento (albaranes, formularios, facturas, etc.).
Así, los datos pueden editarse, archivarse o dejarse preparados para trabajar con ellos en otra aplicación, si previamente se ha realizado la integración con la misma. ¿Qué ventajas tienen los sistemas OCR? Ayudan a extraer la información de forma rápida y precisa, para transferirla así a formato electrónico y facilitar la gestión electrónica de estos documentos de forma eficaz, segura y ágil.
En la siguiente tabla aparecen los programas de OCR más populares en el mercado, y un resumen de las características que pueden resultar más interesantes para su empresa.
Para el correcto funcionamiento del programa OCR y la óptima conversión de los textos, es necesario observar unos parámetros de calidad mínimos. Para que la imagen escaneada cumpla esos requisitos, es necesario configurar el escáner de manera óptima. Se han de tener en cuenta los siguientes parámetros:
- Resolución: la resolución mínima para asegurar la correcta conversión de un texto con una fuente de un tamaño de 10 puntos o más es de 300 ppp (puntos por pulgada). Lo ideal serían 400 ppp, aunque en casos de fuentes muy pequeñas podrían ser necesarios hasta 600 ppp. Una mayor resolución se traduce en un archivo más pesado, pero es preferible un archivo mayor que propicie una buena conversión.
- Color del texto: antes de escanear, se suele poder elegir entre 3 modos: blanco y negro, escala de grises y color. La opción más segura es elegir el modo escala de grises, aunque si el documento físico tiene una fuente clara y con buena definición la opción blanco y negro también puede funcionar. Si el documento incluye fotografías y es totalmente imprescindible conservarlas en color, se podría usar la opción de escaneado a color, aunque el texto convertido podría resultar de peor calidad.
- Formato del archivo: imágenes guardadas en formato TIFF o PNG mantienen mejor la calidad que las guardadas en formato JPEG.
- Compresión de la imagen: existen dos tipos de compresión, lossy y lossless. La segunda opción es más adecuada para el reconocimiento OCR ya que mantiene la calidad de la imagen.
- Opciones de brillo: en la mayoría de los casos un valor del 50% es adecuado.
Este tipo de programas suelen ser muy útiles integrados en un sistema de gestión documental o embebidos en los propios equipos multifunción disponibles en nuestra plataforma de Servicios MDS de Save4Print. Consúltanos por estos equipos.
Suscríbete a nuestra newsletter para estar al día de todas las novedades del sector de la impresión y digitalización….
Ventajas de los sistemas OCR
- Ahorro de tiempo: La introducción de datos en un sistema informático para su utilización en otros procesos es una de las tareas que requiere mucha dedicación. La automatización de este tipo de trabajo supone poder utilizar este tiempo en tareas de más valor.
- Documentos editables: Como hemos visto, cualquier documento de texto, aunque sea una imagen, puede convertirse en un documento editable gracias al software OCR. El sistema permite, además, realizar búsquedas en el texto por palabras clave y comparar documentos.
- Escaneo de imágenes: Como el sistema OCR escanea todo el documento, las imágenes contenidas en el archivo se escanearán también y podrán ser utilizadas y editadas.
- Mayor productividad y mayor calidad en el servicio: Al aumentar la velocidad de procesamiento de la información y eliminar la posibilidad de errores al introducir los datos en el sistema, se incrementa la productividad y, en última instancia, mejora el servicio al cliente.
- Elimina los archivos físicos: Con un sistema OCR se consigue tener un archivo de documentos digitalizado y estandarizado, con una información accesible. De esta manera, además de conseguir un archivo más eficiente, se reduce considerablemente el espacio dedicado a almacenar documentos.
- Accesibilidad para personas con discapacidad auditiva o visual: El reconocimiento óptico de caracteres facilita el acceso a los documentos por parte de personas con dificultades auditivas o visuales.
- ROI rápido: La implementación de este tipo de soluciones es muy rápida y su mantenimiento es sencillo, por lo que el retorno de la inversión se aprecia muy pronto.
- Procesamiento programable: El procesamiento de los documentos se puede realizar en cualquier momento de forma manual, o bien automatizarse y programarse por lotes de archivos.
- Eliminación de información confidencial: Al permitir la edición del documento, especialmente en el caso de documentos en PDF, se puede eliminar la información confidencial y otros “datos ocultos”, como metadatos, comentarios, capas de texto, marcadores…
Sin duda, esta herramienta es el “inicio de la Transformación Digital del documento” en cualquier empresa, ya que gracias a ella se podrá capturar los datos y organizar los documentos de una forma estructurada que permita su posterior explotación en un Gestor Documental.
Fuente: Gdx Group, Tic Portal, Save4Print
Te podría interesar:
“La evolución del Negocio en los servicios de Impresión y Digitalización”
“Soluciones de Impresión, ¿Qué ofrecen?”