Los procesos de extracción de datos no dependen única y exclusivamente de las capacidades del OCR o los mecanismos de extracción de texto del software. En realidad, dependen en gran medida de la naturaleza de los documentos de los que se pretende extraer los datos.
Por ejemplo, documentos nacidos digitales y que no han sido convertidos a imágenes, presentan mejores tasas de extracción de datos que documentos escaneados. Documentos con manchas, marcas de agua o fondos, suelen dificultar las labores de extracción de datos. Una fotografía de un documento es más compleja de tratar que una imagen escaneada, ya que presenta distorción por luz y perspectiva.
Así pues, el éxito de la extracción de datos, va a depender de qué tanto control tengamos sobre los documentos de los que se pretende extraer información.
Por otro lado, las tecnologías OCR en sí mismas, no son 100% infalibles, por lo que incluso con documentos de buena calidad, podrían presentar algún margen de error.
Por todas estas razones, Athento no puede comprometerse con un porcentaje de acierto en extracción de datos. Lo que sí podrá seguro, es ayudar a automatizar parcialmente un proceso de extracción de información de documentos, reduciendo esfuerzo y tiempos dedicados.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.