Athento permite la configuración de múltiples plantillas para la extracción de campos en un mismo formulario. Esta funcionalidad es útil para aquellos casos en los que los documentos de los que queremos extraer los datos tienen diferente estructura y los campos no siempre aparecen en la misma posición.
Prerrequisitos
Para que la extracción de datos funcione, el espacio que contiene los documentos a procesar, debe tener activas las siguientes operaciones:
- Extraer número de páginas.
- Extraer texto u OCR.
- Clasificar por similitud de texto aproximado (Classifier by Fuzzy Text Similarity).
En la configuración de la operación de clasificación se debe indicar que se utilizarán plantillas de extracción (poner a True).
Crear Plantillas
Las plantillas pueden ser creadas desde un documento que se quiera usar como plantilla.
También puedes hacerlo desde la configuración del formulario, desde la pestaña Plantillas de Extracción.
Haz clic en el botón "Nueva plantilla de extracción". A continuación, el sistema te pedirá un nombre para la plantilla. Haz clic en "Crear" para terminar.
Configurar clasificación de la plantilla
Haz clic en el nombre de la plantilla para acceder a ella. A continuación, haz clic en la pestaña Clasificación.
A continuación, deberás indicar "Palabras permitidas". Las palabras permitidas son expresiones que sabes que aparecerán en el texto del documento y que Athento puede utilizar para clasificarlo. Haz click en el botón "Añadir palabra permitida".
A continuación, añade la palabra o expresión que quieres utilizar. Puedes utilizar puntos (.) como comodines en caso de que existan caracteres que puedan variar en la extracción:
Blackwords (Palabras no permitidas)
Athento también permite la definición de expresiones que pueden ayudarnos a reducir falsos positivos de clasificación. Estas expresiones son útiles cuando se tienen plantillas muy parecidas entre sí.
Con las blackwords podemos decirle a Athento que si encuentra una de esas palabras en el texto, no clasifique el documento bajo esta plantilla.
Configurar la extracción de campos
En la pestaña "Plantilla", debes subir un documento de muestra para tu plantilla.
Si te equivocas y cargas el archivo incorrecto, puedes utilizar el botón de la papelera para borrarlo.
A continuación, sobre la imagen de la plantilla, manteniendo el botón izquierdo del ratón presionado, dibuja un recuadro sobre la posición del dato que quieres extraer.
En el selector que aparece debajo del recuadro, debes indicar el nombre del campo al que corresponde la zona dibujada y hacer clic en el icono check para guardar tu selección.
Si te equivocas, puedes borrar la selección haciendo clic sobre la papelera. Los simbolos "<" y ">" te ayudarán a abrir o cerrar este menú para que puedas trabajar en tus plantillas de forma más cómoda.
Una vez guardes los cambios, a la derecha de la pantalla verás la información sobre la localización del campo.
Desde aquí podrás utilizar también algunos controles para trabajar mejor.
- Icono del ojo: te permite ocultar el área sobre la plantilla. Esto es útil cuando tienes dos datos muy cerca el uno del otro.
- Icono de la papelera: te permite borrar el área de selección.
- Icono de la tuerca: te permite añadir un valor por defecto para el campo cuando sea clasificado con esta plantilla. Además, puedes añadir un texto para indicar donde comienza la extracción, y otro para marcar donde finaliza.
- Icono del usuario con la tuerca: este icono sólo está disponible para superusuarios y permite el acceso a la administración avanzada del campo.
Poner un valor por defecto para un campo en una plantilla
Puedes utilizar esta funcionalidad cuando sabes que siempre para una misma plantilla el valor de un campo no cambia. Por ejemplo, para una factura de un proveedor determinado, el número de identificación del proveedor (CIF,VAT,RUT, etc.) no cambiará.
Utiliza el icono de la tuerca para acceder a esta funcionalidad. En el cuadro de dialogo que se abre, pon el valor por defecto que el campo tomará cuando un documento sea clasificado con esta plantilla. No olvides guardar los cambios.
Añadir comienzo y final de la extracción
Puedes utilizar esta funcionalidad cuando en un recuadro marcado, no quieres que se extraiga todo lo que está dentro de él. Para ello, puedes poner un comienzo y un fin de la extracción. Se accede desde el icono de la tuerca, una vez abierto, tendrás que rellenar tanto el comienzo como el final de la extracción. No olvides guardar los cambios.
Añadir lista de caracteres prohibidos
Puedes añadir una lista de caracteres prohibidos para descartarlos. Se accede desde el icono de la tuerca, una vez abierto, tendrás que rellenar el campo con los caracteres requeridos separados por comas.
Extraer datos en páginas diferentes a la primera
Utiliza el controlador de la página para moverte entre las páginas del documento y define las áreas de extracción igual que lo has hecho en la primera página.
Heredar la expresión dinámica del campo en la plantilla de extracción
Si definiste en la configuración del campo una expresión dinámica, por defecto, esta configuración no se aplicará al campo cuando un documento sea clasificado con una plantilla. Se aplicará la configuración del campo para esa plantilla.
Puedes copiar o heredar la expresión dinámica desde la opción que se muestra en la siguiente captura de pantalla.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.