Cómo realizar la división de un lote de documentos y que se generen documentos individuales

En Athento es posible a partir de un lote de documentos cargados en un único fichero (por ejemplo un pdf con 10 notas simples en el mismo fichero), se generen documentos individuales dividiendo el lote por tantos documentos individuales existan.

Para ello, se ha de seguir los siguientes pasos:

1. Activar la operación Extract OCR en el espacio donde se vayan a cargar los lotes de documentos

Para activar la extracción de OCR, ver artículo ¿Cómo extraer el OCR de un documento?

2. Activar operación para que realice la clasificación de los documentos

La operación es: Classifier by Fuzzy Text Similarity (classifying.classifiers.white_and_black_words)

Los parámetros a configurar en la operación son:

Screenshot 2023-12-19 at 15.46.47.png

Para configurar los formularios para que se clasifiquen ver artículo: Cómo configurar los formularios para la clasificación de los documentos

3. Activar la operación que realice la división de documentos

La operación es: Split document by pages classified

Dentro de la misma, se encuentran algunos parámetros que pueden ser útiles:

classification_method: Método de clasificación a filtrar. Si no es introducido ningún valor, se considerarán todas las clasificaciones de página.
metadatas_to_copy: Metadatos que serán copiados desde el documento original hacia los nuevos documentos.
ignore_consecutive: Define si las páginas consecutivas con la misma clasificación de página serán ignoradas. En tal caso, sólo se creará un documento individual para la primera de las páginas con tal clasificación.
duplicate: Determina si los documentos individuales serán duplicados en caso que ya existieran.
clone: Determina si los recursos extraídos para el documento original serán copiados dentro de los documentos individuales.
serie: Espacio donde los documentos individuales serán creados.

En el siguiente vídeo se puede ver la funcionalidad en acción.

1. Activar la operación Extract OCR en el espacio donde se vayan a cargar los lotes de documentos

2. Activar operación para que realice la clasificación de los documentos

3. Activar la operación que realice la división de documentos

Artículos relacionados

Comentarios