En Athento es posible a partir de un lote de documentos cargados en un único fichero (por ejemplo un pdf con 10 notas simples en el mismo fichero), se generen documentos individuales dividiendo el lote por tantos documentos individuales existan.
Para ello, se ha de seguir los siguientes pasos:
1. Activar la operación Extract OCR en el espacio donde se vayan a cargar los lotes de documentos
Para activar la extracción de OCR, ver artículo ¿Cómo extraer el OCR de un documento?
2. Activar operación para que realice la clasificación de los documentos
La operación es: Classifier by Fuzzy Text Similarity (classifying.classifiers.white_and_black_words)
Los parámetros a configurar en la operación son:
Para configurar los formularios para que se clasifiquen ver artículo: Cómo configurar los formularios para la clasificación de los documentos
3. Activar la operación que realice la división de documentos
La operación es: Split document by pages classified
Dentro de la misma, se encuentran algunos parámetros que pueden ser útiles:
- classification_method: Método de clasificación a filtrar. Si no es introducido ningún valor, se considerarán todas las clasificaciones de página.
- metadatas_to_copy: Metadatos que serán copiados desde el documento original hacia los nuevos documentos.
- ignore_consecutive: Define si las páginas consecutivas con la misma clasificación de página serán ignoradas. En tal caso, sólo se creará un documento individual para la primera de las páginas con tal clasificación.
- duplicate: Determina si los documentos individuales serán duplicados en caso que ya existieran.
- clone: Determina si los recursos extraídos para el documento original serán copiados dentro de los documentos individuales.
- serie: Espacio donde los documentos individuales serán creados.
En el siguiente vídeo se puede ver la funcionalidad en acción.
Artículos relacionados
Cómo configurar los formularios para la clasificación por páginas
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.