Este artículo explica cómo clasificar las páginas de un documento cuando en un mismo PDF tenemos diferentes documentos que queremos separar.
Prerrequisitos
En el espacio en el que vayas a usar la clasificación por páginas, debes activar las siguientes operaciones:
- Extraer número de páginas (En fase post load)
- Extract document pages (En fase post load)
- Extract OCR (En fase post charact) o Extract Text en caso de documentos digitales
- Clasificar por similitud de texto aproximado (Classifier by Fuzzy Text Similarity)
Para que las páginas se clasifiquen de forma automática, además de activar una serie de operaciones en el espacio donde se procesarán estos documentos, es necesario realizar una configuración sobre los formularios que se necesite sean clasificados automáticamente por el sistema. En este artículo se detalla el paso a paso de esta configuración.
1. Los formularios susceptibles a ser clasificados de forma automática, deben estar activos en el espacio donde se activará la operación para la clasificación automática.
2. Cada formulario susceptible de ser clasificado automáticamente, deberá tener activo en su configuración básica el check "Clasificación por páginas"
3. Se debe realizar la configuración en cada formulario susceptible a ser clasificado automáticamente de la clasificación por palabra permitida y no permitida.
Para más información ver artículo: ¿Cómo funciona la clasificación por palabras permitidas o white words?
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.