Athento permite realizar la anonimización de documentos, ocultando de esta forma información sensible de los mismos a los usuarios.
El proceso de anonimización consta de dos pasos:
- Detección de las entidades sensibles del documento.
- Anonimización del documento a partir de las entidades sensibles extraídas.
- Visualización del documento anonimizado.
Detección de las entidades sensibles del documento
Para detectar las entidades sensibles de un documento se debe ejecutar la automatización "op_anonymize_pdf_entities", la cual está disponible en el listado de automatizaciones del espacio. Esta automatización funcionará correctamente solo sobre documentos PDF. Esta tiene dos parámetros:
- Black words: Entidades que deben ignorarse en la detección. La operación puede detectar entidades que no deberían anonimizarse algunas veces, por lo que lo mejor sería probarla sobre un conjunto de documentos e incluir entidades que queremos que sean ignoradas en este parámetro. Deben separarse por comas.
- Extract text: Check para extraer el texto de los documentos PDF que no tengan texto digitalizado.
Una vez lancemos la operación sobre cualquier documento PDF, podremos ver una característica con aquellas entidades sensibles y en que página y posición se encuentran esas entidades.
Este valor solo podrá ser visto por usuarios que tengan permisos de administración sobre el documento.
Anonimización del documento a partir de las entidades sensibles extraídas
Una vez hemos extraído las entidades sensibles del documento, debe ejecutarse una automatización para que estas entidades sean anonimizadas dentro del documento.
Esta automatización es "op_anonymize_document". Al ejecutarse el proceso, las entidades clasificadas como sensibles en el paso anterior quedarán ocultas mediante recuadros negros, lo que dará lugar a un nuevo documento con estas marcas de ocultación.
Visualización del documento anonimizado
Próximamente...
**Nota: Esto solo está disponible sobre documentos PDF
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.