La operación "Extraer OCR" op_extract_ocr permite extraer el OCR de un documento.
Puedes configurar los siguientes parámetros:
- Engine: motor con el que se ejecutará la extracción.
- Language: idioma del texto a ser extraído. Si no se indica, tomará el español por defecto.
- Force: booleano que indica si se debe forzar la extracción por OCR o no (por defecto desactivado). Si no se fuerza, se intentará primero extraer el texto del documento del binario directamente y, si no, por OCR.
- Pages: páginas a extraer. Se deben poner separadas por comas y pueden utilizarse rangos. Por ejemplo, "1,2,6-9" extraerá el texto de las páginas 1, 2, 6, 7, 8 y 9.
- Split lines: separación por líneas de la extracción (por defecto activado).
Cuando el documento termine de procesarse, puede visualizar el texto extraído desde el panel OCR a la derecha de la pantalla. Si no tiene este panel activo, deberá activarlo desde la configuración del formulario.
Comentarios
0 comentarios
Inicie sesión para dejar un comentario.