miércoles, 6 de noviembre de 2013

Cómo conservar los espacios en blanco para OCR

Extensible Markup Language, abreviado a XML, es un lenguaje de marcas utilizado típicamente como un conjunto de protocolos para la codificación de documentos locales y remotas en un formato específico. Reconocimiento óptico de caracteres (OCR) es un método por el cual un archivo de ordenador basado en imágenes se puede convertir en un documento basado en texto, en el que todo el texto se puede buscar. Puede utilizar los Extensible Stylesheet Language Transformations elemento "XSLT" "xsl: preserve-space" para preservar los espacios en blanco, que puede ser creado en un archivo XML en el Bloc de notas. 

PRESERVAR



Haga clic en el menú "Inicio" y luego "Todos los programas" y "Accesorios". Haga clic en el icono de acceso directo "Bloc de notas", que pondrá en marcha la aplicación de Windows Bloc de notas.



Copie y pegue la siguiente sintaxis XML en el Bloc de notas:



? Xml version = encoding "1.0" = "ISO-8859-1"?



xsl: stylesheet version = "1.0"



xmlns: xsl = "http://www.w3.org/1999/XSL/Transform"



elementos xsl: strip-space = "strip elegir elemento" /



elementos xsl: preserve-space = "preserve elegir elemento" /



xsl: template match = "/"



HTML



cuerpo



xsl: for-each select = "/"



p



xsl: value-of select = "value_1" / br /



xsl: value-of select = "value_2" / br /



xsl: value-of select = "VALUE_3" / br /



xsl: value-of select = "value_4" / br /



/ P



/ Xsl: for-each



/ Cuerpo



/ Html



/ Xsl: template



/ Xsl: stylesheet



Reemplazar "value_1", "value_2", "VALUE_3" y "value_4" con los valores de los elementos específicos de los que desee conservar y / o tira espacios en blanco. Reemplazar "tira elegir elemento" y "preservar elegir elemento" con los valores de los elementos que se especifican. Esto le proporcionará los fundamentos de cómo preservar el espacio en blanco con OCR XML.



Haga clic en "Archivo" y luego "Guardar". Aparecerá un cuadro de diálogo "Guardar". Cambie la ubicación de la carpeta de ahorro en el escritorio de Windows y, a continuación, cambiar el tipo de archivo a "Todos los archivos". Nombre del archivo "whitespace.xml", y luego haga clic en "Guardar". Esto guardará el archivo en el Escritorio de Windows.



Ir al escritorio de Windows y confirme que el archivo se ha guardado.



 

No hay comentarios:

Publicar un comentario