Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Leer Un PDF
Leer Un PDF
Puede leer y extraer por separado el contenido de .pdf archivos usando actividades que
pueden leer todos los caracteres incluidos en el documento.
Dependiendo de sus necesidades, puede usar una actividad simple que pueda reconocer
los caracteres, o usar una con un motor OCR. Las ventajas de utilizar un motor de OCR
son que la lectura de documentos se puede aplicar incluso en documentos escaneados,
firmados o escritos a mano.
Solo se requiere un flujo de trabajo para ambos escenarios, común hasta el punto de pedir
al usuario que elija el método de lectura deseado.
chooseOption ValorGenérico
• NOTA: añade tus archivos .pdf al directorio del proyecto para poder
ejecutar todo el proceso desde el mismo lugar o descarga este ejemplo
para usar el archivo indicado.
arrayText System.String []
Dirección ValorGenérico
Ciudad Cadena
invoiceNumber Cadena
Proveedor ValorGenérico
bankAccount Cadena
ibanCode Cadena
extractedTextTesseract Cadena
extractedTextMicrosoft Cadena
Este es el aspecto que debe tener su flujo de trabajo hasta este punto:
Leer un archivo PDF utilizando la actividad Leer texto PDF
1. Abre el contenedor Leer secuencia de texto PDF haciendo doble clic en él.
2. Arrastra una actividad Leer texto PDF dentro de la secuencia.
• En el panel Propiedades , añade la expresión "NPO Invoice.pdf" en el
campo NombreDeArchivo .
• Añade el valor "All" en el campo Intervalo .
• Agrega la variable extractedText en el campo Texto.
• Agrega la
expresión extractedText.Split(Environment.NewLine.ToArray,
StringSplitOptions.RemoveEmptyEntries) en el campo Valor.
4. Arrastra una actividad Si debajo de la actividad Asignar .
• Añada la expresión arrayText(0).Equals("Tiefland Glass AG") en
el campo Condición.
5. Arrastra una actividad Asignar dentro del contenedor Secuencia.
• Añade la variable address en el campo Para.
• Agrega la
expresión arrayText(4).Split(":"c)(1).Split({"INVOICE"},Stri
ngSplitOptions.None)(0) en el campo Valor.
• Agrega la
expresión arrayText(4).Split(":"c)(1).Split({"INVOICE"},Stri
ngSplitOptions.None)(1).Split("#"c)(1) en el campo Valor.