¿Qué es IDP? o Procesamiento Inteligente de Documentos
IDP o Intelligent Document Processing
Hasta hace algunos años, lo importante en la digitalización de documentos estaba centrado en la imagen y en algunos índices capturados manualmente.
En la siguiente etapa se utilizaron técnicas como la extracción de información desde un código de barras, reconocimiento de marcas OMR, OCR, ICR e incluso, búsquedas a Bases de Datos para extraer información.
El scanner era el componente fundamental para la captura de información y para la captura de imágenes, la cual era capturada a mano o automáticamente respecto a su contenido.
Hoy, las imágenes no provienen únicamente de scanners, sino de cualquier fuente que genere información para la organización, archivos PDF, archivos Excel, información capturada desde celulares, etcétera.
Todas estas eran tareas con mucho componente manual, visualmente se identificaba un documento y se categorizaba dentro de una clase documental en particular para luego extraer los datos relevantes, esto se hacía con cada uno de los documentos digitalizados.
Para lograr indexar (Data Entry), se requería de un batallón gigantesco de personas que con mayor o menor atención, digitaban lo observado, esto generaba un alto grado de inconsistencias dado el error humano durante la captura, posteriormente diligenciaban formularios para que finalmente se diera una categoría y unos datos a cada una de las clases documentales.
Las nuevas tecnologías que están revolucionando las ciencias de los datos, tales como la inteligencia artificial, el aprendizaje de máquina, entre muchas otras han ayudado a que las plataformas de procesamiento inteligente de documentos , en inglés Intelligent Document Processing (IDP), se queden para apoyar los procesos de gestión documental tradicionales.
Un sistema de IDP, o Procesamiento Inteligente de Documentos esta centrado en cuatro etapas muy bien diferenciadas las cuales son:
- Clasificación documental.
- Extracción de datos.
- Aplicación de reglas de negocios.
- Generación de archivos.

Clasificación Documental
Aclaremos el concepto de clasificar documentos, un ejemplo típico puede ser la solicitud de crédito bancario, seguramente todos hemos aplicado a un crédito y hemos recopilado cientos de documentos, como cédula de ciudadanía, solicitud de crédito, certificación laboral, comprobantes de pago, declaraciones de renta, extractos bancarios, entre otros; todos estos documentos completamente sin estructura u homogeneidad.
Cada documento es importante para el proceso, algunos son obligatorios y algunos son opcionales, pero cada uno de ellos contiene información necesaria para tomar la decisión de otorgar o no el crédito y cuál sería el monto del mismo.
El sistema de IDP, en este caso puntual, tendrá que hacer muchas tareas antes de determinar qué clase de documento es, el gran reto aquí, es lograr un proceso de reconocimiento óptico de caracteres (OCR Optical Character Recognition) que garantice una alta tasa de éxito.
Esta alta tasa de reconocimiento en el OCR se logra, primero, obteniendo imágenes muy buenas y para ello se debe seleccionar un muy buen scanner que utilice tecnologías de limpieza de imágenes; segundo, utilizando un software que utilice los mejores motores de reconocimiento.
Gracias al scanner y al motor de OCR, se puede entonces determinar qué clase de documentos tenemos, así que ¡estamos listos para la siguiente etapa!
Extracción de Datos
Ya con las imágenes clasificadas y con datos útiles extraídos por el OCR, podemos pasar a la siguiente etapa que se hace en combinación con la tercera etapa o ‘Reglas de Negocio’, pero para efectos pedagógicos los hemos separado en tareas diferentes.
No todos los datos son útiles, será el cliente final quien determine cuáles son relevantes, seguramente el nombre, número de cédula, fecha de expedición y lugar de nacimiento pueden ser útiles, pero en un certificado laboral, el salario y fecha de ingreso lo serán.
En ocasiones la información estará estructurada como en el caso de la cédula, sabemos exactamente dónde encontrarla, pero en una certificado laboral los datos pueden estar en cualquier lugar del documento, es decir, no estructurada y es allí donde se requiere un software que aprenda (Machine Learning ML), que evolucione día a día y sea capaz de localizar y entregar la información correcta, relacionada con ese documento en particular.
Reglas de Negocio
Son aquellas validaciones particulares de cada cliente que definen cómo proceder frente a circunstancias especial.
Regresemos al ejemplo de la solicitud de crédito, donde es importante contar con documentos obligatorios que deben anexarse, una regla de negocio podría ser rechazar cualquier solicitud que no venga acompañada de la fotocopia de la cédula, o que la solicitud de crédito debe tener la firma del cliente.
El proceso inteligente de documentos identificará estas variables y desviará la solicitud a un estado de rechazo para que cuando se cumplan con los requerimientos de las reglas de negocio, se vuelva a procesar toda la solicitud.
Gran ahorro de tiempo y recursos automáticamente
Vamos a un nuevo ejemplo, auditorias de cuentas médicas, una regla importante podría ser validar que una droga para tratar el cáncer no sea contabilizada en la atención de un accidente de tránsito, o verificar las cantidades utilizadas versus el total facturado.
Siempre, necesitaremos la presencia de humanos para tomar decisiones que el IDP no sea capaz de identificar o extraer correctamente. Serán en definitiva menos hombres procesando, a comparación de la versión original relacionada con procesamiento manual.
Generación de archivos
Finalmente el sistema debe generar archivos XML, archivos de texto que sean útiles para futuros procesos de manejo de información, y también la generación de archivos de imágenes en formatos reconocibles como tiff , pdf buscable, o pdf/a muy valioso para proteger la información en el tiempo.
Beneficios de un sistema IDP
- Alto valor e impacto en las organizaciones, por su precisión , velocidad y precio.
- Innovación con la utilización de tecnologías de punta para procesamiento de información
- Personalización de procesos
- Aceleración en la producción
Donde es útil un IDP Intelligent Document Processing
Podríamos generalizar que en un futuro cualquier vertical se beneficiaran de un IDP, sin embargo podemos decir quienes al día de hoy sacarán mejor provecho en un corto lapso de tiempo de las bondades de un IDP.
- Telecomunicaciones: Para manejo de logs de errores y mantenimiento, contratos de usuarios
- Servicios Financieros: Aplicaciones de hipotecas y prestamos, pólizas de seguros, aperturas de productos como cuentas de ahorro, cuentas corrientes, tarjetas de crédito.
- Cadenas de suministros: Apertura de pedidos y seguimientos , facturación y pruebas de entrega.
- Gobierno: Aplicaciones de inmigración, aplicaciones educativas, calificación de exámenes.
- Salud: Tratamientos, auditorias de cuentas medicas, historias clínicas, seguimiento de pacientes y tratamientos.
- Manufactura: ERPs, procesamiento de ordenes de compra y facturación.
- Recursos Humanos: Registros de trabajadores, reclutamiento.
Créditos de imágenes
Imagen 1 Foto de negocio creado por drobotdean – www.freepik.es</a>