Que es IDP? o Procesamiento Inteligente de Documentos

IDP o Intelligent Document Processing

Hasta hace algunos años, lo importante en la digitalización de documentos estaba centrado en la imagen y en algunos índices capturados manualmente.

En la siguiente etapa se utilizaron técnicas como la extracción de información desde un código de barras, reconocimiento de marcas OMR, OCR, ICR e incluso búsquedas a Bases  de Datos para extraer información.

El scanner era el componente fundamental para la captura de informacion.

El scanner era el componente fundamental para la captura de la imagen y de esta imágen capturar a mano o automáticamente su contenido.

Hoy, las imágenes no provienen únicamente de scanners sino de cualquier fuente que genere informacion para la organización, archivos pdf, archivos excel,  informacion capturada desde celulares, etcétera.

Archivos de diferentes fuentes

Todas eran tareas con mucho componente manual, visualmente se identificaba un documento y se categorizaba dentro de una clase documental en particular para luego extraer los datos relevantes, esto se hacía con cada uno de los documentos digitalizados.

Para lograr indexar (Data Entry), se requería de un batallón gigantesco de personas que con mayor o menor atención, digitaban lo observado lo que generaba un alto grado de inconsistencia dado el error humano durante la captura,  diligenciaban formularios para que finalmente se diera una categoría y unos datos a cada una de las clases documentales.

Las nuevas tecnologías que están revolucionando las ciencias de datos, tales como la inteligencia artificial, el aprendizaje de máquina, entre muchas otras han ayudado a que las plataformas de procesamiento inteligente de documentos , en inglés Intelligent Document Processing (IDP) se queden para apoyar los procesos de gestión documental tradicionales.

Un sistema de IDP, o procesamiento inteligente de documentos esta centrado en cuatro etapas muy bien diferenciadas que son:

  • Clasificación documental
  • Extracción de datos
  • Aplicación de reglas de negocios
  • Generación de archivos.
Procesamiento inteligente de documentos IDP

Clasificación documental

Aclaremos el concepto de clasificar documentos, un ejemplo típico puede ser la solicitud de crédito bancario, seguramente todos hemos aplicado a un crédito y hemos recopilado cientos de documentos, como cédula de ciudadanía, solicitud de crédito, certificación laboral, comprobantes de pago, declaraciones de renta, extractos bancarios entre otros, documentos completamente sin estructura u homogeneidad.

Cada documento es importante para el proceso, algunos son obligatorios y algunos son opcionales, pero cada uno de ellos contiene información necesaria para tomar la decisión de otorgar o no el crédito y cuál sería el monto del mismo.

El sistema de IDP tendrá que hacer muchas tareas antes de determinar que clase de documento es, el gran reto aquí, es lograr un proceso de reconocimiento óptico de caracteres (OCR Optical Character Recognition) que garantice una alta tasa de éxito.

Esta alta tasa de reconocimiento en el OCR se logra, primero obteniendo imagenes muy buenas para ello se debe seleccionar un muy buen scanner que utilice tecnologías de limpieza de imágenes y segundo utilizando un software que utilice los mejores motores de reconocimiento.

Gracias al scanner y al motor de OCR, se puede entonces determinar que clase de documentos tenemos, así que estamos listos para la siguiente etapa.

Extracción de datos

Ya con las imágenes clasificadas y con datos útiles extraídos por el OCR, podemos pasar a la siguiente etapa que se hace en combinación con la tercera etapa o reglas de negocio, pero para efectos pedagógicos los hemos separado en tareas diferentes.

No todos los datos son útiles, será el cliente final quien determine, cuales son relevantes, seguramente el nombre, número de cédula, fecha de expedición y lugar de nacimiento pueden ser útiles, pero en un certificado laboral, el salario y fecha de ingreso lo serán.

En ocasiones la información estará estructurada como en el caso de la cédula, sabemos exactamente dónde encontrarla, pero en una certificado laboral los datos pueden estar en cualquier lugar del documento es decir no estructurada y es allí donde se requiere un software que aprenda (Machine Learning ML) que evolucione día a día y sea capaz de localizar y entregar la información correcta, relacionada con ese documento en particular.

Reglas de negocio

Son aquellas validaciones particulares de cada cliente y que definen como proceder frente a circunstancias especial.

Regresemos al ejemplo de la solicitud de crédito, donde es importante contar con documentos obligatorios que deben anexarse, una regla de negocio podría ser rechazar cualquier solicitud que no venga acompañada de la fotocopia de la cédula, o que la solicitud de crédito debe tener la firma del cliente.

El proceso inteligente de documentos, identificara estas variables y desviara la solicitud a un estado de rechazo para que cuando se cumplan con los requerimientos de las reglas de negocio, se vuelva a procesar toda la solicitud.

Gran ahorro de tiempo y recursos automáticamente.

Vamos a un nuevo ejemplo, auditorias de cuentas médicas, una regla importante podría ser validar que una droga para tratar el cáncer no sea contabilizada en la atención de un accidente de tránsito, o verificar las cantidades utilizadas versus el total facturado.

Siempre, por ahora necesitaremos la presencia de humanos para tomar decisiones que el IDP no sea capaz de identificar o extraer correctamente. Serán en definitiva menos hombres procesando que en la versión original de procesamiento manual.

Generación de archivos

Finalmente el sistema debe generar archivos XML, archivos de texto que sean utiles para futuros procesos de manejo de información, y tambien la generacion de archivos de imagenes en formatos reconocibles como tiff , pdf buscable, o pdf/a muy valioso para proteger la informacion en el tiempo.

Beneficios de un sistema IDP

  • Alto valor e impacto en las organizaciones, por su precision , velocidad y precio.
  • Innovación con la utilización de tecnologías de punta para procesamiento de informacion|
  • Personalización de procesos
  • Aceleración en la producción

Donde es útil un IDP Intelligent Document Processing

Podríamos generalizar que en un futuro cualquier vertical se beneficiaran de un IDP sin embargo podemos decir quienes al día de hoy sacaran mejor provecho en un corto lapso de tiempo de las bondades de un IDP.

Telecomunicaciones: Para manejo de logs de errores y mantenimiento, contratos de usuarios

Servicios Financieros: Aplicaciones de hipotecas y prestamos, pólizas de seguros, aperturas de productos como cuentas de ahorro, cuentas corrientes, tarjetas de crédito.

Cadenas de suministros: Apertura de pedidos y seguimientos , facturación y pruebas de entrega.

Gobierno: Aplicaciones de inmigración, aplicaciones educativas, calificación de exámenes.

Salud: Tratamientos, auditorias de cuentas medicas, historias clínicas, seguimiento de pacientes y tratamientos.

Manufactura: ERPs, procesamiento de ordenes de compra y facturación.

Recursos Humanos: Registros de trabajadores, reclutamiento.

Créditos de imágenes

Imagen 1 Foto de negocio creado por drobotdean – www.freepik.es</a>

Write a comment