Change language

Change country

Pros y contras de automatización de documentos con Machine Learning

¿Cuáles son las aplicaciones prácticas del machine learning para el procesamiento de documentos?
Pros y contras de automatización de documentos con Machine Learning

Se habla mucho sobre inteligencia artificial y machine learning, y de cómo pueden proporcionar resultados superiores en cuanto a automatización del procesamiento de documentos. Muchos vendedores emplean términos como aprendizaje y formación para llamar la atención, pero, ¿cuáles son las aplicaciones prácticas y expectativas del machine learning para el procesamiento de documentos? ¿Es esta tecnología mejor que la que estás utilizando actualmente?

Veamos un ejemplo utilizando documentación relacionada con préstamos financieros para comparar dos aproximaciones: machine learning y automatización tradicional (algoritmos creados por el usuario).

Para la concesión de un crédito, independientemente del tipo de préstamo, van a ser necesarios muchos documentos para satisfacer los requisitos. Verificar que se cumplen los requisitos referentes a la documentación y que cada uno de los documentos contienen los datos necesarios son tareas que consumen mucho tiempo. Muchas empresas financieras luchan por hacer este proceso más confiable y eficiente.

Cloud computing y movilidad en la empresa

También te puede interesar

Cloud computing y movilidad en la empresa.

Automatización tradicional

La automatización tradicional comienza con una evaluación manual:

1. Un proyecto gestionado adecuadamente requiere un inventario de documentación para un prestamista dado y para cada tipo de préstamo.

2. A continuación, el personal recoge ejemplos de todos los tipos de documentos de diferentes fuentes.

3. Organizan cientos de estos documentos por tipo y los revisan para identificar características únicas para la identificación automática en un flujo de trabajo de aprobación de un préstamo típico.

4. Una vez que el personal identifica todas las características de los documentos, un analista las codifica como reglas dentro de un sistema de captura de documentos.

5. Las reglas deben ser probadas para descubrir cualquier clasificación errónea que requiera agregar nuevas reglas o afinar las ya existentes.

6. Después de completar las pruebas y ajustes, las reglas entran en  el flujo de trabajo de producción.

7. A continuación, es necesario crear un reglas que busquen los datos necesarios dentro de los documentos antes de que se puedan extraer y validar los datos.

8. Se lleva a cabo un proceso similar de análisis, pruebas y ajustes para asegurar que se extrae la máxima cantidad de datos y para comprender la precisión que rige cuando se necesita una revisión manual.

9. Debido a que muchos documentos no están estandarizados, se debe crear una amplia gama de reglas.

Algunas soluciones de la industria ofrecen la automatización de la configuración del procesamiento de documentos como un paso inicial o durante el proceso de preproducción y producción. El flujo de trabajo implica localizar muestras de un tipo de documento determinado e ir paso a paso con el software, a través de la ubicación de cada campo. Si la solución de algún proveedor incluye un tipo de documento preconstruido, por ejemplo una factura, muchas reglas para localizar campos o datos están predefinidas y el usuario solo identifica muestras donde no se encontraron datos.

La localización de estos campos entrena al sistema. Aunque no es machine learning, el sistema incorpora las coordenadas de estos campos y crea una nueva plantilla para el documento o agrega reglas generales de ubicación. El resultado es una mezcla de beneficios de un sistema experto más tradicional, junto con las exigencias obtenidas de la función de entrenamiento.

Los pros

  • La solución de problemas es sencilla. Las reglas son identificadas y calificadas por humanos. La comprensión de por qué el sistema proporciona cierta salida bajo diversas circunstancias es clara.
  • Muchas veces los documentos son altamente estandarizados o son formas estructuradas. La aplicación de reglas basadas en plantillas asegura que los errores relacionados con la ubicación de los datos se eliminan en su mayoría. La precisión global puede ser mucho mayor que la proporcionada por un sistema de machine learning que intenta generalizar la ubicación de los datos.

Los contras

  • Una desventaja de las reglas codificadas es el tiempo que se tarda en alcanzar un nivel aceptable de automatización. Desarrollar un rendimiento aceptable de datos semiestructurados como facturas lleva mucho tiempo.
  • Otra desventaja es la necesidad de un experto en la materia para calificar el sistema. La disponibilidad de expertos puede ser difícil de conseguir, inicialmente, cuando el sistema debe ser revisado debido a los cambios en los requisitos. 

 

Machine learning

Aquí es donde hay un área gris que se complica por el uso de varios proveedores acerca de los términos aprendizaje y formación. Examinemos el mismo conjunto de requisitos utilizando tecnologías de machine learning:

Para el descubrimiento inicial de documentos se puede usar una técnica llamado clustering para automatizar el agrupamiento lógico de documentos similares. Los documentos se pueden organizar automáticamente. Las aplicaciones pueden agruparse con otras aplicaciones. Las fotografías de licencias de conducir se agrupan con documentos de identificación, y así sucesivamente.

El resultado es un conjunto de documentos agrupados por similitud que luego pueden ser evaluados. Estos grupos forman la base de muestras de clases de documentos que se pone en el sistema, donde el software identifica automáticamente las características de cada uno y crea reglas.

La creación de reglas de extracción de datos es un enfoque similar. El requisito más importante es que la organización debe tener un mayor número de muestras, pero también tener datos reales, que son los resultados reales de lo que debería ser la extracción de datos.

Por ejemplo, un usuario suministra al sistema una muestra junto con los valores reales del campo que se deben extraer. De esta forma, se entrena automáticamente al software para localizar los datos coincidentes y derivar reglas de posición para cada campo de datos. Se debe hacer esto para cada muestra y luego, automáticamente, crear algoritmos basados en la ubicación exacta, cambios en la colocación de cada ejemplo y posición relativa a otros datos.

Los pros

  • La creación de reglas es simple ya que el usuario no codifica las reglas.
  • Además, los ajustes pueden ser manejados mediante la adición de muestras de los nuevos documentos junto con los datos asociados a la realidad.
  • Los expertos y personas técnicas para codificar el sistema son menos necesarios.

Los contras

  • Los inconvenientes de este tipo de enfoque son imágenes espejo del enfoque del sistema experto.
  • Solucionar problemas de salida incorrecta es un reto y requiere agregar nuevas muestras y revisar los resultados para ver si han mejorado.
  • Tener un sistema de aprendizaje para desarrollar sus propias reglas de ubicación de campos podría tener más errores que simplemente proporcionar coordenadas especialmente para formularios estructurados.

En última instancia, las ventajas y desventajas de ambos enfoques deben tenerse muy en cuenta antes de implementar un sistema de captura. Saber cómo funcionan estos enfoques ofrece la posibilidad de seleccionar el mejor con base en las necesidades específicas que se tengan en cada momento. 

Cloud computing y movilidad en la empresa

También te puede interesar

Cloud computing y movilidad en la empresa.

Artículos relacionados:

  • Soluciones Integrales: tecnología y procesos

    Cada vez se valoran más las soluciones integrales que aúnan la tecnología y los procesos de negocio.

  • Optimización de procesos: Técnicas y herramientas

    Descubre como la optimización de procesos permite a la empresa ser más eficiente y eficaz.

  • ¿Qué es la firma digital y qué ventajas tiene?

    La firma digital y electrónica de documentos es altamente recomendable para implementar en las empre

Las cookies y su privacidad.

Usamos cookies esenciales para asegurar el correcto funcionamiento de nuestro sitio web. Las cookies estadísticas nos ayudan a entender mejor cómo se utiliza nuestra página, mientras que las cookies de marketing nos permiten personalizar el contenido para nuestros visitantes. Puedes elegir tus preferencias de cookies usando el botón de "Preferencias" a continuación, o seleccionar "Aceptar todas las cookies" para continuar con todas ellas. Al hacer clic en "Aceptar todas las cookies", aceptas el almacenamiento de estas cookies en tu dispositivo. Si prefieres rechazar las cookies no esenciales, selecciona "Aceptar solo las cookies esenciales", lo que permitirá únicamente las necesarias para el correcto funcionamiento de nuestro sitio web.

Preferencias de cookies

campo obligatorio

Utilizamos cookies para asegurarnos de que nuestro sitio web funciona correctamente o, ocasionalmente, para proporcionar un servicio a su solicitud (como la gestión de sus preferencias de cookies). Estas cookies están siempre activas a menos que configure su navegador para bloquearlas, lo que puede provocar que algunas partes del sitio web no funcionen correctamente.

campo obligatorio

Las cookies estadísticas nos ayudan a entender mejor cómo se utiliza nuestra página.

campo obligatorio

Las cookies de marketing nos permiten personalizar el contenido para nuestros visitantes.