21 septiembre 2021

Compartir en:

Cada vez más empresas utilizan las ventajas del CRM Analytics para detectar clientes y definir sus objetivos y estrategias de negocio. No obstante, la integración de los datos externos e internos resulta complicada, especialmente al momento de homologar información de manera rápida y eficiente. A propósito, ¿cómo puede una herramienta como fuzzy matching ayudarte a identificar clientes únicos y por lo tanto mejorar su experiencia de usuario?

Ya sea un nombre mal escrito en una cafetería o dos personas que comparten números de teléfono con un solo dígito de diferencia, para cualquier empresa está latente la posibilidad de que surjan errores o duplicaciones en sus bases de datos.

¿Qué beneficios otorga fuzzy matching a las empresas?

De acuerdo con Data Ladder, el 94% de las empresas admiten tener datos duplicados, que en su mayoría no son coincidencias exactas, lo cual es un problema al momento de establecer una comunicación efectiva con clientes y proveedores.

En ese sentido, el machine learning de este tipo de software ayuda a las empresas a:

  • Realizar conexiones de datos automáticas
  • Vincular registros con la persona, objeto o entidad que le corresponde
  • Crear una fuente única de datos correctos
  • Integrar datos provenientes de múltiples áreas internas y externas
  • Garantizar la precisión de la información
  • Minimizar los recursos dedicados a las revisiones manuales
  • Detectar fraudes o errores que puedan acarrear multas o problemas monetarios

¿Qué retos aborda fuzzy matching?

Una encuesta realizada por la compañía Gartner señala que “la mala calidad de los datos es una de las principales razones por las que el 40% de las iniciativas empresariales no consiguen sus objetivos”. Por ende, para un correcto funcionamiento del fuzzy matching se requiere contar con datos más limpios, completos y perfilados.

Otra dificultad que enfrenta esta tecnología es la capacidad para escalar bases de datos que tienen millones de entradas, más aún si son dispares entre sí y si las fuentes de donde provienen usan distintos códigos.

También, este tipo de analítica avanzada para empresas puede requerir considerables pruebas para su validación: las reglas definidas en los algoritmos deben ser constantemente probadas para asegurar que el sistema es capaz de abstraer coincidencias con alta precisión.

Dado que el ser humano no siempre actúa en automático ni tiene certeza total de cada uno de sus actos y pensamientos, la información que produce puede llegar a ser difusa. De ahí la importancia de contar con una herramienta que analice los errores y vacíos en los datos y los convierta en una ventaja competitiva.

¿Qué es fuzzy matching?

También conocido como concordancia de cadena aproximada, fuzzy matching es una técnica analítica que, dentro de una misma base de datos, ayuda a identificar la probabilidad de que dos registros se refieran a un mismo término o concepto, y por error humano no se hayan registrado exactamente igual.

Un sistema eficiente de fuzzy matching puede identificar:

  • Acrónimos
  • Diferentes grafías de un nombre o sustantivo propio
  • Variaciones de un mismo concepto
  • Errores ortográficos deliberados o no
  • Abreviaturas
  • Inserción o supresión de signos, espacios o caracteres especiales

Mediante esta tecnología las empresas pueden saber si dos datos son una verdadera coincidencia en función de los distintos identificadores con los que fueron añadidos al sistema.

Asimismo, hay que tener cuidado con los identificadores o parámetros que se establezcan previo al análisis, porque si son estrechos no se encontrarán todos los errores, pero si son muy amplios existe la posibilidad de que aparezcan falsos positivos.

En este caso, un falso positivo es un par de datos que el algoritmo de fuzzy matching detecta pero que, tras una revisión manual, se descubre que no corresponden al mismo término.

<< Multiverso en la ciencia de datos >>

¿Cómo ayuda la inteligencia artificial al fuzzy matching?

La Inteligencia Artificial (IA), mediante los algoritmos de machine learning, concede a las empresas la capacidad de saber qué campos de datos similares combinar, así como las características que deben tener esos campos para encontrar coincidencias.

La IA puede entrenar algoritmos para que analicen el historial de las puntuaciones de fuzzy matching, y de ese modo identificar qué registros tienen más probabilidades de ser duplicados y cuáles no.

Una vez entrenado, el sistema de fuzzy matching predecirá si un par de registros de clientes son realmente duplicados o no. En general, los datos de clientes duplicados suelen darse en el nombre, la dirección, la fecha de nacimiento, el número de teléfono, la dirección de correo electrónico y el sexo.

¿Cómo implementar fuzzy matching?

La ejecución de este software de limpieza, diseñado para resolver problemas en la calidad de la información, es un proceso que comprende los siguientes pasos:

  • Importación de datos
  • Perfilado de datos
  • Limpieza y estandarización de datos
  • Configuración de coincidencias
  • Definiciones de coincidencia
  • Resultados de las coincidencias

<< Analítica avanzada para retail >>

Los principales proveedores de fuzzy matching incluyen la asesoría y el acompañamiento de un perfilador de datos que colabora para determinar los valores que faltan, la falta de estandarización o cualquier otra discrepancia en los datos.

Así, tras la implementación de este proceso es posible determinar qué reglas conviene aplicar para limpiar y estandarizar los datos del negocio de una manera eficiente, además de reconocer qué aspectos hay que mejorar en la recopilación de la información.

Si quieres limpiar, actualizar y enriquecer los datos de tu empresa en tiempo real,

prueba esto que en BDS tenemos para ti

¿En tu empresa tienen las bases de datos ordenadas? ¿Qué tan importante es para tu operación contar con información fidedigna, precisa y no duplicada? ¿Cómo mejoraría un software de fuzzy matching los procesos productivos de tu empresa?

Comenta en el espacio de abajo y suscríbete a mi blog para conocer más de machine learning para empresas, además de otros temas de innovación y tecnología científica aplicada a los negocios.

Compartir en:

Si quieres saber más sobre la aplicación de IBM Watson y el cómputo cognitivo en empresas, suscríbete a mi blog y mantente informado.

Comentarios