En el capítulo anterior hablamos de la importancia de utilizar synthetic data para nutrir las bases de datos de una organización, con lo cual se evitan problemas ligados a la violación de la privacidad de las personas y la falta de información de valor para realizar pruebas de un producto o servicio. Ahora bien, ¿cuáles son los retos que los datos sintéticos deben superar para que su uso y sus beneficios se extiendan en el mundo de los negocios?
Dado que son generados por algoritmos de machine learning, los datos sintéticos necesitan contextualizarse y evaluarse en situaciones de la vida diaria. Para ello, es importante que antes de usarlos en tu empresa consideres lo siguiente:
Como puede apreciarse, synthetic data enfrenta retos vinculados a la representación de los datos: ¿puede la automatización ser tan humana como artificial? Para que pueda conseguirlo hace falta recordar que la información creada tiene que contribuir a mejorar algún aspecto de la vida de las personas.
Synthetic data satisface necesidades de información complicada de obtener, sin que suponga un posible riesgo para la integridad de una o varias personas.
Entre los principales beneficios de los datos sintéticos destacan:
En términos de costo-beneficio los datos sintéticos tienen un mejor ROI a mediano y largo plazo, especialmente si se implementan de manera adecuada y en situaciones en las que marquen una ventaja competitiva.
Los datos sintéticos empezaron a utilizarse en los años 90, aunque la abundancia de potencia de cálculo y espacio de almacenamiento de la última década ha permitido su aplicación en industrias distintas a la tecnológica.
Para adentrarse de manera segura en el uso de synthetic data es necesario contar con herramientas de machine learning; por ejemplo, en una estrategia omnicanal que tenga como objetivo crear experiencias personalizadas.
A propósito, un estudio del MIT puso a prueba el funcionamiento de modelos de machine learning a partir de datos sintéticos vs datos reales. Los científicos se dividieron en dos grupos, y el 70% de las veces el grupo que usó synthetic data fue capaz de igualar e incluso superar la eficacia del grupo contrario.
Esto permite apuntar que, si bien el uso de datos sintéticos es eficaz, necesita del criterio humano para saber en qué escenarios convienen utilizarse, algunos de los cuales se mencionan a continuación:
¿Consideras que vale la pena afrontar los retos de synthetic data de acuerdo con los beneficios que ofrece? ¿En qué productos o servicios que ya tienes o quieres crear te ayudaría realizar pruebas con datos sintéticos?
Comenta en el espacio de abajo y suscríbete a mi blog para conocer más de cómputo cognitivo para empresas, además de otros temas de innovación y tecnología científica aplicada a los negocios.
Si quieres saber más sobre la aplicación de IBM Watson y el cómputo cognitivo en empresas, suscríbete a mi blog y mantente informado.