La base de datos negativa o Negative Database (NDB) se refiere al cúmulo de información que contiene datos simulados y auténticos, de este modo, cuando alguien intenta violar la seguridad y acceder a las bases de una organización, recupera tanto los datos reales como los fabricados.
Fernando Esponda Darlington, jefe del Departamento Académico de Computación y director de la Licenciatura en Ciencia de Datos del ITAM, es el autor de esta aportación que promete solucionar problemas para compartir información.
De acuerdo con el diario The Economist, Esponda dirigió a varios informáticos de la universidad de Yale para explorar la idea de crear una base de datos negativa, esta alternativa para la seguridad informática quedó plasmada en la investigación Protecting Data Privacy through Hard-to-Reverse Negative Databases, la cual fue presentada en la Conferencia de Seguridad de la Información del 2006.
La idea de las bases de datos negativas ha sido explorada ampliamente por Esponda y diversos equipos de investigadores, los grandes volúmenes de datos que se manejan hoy en día en cualquier industria representan nuevos desafíos sobre cómo deben ser utilizados, pero sobre todo cómo son representados, ya que esto tiene un impacto directo sobre su uso. Por ello, las NDB sirven tanto para la encriptación de datos como para la restricción de las consultas (controlar el acceso a los datos para protegerlos de ataques internos).
Por otro lado, las bases de datos negativas también son útiles para un tema que ya hemos abordado con anterioridad en el blog: el intercambio de datos. Compartir información interna con terceros con el objetivo de crear nuevas cadenas de valor, productos o servicios es una idea sumamente atractiva para todas las industrias, pero lo que detiene esta acción es que la privacidad y el anonimato están en riesgo.
Por ejemplo, dos ecommerce pueden estudiar el comportamiento de compra de los consumidores y determinar cuáles son las posibles transacciones que tienen en común, sin revelar en su totalidad la información que contienen sus respectivas bases de datos.
Por naturaleza, las bases de datos son sumamente amplias, así que añadir datos simulados a los ya existentes puede sonar poco viable; no obstante, una de las ventajas de las bases de datos negativas es que puede comprimirse usando un esquema comodín. Además, las consultas también pueden estar protegidas.
A la fecha, existen tres algoritmos básicos para crear una NDB:
Aunque un banco de información no puede descifrarse con facilidad y cuenta con sistemas de protección, puede ser usado para determinar en forma eficiente la presencia o ausencia de
cadenas específicas. Al integrar una base de datos negativa, gracias a los registros simulados, la única manera de saber si una cadena pertenece o no a la base de datos es revisando toda la NDB.
De este modo, si se rompe la seguridad y alguien roba la base de datos, esto le servirá de muy poco, ya que para acceder a cualquier registro verídico tendrá que consultar toda la base de datos negativa.
¿Y cuáles son los beneficios concretos de esta modalidad de ciberseguridad? Por ejemplo, las instituciones financieras pueden verse beneficiadas de contar con NDBs para resguardar los datos personales de los cuentahabientes. Por otro lado, los ecommerce pueden utilizarlas para proteger los datos de pago de los usuarios.
Como puedes ver, las bases de datos negativas son un método innovador para preservar la seguridad en la información que manejan las organizaciones; además, se presenta como una gran alternativa para poder compartir datos con otras empresas sin comprometer toda la base.
Si quieres saber más sobre la analítica avanzada para empresas, suscríbete a mi blog y mantente informado.
Si quieres saber más sobre la aplicación de IBM Watson y el cómputo cognitivo en empresas, suscríbete a mi blog y mantente informado.