25 junio 2020

Compartir en:

Las aplicaciones de inteligencia artificial, en específico las de machine learning, basan su funcionamiento en los datos que tienen a su disposición, a través de ellos aprenden y optimizan su funcionamiento de forma automática, no obstante, los algoritmos pueden “malinterpretar” la información o fallar por no contar con los suficientes datos relevantes.

En el Technology Quarterly del 13 de junio The Economist, se aborda este tema dando varios ejemplos de grandes compañías globales que no cuentan con los datos necesarios para programar los sistemas de IA de forma correcta, incluso en algunos casos esta falta de información ha resultado contraproducente para la automatización.

Pero, si la empresa de investigación IDC estima que en 2018 en todo el mundo se generaron 33 zettabytes de datos y que en 2025 serán 175 zettabytes… ¿por qué a los sistemas de IA les hace falta información?

No siempre se puede confiar en el Big Data

En la opinión de Cognilytica, una consultora enfocada en IA que entrevistó The Economist, los datos son el talón de Aquiles para estos sistemas, ya que pueden estar encriptados por los competidores, no existir en absoluto o, si se cuenta con ellos, existe la posibilidad de que no sean adecuados para alimentar los algoritmos.

Un ejemplo muy tangible sobre la inexistencia de los datos se ha suscitado con la actual pandemia del COVID-19 pues, aunque estos sistemas existen y los científicos han tratado de apoyarse en ellos para hallar una solución, no hay una base de datos integral para nutrir la IA; además, la información que se conoce sobre el virus cambia rápidamente y no da tiempo para que los algoritmos ejecuten su aprendizaje automático.

La publicación cita dos ejemplos donde la IA puede estar sesgada porque, aunque cuente con datos, la automatización no siempre es confiable o toma las mejores elecciones:

  1. El primer caso que menciona es que el Instituto Nacional de Estándares y Tecnología de Estados Unidos probó cerca de 200 algoritmos de reconocimiento facial y descubrió que muchos eran significativamente menos precisos para identificar rostros afroamericanos, esto debido a que en sus datos de entrenamiento se preponderaron las caras de personas blancas.
  2. En 2017, cuando Amazon realizaba un proceso de reclutamiento por IA con un sistema diseñado para analizar CVs, lo abandonó al descubrir que el algoritmo favorecía a los candidatos masculinos, ya que había sido entrenado con los currículums de solicitantes exitosos anteriores, los cuales eran principalmente hombres.

Creación de datos propios para los sistemas de IA

Cuando los datos reales presentan este tipo de brechas, una solución que se propone en el artículo es “inventar” datos propios. Aunque en primera instancia esto puede sonar poco ético, este tipo de información se utiliza en pro de una mejor experiencia del usuario.

Un ejemplo que aborda The Economist a lo largo del escrito es el de Amazon Go, las nuevas tiendas del gigante del eCommerce donde las personas entran al establecimiento por medio de una aplicación y salen si pasar por un cajero, el cobro de los productos se hace por medio de la misma app.

Para que esto fuera posible se utilizaron sensores y cámaras conectadas a un sistema de IA que rastrea los productos que se toman de los estantes, cuando los compradores salen se calcula la factura y se les cobra automáticamente.

En este video podrás conocer más sobre Amazon y el manejo de datos


Para desarrollar este nuevo sistema de compras Amazon enfrentó varios retos, por ejemplo, el sistema debía reconocer tanto a clientes individuales como a grupos familiares (como cuando un niño pone un producto en el carrito de compras, y el cobro debe hacerse a sus padres), y este proceso debe suceder en tiempo real y con un alto grado de precisión.

Para tareas estandarizadas algunos datos podrían ser generados por el propio personal de Amazon, a quienes se les permitió ingresar a las versiones de prueba de las tiendas; sin embargo, existen muchas formas en las que una persona puede tomar un producto de un estante y luego comprarlo, regresarlo de inmediato o devolverlo más tarde. Para trabajar en el mundo real, el sistema tendría que cubrir todas las posibilidades.

Por ello, decidieron generar sus propios datos, Amazon recurrió a un software de gráficos para crear compradores virtuales, los cuales fueron utilizados para entrenar al sistema de IA en muchas situaciones difíciles o inusuales que no habían surgido en los datos de entrenamiento reales. Actualmente la empresa cuenta con 26 tiendas Amazon Go y ha ofrecido licenciar la tecnología a otros retailers.

Lo que podemos concluir de este interesante artículo The Economist, y relacionándolo a los temas que hemos tocado en este blog, es que las implementaciones de inteligencia artificial para empresas no son exitosas por sí solas, antes cada compañía debe fijar objetivos claros y analizar si los datos le pueden aportar o no ventajas competitivas.

Suscríbete a mi blog y no te pierdas los próximos artículos con más insights del Technology Quarterly de The Economist acerca de las limitantes de la Inteligencia Artificial.

Compartir en:

Si quieres saber más sobre la aplicación de IBM Watson y el cómputo cognitivo en empresas, suscríbete a mi blog y mantente informado.

Comentarios