16 mayo 2023

Compartir en:

De la inteligencia artificial (IA) hemos escuchado desde hace décadas, primero por la ciencia ficción, luego —quizás— por algunas aplicaciones empresariales, pero ChatGPT ha logrado, sobre todo para los usuarios finales, mostrar el poder de esta tecnología. 

El chatbot impulsado con inteligencia artificial de OpenAI ha demostrado que puede responder preguntas como cualquier buscador e ir más allá: traducir textos, hacer trabajos académicos, redactar correos o escribir código —incluso malicioso—. 

Sus múltiples funcionalidades, apenas probadas por miles de usuarios desde hace medio año, han causado furor entre los fanáticos de la tecnología, pero también miedo por el posible reemplazo de los humanos en actividades laborales. 

Sobre esos temores, el futurista Nikola Danaylov ha dicho en una entrevista reciente que son justificados, pero que dependerá de cómo se afronte esta nueva tecnología el papel que tome en nuestras vidas: ya sea como aliada o como amenaza. 

La ciencia de los datos no se ha quedado fuera de esta ola. Los investigadores Hossein Hassani y Emmanuel Sirmal Silva han explorado en su artículo The Role of ChatGPT in Data Science: How AI-Assisted Conversational Interfaces Are Revolutionizing the Field las oportunidades y desafíos asociados al chatbot que califican como “tecnología prometedora”.  

Y coinciden con Danaylov: “Dependerá de la raza humana, determinar cómo se usa ChatGPT para el beneficio de la sociedad en general: crear un mundo donde la IA se utilice para aumentar la inteligencia en lugar de reemplazar la inteligencia humana”. 

ChatGPT ya se usa en la ciencia de datos 

Si bien hay preocupación por el sesgo o el plagio que implica usar ChatGPT para la ciencia de los datos, también es cierto que permite automatizar varios aspectos del flujo de trabajo, como la limpieza y el preprocesamiento, el modelo de formación e interpretación de resultados. 

En su artículo, Hassani y Silva enumeran al menos cinco ejemplos o casos de estudio que ilustran cómo se ha utilizado la herramienta de OpenAI, no solo para automatizar procesos, sino también para analizar datos no estructurados. 

Por ejemplo, la traducción de idiomas. Los investigadores de Google —explican— lo utilizaron para desarrollar un sistema de traducción automática del inglés al francés y se descubrió que el sistema logra un rendimiento de vanguardia en varios conjuntos de datos de referencia. 

Otro caso: el aumento de datos. ChatGPT también se ha utilizado para el proceso de generar nuevas muestras de datos a partir de datos existentes para mejorar el rendimiento de modelos de aprendizaje automático.  

Mencionan que investigadores de la Universidad de California, San Diego (Estados Unidos), generaron informes de radiología sintética, que luego se usaron para aumentar los datos de entrenamiento para un modelo de aprendizaje automático para la clasificación de informes de radiología. 

Su impacto en los datos sintéticos  

Una de las principales ventajas de utilizar datos sintéticos es que evita la escasez de datos, que es un problema común en muchas aplicaciones de aprendizaje automático. 

Generar datos sintéticos mediante ChatGPT implica entrenar el modelo de lenguaje en un gran corpus de datos de texto y luego usarlo para generar nuevos datos sintéticos basados en patrones y estructuras que ha aprendido de los datos de entrenamiento.  

Esto se puede hacer al proporcionar un mensaje o un texto inicial para el modelo, que luego usa para generar un nuevo texto que es similar en estilo y contenido a los datos originales. 

Con respecto a otras herramientas, Hassani y Silva ven en ChatGPT una herramienta versátil que puede ser adaptada a una variedad de casos. Su desempeño es competitivo contra otros modelos de lenguaje de última generación.  

Sin embargo, afirman que una de sus limitantes es su dependencia a grandes cantidades de datos de entrenamiento.  

“Si bien el modelo se puede ajustar en conjuntos de datos más pequeños, su rendimiento puede ser limitado en comparación con otros modelos que están diseñados específicamente para configuraciones de bajos recursos, como ALBERT de Google”, apuntan. 

Más cerca de los científicos de datos unicornio 

ChatGPT, según los investigadores, permitirá acercarnos más al concepto de los “científicos de datos unicornio” —que ellos mismos introdujeron en un artículo anterior—, referido a “una raza rara, criaturas casi míticas, que son expertas en múltiples especialidades, desde matemáticas hasta informática e inteligencia artificial”. 

Aseguran que el chatbot de OpenAI tiene el potencial de revolucionar la ciencia de los datos, al hacerla más accesible, eficiente y efectiva a través de su influencia en el análisis de datos, el modelado predictivo y la traducción de idiomas. 

Algunos de las ventajas que ChatGPT traerá a este campo, son: 

  1. Automatización: Varios aspectos del flujo de trabajo como la limpieza de datos o la interpretación podrán hacerse de forma automatizada. 
  1. Análisis de datos no estructurados: Se ha visto el potencial que tiene para analizar retroalimentación del cliente, datos de redes sociales y revisiones en línea para encontrar hallazgos y mejorar la toma de decisiones. 
  1. Enfoque en tareas complejas: Al automatizar procesos como el análisis de datos y el procesamiento del lenguaje natural, los científicos de datos pueden concentrarse en otras actividades como el desarrollo de modelos de predicción más precisos y mejorar la visualización de datos. 
  1. Datos sintéticos 
  1. Menos especialización: Ya no se necesita una educación extensa en matemáticas, ciencias de la computación o IA para generar un código o programa que pueda usarse. 

Ni ChatGPT es perfecto 

Aún con dichas ventajas, Hassani y Silva son muy claros al señalar que, como todo modelo de lenguaje, no siempre están correctos y cometen errores.  

Advierten que la precisión y confiabilidad de las respuestas de ChatGPT depende de varios factores, tales como la calidad y diversidad de los datos de entrenamiento, la complejidad y ambigüedad de los textos de entrada y la tarea o pregunta específica que se hace. 

Según los autores, la herramienta de OpenAI presenta problemas en la precisión de sus respuestas en cuatro situaciones: preguntas ambiguas o poco claras, peticiones fuera de su dominio, datos de entrenamiento sesgados o inexactos y lenguaje complejo o técnico.  

“ChatGPT es una herramienta diseñada para ayudar a los humanos a generar respuestas a diversas tareas, pero no debe confiarse en ella como la única fuente de información o toma de decisiones”, señalan. 

Y subrayan que “la supervisión humana y el pensamiento crítico son esenciales para garantizar la exactitud e integridad de la información que genere”. 

Hassani y Silva apuntan que el chatbot ChatGPT  ayudará a frenar la falta de especialistas en el campo dada su capacidad para formar personas no especializadas en codificar y programar soluciones a problemas analíticos. 

Sin embargo, apuntan que los científicos de datos deberán diferenciarse y centrarse en cómo pueden aumentar sus habilidades con esta herramienta para seguir siendo competitivos en el mercado de trabajo. 

¿Ya usas ChatGPT para tus procesos de negocio? En nuestra empresa BDS acompañamos a nuestros clientes a habilitar y perfeccionar capacidades de inteligencia artificial que les permitan obtener resultados medibles de negocio en el menor tiempo posible. 

Compartir en:

Si quieres saber más sobre la aplicación de IBM Watson y el cómputo cognitivo en empresas, suscríbete a mi blog y mantente informado.

Comentarios