En la última década se ha observado una detonación en la cantidad de datos digitales a la disposición y en las tecnologías informáticas usadas para procesarlos. El ‘big data’, como se la conoce, sin duda aportará significativos avances científicos, tecnológicos y médicos, y podría mejorar relevantemente la formulación de políticas gubernamentales; pero también plantea serios riesgos si se abusa de él o se lo utiliza de manera inadecuada.
Poseer más datos no es un suplente de tener datos de alta calidad. Por ejemplo, aunque uno puede encontrar innumerables opiniones políticas en las redes sociales, estas no representan de manera fiable a los votantes. De hecho, una parte sustancial de los tuits y mensajes de Facebook sobre política son generados por computadores.
Los programas automatizados establecidos en base de conjuntos de datos han causado numerosos escándalos. Hace poco tiempo, un estudiante buscó imágenes de Google sobre “peinados de aspecto no profesional para ir a trabajar”. Los resultados mostraron, en su mayoría, imágenes de personas de raza negra. Cuando el estudiante quitó el ‘no’ antes de ‘profesional’, Google arrojó principalmente imágenes de personas blancas. Esto no fue resultado de un sesgo de los programadores de Google, sino un reflejo del modo en que la gente etiqueta imágenes en internet.
Otro peligro que se observa del ‘big data’ es que se lo puede engañar. Cuando la gente sabe qué conjunto de datos se utiliza para tomar decisiones importantes, puede inclinar la balanza a su favor.
Ni siquiera el motor de búsqueda de Google es inmune a estos peligros. Estar alimentado por una inmensa cantidad de datos y supervisado por varios de los principales científicos de datos del mundo, sus resultados son susceptibles de manipulación por medio de técnicas como el Google ‘bombing’ o el ‘spamdexing’, entre otros métodos.
Un tercer peligro es la violación de la privacidad. En los últimos años se han robado grandes conjuntos de datos confidenciales de sitios empresariales y gubernamentales, y los investigadores han demostrado cómo las opiniones políticas o, incluso, las preferencias sexuales de las personas se pueden recoger con precisión en publicaciones en línea.
Por último, el big data plantea un reto para la rendición de cuentas. Si alguien siente que ha sido tratado injustamente por la decisión de un algoritmo, a menudo no tiene forma de apelar, ya sea porque los resultados no se pueden interpelar o porque las personas que los han creado se niegan a proporcionar detalles sobre cómo funcionan.
Para mayor información http://www.eltiempo.com/tecnosfera/novedades-tecnologia/cuales-son-los-peligros-del-big-data-102660