El Big Data está de moda

0
0

De golpe y porrazo, en los medios y en las charlas informales, apreció el Big Data como concepto de moda. Y como suele suceder con las cosas que se ponen de moda, son más los mitos que se esgrimen que los argumentos técnicos adecuados para comprender de qué se trata. Encontré notas alarmistas y laudatorias y así en ese vaivén nos debatimos. Pongamos en claro algunas cosas para saber de qué estamos hablando y así distinguir los temores fundados de los infundados, así como las esperanzas plausibles de las vanas.

En principio, ¿de qué hablamos cuando hablamos de Big Data?. Big Data sería un corpus masivo de información, generado por las nuevas tecnologías (pc, celulares, etc.), en donde no es posible aplicar las técnicas clásicas de búsqueda, ya que debido a su tamaño, los algoritmos tradicionales no terminarían nunca de encontrar lo que buscan. Esta información es tanto generada por seres humanos como robots (o dispositivos, piezas de software, etc.). Muchas veces se asume que esta enorme cantidad de información posee un perfil social, aunque no necesariamente sea éste siempre el caso.

Dada la naturaleza gigantesca de esta información, no existe una sola técnica que pueda dar cuenta de todo ello. Incluso se habla de Minería de Datos o Minería de Textos, que son a su vez, un conjunto enorme de instrumentos y algoritmos diversos para procesar y analizar esa data. Pero no son las únicas formas que existen, hay todo un dominio de conocimiento vinculado con las estructuras necesarias para poder organizar toda esa información. En concreto, en el mundo de las bases de datos, hubo una revolución que comenzó a fines del siglo XX. Fue cuando Internet explotó y se hizo claramente necesario modificar y crear nuevas arquitecturas que pudieran soportar tamaña catarata de bytes.

Resumiendo, en el área del Big Data hay al menos tres grandes áreas. La primera vinculada con la generación de esa información (robots y personas); la segunda vinculada con el almacenamiento de toda esa colección de datos; la tercera vinculada con la búsqueda coherente y consistente de información significativa en esa “selva de símbolos” (parafraseando a Victor Turner).

Por otra parte, en esta moda del Big Data, se habló mucho de la influencia que tuvieron las redes en las elecciones presidenciales, tanto en Estados Unidos, como en la propia Argentina. Pareciera que se encontraron técnicas que permiten manipular la voluntad humana, hasta el punto de hacerlos votar por algo que, se intuye, no los convence del todo. Es cierto que el marketing político cambió como consecuencia de las nuevas tecnologías y particularmente del uso de Internet. Es cierto también que hace ya muchos años, las empresas utilizan algoritmos que, en función de las búsquedas de un usuario, ofrecen nuevas posibilidades, no demasiado sofisticadas, pero sí con grado cierto de efectividad. Esto es lo que ocurre cuando, por ejemplo, uno busca en Google “pelotas de fútbol” y luego vaya a la página que vaya, aparecen publicidades sobre balones por doquier. La forma de eliminar esa molestia es simplemente eliminando el historial del navegador (cosa que por cierto, muy poca gente hace).

Lo que hicieron algunas consultoras de marketing político fue tomar ciertos datos de las redes sociales sobre las personas y en función de ese perfil, mostrar a sus candidatos como más cercanos a esas posturas. Por ejemplo, si alguien estaba a favor de la legalización del aborto, inferido a partir de lo que se publica, entonces las publicidades que recibía de los candidatos eran sobre aquellas propuestas vinculadas con la educación sexual.

Es verdad que para llegar a definir el perfil particular al cual le enviarán la información acorde, se pueden y de hecho se usan algoritmos vinculados con aquello que genéricamente se denomina Big Data. Pero eso no implica que estamos ante la presencia de un nuevo monstruo, un Minotauro en un laberinto que está dispuesto a matarnos pero no a morir.

Párrafo aparte para los ejércitos de trolls. Estas técnicas implican simplemente que un usuario maneja N cantidad de cuentas y en donde el mismo mensaje se dispersa a partir de ese número de cuentas. Es fácil detectarlos, usualmente poseen un perfil ambiguo (no hay fotos o datos personales), suelen hacer posts en horarios laborales y en general sus comentarios suelen carecer de profundidad, prefiriendo la falacia ad hominem. Aunque claro, como en todo ejército hay diferentes jerarquías. Y esto se observa cuando las papas queman y aparecen argumentos un poco más profundos que los habituales. Claramente son los coroneles virtuales los que aquí postean, sin descuidar a la masa de soldados, que son los que forman el número.

En definitiva y ya se planteaba en las teorías clásicas de los medios de comunicación de masas, no hay una aceptación pasiva de la información recibida, existe, en los seres humanos, siempre una resignificación. En este caso eso podría implicar una reafirmación tanto como un rechazo de lo que se postula. Echar la culpa a las redes de la derrota en una elección es practicar un reduccionismo que hoy por hoy es inaceptable desde las teorías sociales.