Home / algoritmo / Big Data, Algoritmos y Tecnología

Big Data, Algoritmos y Tecnología

¿Te imaginas que una máquina pudiera descubrir a quién votarás las próximas elecciones? ¿O que un software pudiera prever el descontento de un usuario con el servicio que le ofrecemos antes de que se produzca?
No, no estamos hablando de ciencia ficción. Esas son algunas de las revelaciones que podemos realizar gracias a la combinación de algoritmos con el Big Data.

 

Recientemente se han publicado un par de noticias muy interesantes: la creación de un algoritmo que determina si estás ebrio mientras tuiteas y un estudio sobre la capacidad de Twitter para revelar tu sueldo. Por supuesto no son los dos únicos ejemplos de aplicación de algoritmos al Big Data, pero sí son claramente un ejemplo de lo que podemos hacer con la información existente en la Red.

 

¿Qué entendemos por Social Big Data?

 

Podríamos definir el Social Big Data como un conjunto de herramientas capaces de extraer información publicada en Internet y procesarlas con intención de segmentar, predecir acciones o conocer comportamientos de los usuarios gracias a los patrones reflejados en la información publicada.

 

Entiéndase Internet como todas aquellas acciones públicas que llevamos a cabo en redes sociales o Google mediante nuestros dispositivos. Los likes, comentarios, clics a un enlace, búsquedas,… dejan un registro analizable. Esos datos nos indican patrones de conducta y variables que nos ayudan a dibujar una previsión del comportamiento humano.

 

¿Qué es un algoritmo?

 

Seguro que habrás oído hablar del algoritmo de Google, Facebook o Instagram. Sin embargo, muchos todavía no tienen muy claro de qué se trata.

Podríamos definirlo como una secuencia de operaciones, que representan un modelo de solución para determinado problema. O como un conjunto de instrucciones que realizadas en determinado orden conducen a la solución de un problema. En definitiva: se trata de un conjunto ordenado y determinado de pasos que nos permite solucionar un problema.

 

Los algoritmos pueden clasificarse en computacional, no computacional, cualitativo y cuantitativo. Su creación puede tener distintos niveles de complejidad. En algunos casos se precisa capturar la información, normalizarla, enriquecerla, transformarla, combinarla, crear nuevas variables y finalmente crear el nuevo algoritmo, procesarlo y analizar  que el resultado resuelva realmente él problema.

 

¿Cómo podríamos detectar a un tuitero ebrio?

 

Para entender un poco mejor la aplicación de lo aquí expuesto tomaremos el ejemplo del algoritmo que determina si estás ebrio mientras tuiteas.

Lo primero es poder contar con variables que nos permitan predecir el comportamiento. Algunas de ellas, según el post en Datasciencecentral.com de Laetitia Van Cauwenberge, podrían ser:

– Hora local (para saber si el tweet fue realizado a altas horas de la noche).

– Imagen asociada con el tweet o no.

– Link asociado o no con el tweet.

– Número de errores tipográficos para el tweet comparado con el promedio de errores para el usuario.

– Frecuencia de tweets del usuario (pico repentino).

– Tiempo transcurrido con los tweets posteriores.

– Cambios en las palabras usadas por el usuario.

– Tono del tweet.

– Sexo y edad si está disponible.

– Ubicación (diferente de la ubicación habitual) suponiendo que pueda identificarse la ubicación.

 

 

nicestream-big-data-algoritmo-1

 

A continuación deberíamos identificar la manera de capturar los datos para completar, por cada tweet, cada una de estas variables.

Con los datos en nuestra mano, los procesaríamos de forma que presenten la manera deseada. También crearíamos variables derivadas de las originales, ya que muchas veces las transformaciones de los datos crudos se presentan como mejores predictores que las variables originales.

Una vez llegados hasta aquí, nos quedaría una última parte: elegir o crear el algoritmo que se va a utilizar y evaluar los resultados. Para ello necesitaríamos un conjunto de datos de entrenamiento y/o verificación de la manera de entender los casos en correcta clasificación y los niveles de probabilidad asociados a cada caso. Para conseguir este set de entrenamiento podríamos proponer a un grupo de personas que se emborrachen y se pongan a tuitear. Pero esto no mostraría un comportamiento real, con lo cual una vez tengamos los tuits clasificados deberíamos utilizar algún criterio descriptivo para definir quienes estuvieron borrachos, contactarlos y confirmar la hipótesis.

Con todos los elementos: Variables, Datos, Transformaciones y set de entrenamiento, estaríamos en condiciones de evaluar el modelo desarrollado.

En resumen, es posible realizarlo: pero se precisa una combinación importante de tiempo, estadística, programación, creatividad, cubalibres, mojitos, red bull y mucho vodka.

 

¿Qué podemos obtener aplicando algoritmos al Social Big Data?

 

No todo queda en determinar si te has tomado un par de copas antes de escribir un tuit.
Con el uso del Big data podemos mejorar considerablemente los modelos para predecir el éxito qué obtendrá determinado producto antes de salir al mercado, cuáles serían los segmentos que más aceptarían nuestra oferta, qué clientes tienen mayor probabilidad de dejar de serlo o cuál es el nivel adquisitivo de las personas, entre otros.

 

Ya lo dijo Peter Sondergaard: “La información es la gasolina del siglo XXI, y la analítica de datos el motor de combustión”. El Big Data y los algoritmos pueden ser los mejores aliados de tu empresa… ¡piénsalo!

Leave a Reply

Your email address will not be published. Required fields are marked *