Lo que Twitter sabe de vos
Antes de comenzar, debo confesarte algo. Uso Twitter todos los días. Como Social Media, debo reconocer que es una de las mejores herramientas para obtener las últimas noticias y compartir información que encuentre relevante al instante.
Por eso, he decidido analizar en detalle a esta herramienta utilizada por casi todos los periodistas mendocinos y revelarte lo fácil que es acceder a los datos de una cuenta de Twitter sin hackear la aplicación.
Twitter sabe muchas cosas de vos y esto se debe en gran parte gracias a los "metadatos" (en esta nota lo explico en detalle) . En su sitio para developers, Twitter menciona el uso de estos datos pero casi nadie lee esto antes de crearse una cuenta en la red social [ver sitio].
Te dejo una lista de metadatos que podrían ser explotados por cualquier persona para rastrear a alguien y configurar su "huella digital":
- Timezone y lenguaje utilizado
- Modelo de Smartphone
- Aplicación utilizada para tuitear
- Geolocalización actual
- Actividad diaria y semanal
- Hashtags más usados
- Amigos más íntimos en la red social
- Los últimos RT
Si abrimos la consola y analizamos el código de un simple tweet vamos a poder analizar todo esto representado por esta infografía de Raffi Krikorian publicada en 2010:
Con Python, pude acceder a cada uno de estos datos de una manera más simple y a través de comandos en Terminal los cuales me permiten individualizar parámetros y hacer un estudio más inteligente y detallado.
Analizando la cuenta de Mauricio Macri (@mauriciomacri):
Elegí la cuenta del presidente y encontré datos muy interesantes los cuales comparto en la imagen:
Tiene geolocalización activada por lo que se puede seguir sus rastros en la red social.
El presidente Mauricio Macri se encuentra más activo al mediodía (los signos positivos muestran la apertura de la aplicación en su celular, los signos negativos todo lo contrario)
En la imagen, podemos observar cómo Twitter ya detectó su visita a Brasil y los hashtags más usados por la cuenta del presidente. También, dividido por porcentaje, analiza los medios utilizados para tuitear. Llama la atención la presencia de Blackberry, prácticamente extinguido aunque expertos en el tema aseguran que es uno de los dispositivos más seguros del mundo para usar redes sociales como Twitter y Facebook.
Python, es capaz de escanear hasta 30 tuits por segundo por lo que resulta muy eficiente analizar cuentas con mucha cantidad de tuits y seguidores.
En Internet, hay frameworks que realizan este tipo de trabajos pero la diferencia es la cantidad de tuits que permite analizar. Con Python, podés analizar todos los tuits de una cuenta siempre y cuando lo hagas por parte ya que la API de Twitter tiene un límite de 2854 tuits, en cambio, con frameworks vas a estar limitado solo a 1000 en sus versiones free y 2000 en sus versiones premium.
*Comandos utilizados en consola
python tuits_analyzer.py -n mauriciomacri friends
python tuits_analyzer.py -n mauriciomacri -l 5000
python tuits_analyzer.py -n mauriciomacri -h
*Librerías utilizadas:
Tweepy, Numpy, ArgParse, Collections, DateTime
*Lenguaje utilizado:
Python
*Código fuente: solicitar código