Investigadores crean un algoritmo que genera tu biografía a partir de tus tweets

Investigadores crean un algoritmo que genera tu biografía a partir de tus tweets
2 comentarios Facebook Twitter Flipboard E-mail

Desde hace algún tiempo, Twitter pone a disponibilidad de sus usuarios un archivo con todos los tweets que éste ha enviado. En él puedes encontrar absolutamente todo lo que has escrito en esta red social: desde lo que has comido un día que decidiste compartir una foto hasta que en su día aprobaste un examen importante. ¿Es posible reconstruir la vida de alguien a partir de Twitter? Si escribe lo suficiente, sí, aunque para ello es necesario separar los tweets menos significativos.

Esto precisamente han propuesto dos investigadores de la Universidad de Carnegie Mellon y de la Universidad de Cornell. Para ello, consideran que hay cuatro tipos de tweets: personales y específicos en el tiempo, personales y generales en el tiempo, públicos y específicos en el tiempo y, finalmente, públicos y generales en el tiempo. Según su teoría, los eventos personales importantes (PIE) caerían dentro de la primera categoría.

Tus tweets, a examen

Por ejemplo, un tweet sobre que alguien ha cambiado de trabajo o que va a ir a una determinada universidad, sería específico en el tiempo y también personal. Sin embargo, que alguien twittee que esa misma tarde ha hecho ejercicio ya no es algo tan importante de cara a recoger en la biografía del usuario. El trabajo de estos dos investigadores se centra en seleccionar estos tweets que definen como PIE entre todos los demás.

Si hablamos de celebrities, la cosa cambia: también tendrían que tenerse en cuenta los tweets publicos y específicos en el tiempo. Por ejemplo, si un usuario normal publica algo sobre las elecciones, no sería relevante. Sin embargo, si Barack Obama es quien lo escribe, sí que tendría que considerarse para formar parte de su biografía.

Para conseguir saber qué es un tweet PIE y qué no lo es, estudian por separado cada palabra de cada publicación y también la reacción de otros usuarios a cada una de ellas (si queréis los detalles matemáticos, podéis encontrarlos en el paper). Por ejemplo, después de analizar el timeline de una usuaria de 22 años, consiguieron extraer las siguientes palabras clave (en la columna de la derecha) que, analizadas, llevarían a la etiqueta manual que aparece a la izquierda:

Ejemplo de palabras y eventos

Si bien este algoritmo es interesante (no sólo para los cotillas o las "agencias" que quieren saber algo más de un grupo de sospechosos y no quieren/pueden hacerlo a mano, sino para los propios usuarios que muchas veces no son conscientes de lo que publican online), también tiene sus limitaciones. Por ejemplo, obviamente sólo funciona en aquellas cuentas en las que se compartan estados personales y que tengan un número significativo de seguidores que permita analizar el patrón de respuestas.

Un vistazo a…
Cómo mejorar la SEGURIDAD EN INTERNET: VPN, DNS y páginas con HTTPS

Las posibilidades de un algoritmo de este tipo

Imaginaos que, en lugar de actuar sólo en Twitter, este algoritmo fuera más general y buscara y analizara todas nuestras cuentas en redes sociales, además de en otros sitios web de Internet. Con un simple click, este costoso análisis manual se convertiría en un procedimiento rápido, sencillo y barato. Por ahora, no corramos tanto: de momento estos dos investigadores no apuntan tan alto y afirman que su intención es mejorar el algoritmo actual.

Enlace | "Paper":http://arxiv.org/pdf/1309.7313v1.pdf Vía | MIT Technology Review

Comentarios cerrados
Inicio