En Twitter hay spam. Bastante spam. Cualquiera que lleve unos años en esta red social habrá visto cómo ha evolucionado el mismo y cómo se ha ido adaptando. Cuentas falsas que publican enlaces sin parar, otras cuentas que hacen follows masivos y un largo etcétera. Sin embargo, desde Twitter han explicado hoy cómo en los últimos tiempos han conseguido ir paliando este contenido no deseado con la creación de BotMaker.
Este algoritmo se divide en varias fases: una en tiempo real, otra en casi tiempo real y otra en trabajos programados. En la primera de ellas, de nombre Scarecrow, detecta el spam en tiempo real, evitando que se publique en Twitter. Si ven actividad sospechosa, se implementan medidas como un captcha. Y si alguien publica un enlace que está marcado ya como spam, el tweet directamente se intercepta y no se publica.
La segunda es Sniper que, casi en tiempo real, clasifica el contenido. "Algunos modelos que se basan en aprendizaje automático (Machine Learning) no pueden ser evaluados en tiempo real debido a las funcionalidades de las que dependen", explican desde Twitter. Sería en esta fase donde se analizan de forma asíncrona. Finalmente están los trabajos periódicos, que analizan el comportamiento de un usuario durante periodos más largos de tiempo y extraen información de cantidades masivas de datos.
¿Qué han conseguido con este cambio de paradigma? Según ellos mismos explican, se ha reducido un 40% el spam publicado en Twitter. Además, el diseño de este algoritmo les permite reducir su tiempo de acción respecto a los ataques de spam. Antes tenían que esperar horas o días, mientras que ahora con BotMaker pueden adaptarlo para que detecte un determinado ataque en cuestión de minutos.
Más información | Twitter
Imagen | Mike Mozart
Ver 1 comentarios