Yahoo quiere atraer a los investigadores de IA liberando 13,5 terabytes de datos de navegación

Aunque el presente de Yahoo está repleto de problemas económicos debido a lo muy estancado que está su crecimiento, en la veterana empresa ya piensan en tener un futuro mejor. Para eso quieren subirse a la carrera por la Inteligencia Artificial que están librando otras grandes empresas tecnológica, por lo que necesitan atraer la atención de los investigadores.

Para ganarse el favor de estos académicos, Yahoo ha anunciado que liberará los datos de comportamiento con los clicks, scrolls y acciones realizadas por más de 20 millones de usuarios anónimos en sus portales de deportes, finanzas, noticias y otras secciones. Estos datos serán cedidos exclusivamente a las universidades para que sus investigadores puedan tener la mayor cantidad de datos posibles sobre el comportamiento de los usuarios en la red.

Un vistazo a…
Cómo mejorar la SEGURIDAD EN INTERNET: VPN, DNS y páginas con HTTPS

Datos para alimentar algoritmos

El objetivo de este movimiento parece claro. En la carrera por desarrollar la mejor inteligencia artificial o sistema de Deep Learning, los investigadores necesitan la mayor cantidad posible de datos para entrenar a sus algoritmos. Proporcionándoselos Yahoo tratará de ganar un mayor renombre en sector, con lo que le sería más fácil fichar algunos investigadores para sus propios proyectos.

El peso total de todos estos datos superará los 13,5 terabytes, y será muy superior a cualquier base de datos disponible en las universidades o a cualquier cantidad antes liberada por alguna empresa tecnológica. Con ellos, los investigadores podrán mejorar sus algoritmos para que sean capaces de analizar mayores cantidades de datos, lo que a la larga beneficiará a todas las empresas del sector.

La preocupación por la privacidad hace que las grandes compañías opten por no liberar demasiados datos de este tipo. Aun así Yahoo ha intentado que los suyos no den información personal, y se limiten a ofrecer datos demográficos como ciudades, edades o géneros además de los de navegación. Para dificultar aun más que se pueda dar con las personas reales detrás de los datos, también se han excluido los de las poblaciones con menos ciudadanos y áreas rurales.

Vía | The Wall Street Journal
Imagen | Christian Barmala

Ver todos los comentarios en https://www.genbeta.com

VER 1 Comentario

Portada de Genbeta