Estaba claro desde el primer momento que GitHub Copilot estaba entrando en aguas oscuras en lo que a leyes se refiere. Ahora, finalmente, sus creadores (Microsoft y OpenAI) tienen una demanda colectiva en su contra presentada ante el sistema judicial estadounidense. Pero rebobinemos un poco, para ponernos en contexto.
El pasado mes de junio (casi un año después de la presentación de la beta) se lanzó al mercado la versión definitiva de GitHub Copilot, un servicio online de pago capaz de ofrecer a los programadores autocompletado de código basado en IA... y de hacerlo bastante bien, a tenor de los comentarios de los profesionales.
Mi software tiene una licencia, no sé si lo sabes
Sin embargo, más allá de los debates recurrentes sobre el futuro de los programadores humanos en la era de la inteligencia artificial, GitHub Copilot nació con polémica: OpenAI reveló que el modelo de IA en que se basa, Codex, se había creado entrenándolo con código de "millones de repositorios públicos" alojados en GitHub.
Según OpenAI y Microsoft, no había ningún problema legal, porque se trataba de un ejemplo de 'fair use', una figura del derecho anglosajón que regula las excepciones a la aplicación del copyright. Sin embargo, miles de desarrolladores de software libre que venían usando los repositorios de GitHub no estuvieron de acuerdo...
...al entender que el uso que habían hecho de su código violaba las licencias "open source" a las que éste se acogía, que sólo permiten la redistribución y modificación no comercial del código (y que, además, suele exigir la acreditación de los autores originales en caso de trabajos derivados).
Y, en estos meses, algunos han decidido saltar de la indignación a la acción (legal): Matthew Butterick, abogado, programador y autor del sitio web GitHubInvestigation.com, decidió dar los primeros pasos presentar una demanda colectiva. Y, hace ahora una semana, Butterick anunció la presentación de dicha demanda contra Microsoft y Open AI de la mano de un bufete de abogados:
"Como programador open source [...] me resultó evidente desde la primera vez que lo probé que Copilot planteaba serias dudas legales [...]. Y como abogado, me vi obligado a defender el código abierto".
El problema no es sólo el copyright, es el futuro de la comunidad open source
Y es que Butterick afirma que Copilot no sólo es ilegal por vulnerar los derechos de autor, sino que también tiene un efecto disuasorio a la hora de comprometerse con la comunidad open source: si cualquier código disponible 'en abierto' en Internet puede ser usado ahora por servicios comerciales para ayudar a crear software 100% comercial, muchos desarrolladores voluntarios optarán por dejar de colaborar.
Así, la comunidad de software libre, que se ha ido construyendo poco a poco desde los lejanos inicios del proyecto GNU hasta reunir a cientos de miles de programadores, podría empezar a perder talento y a quedar progresivamente inactiva si el paradigma que parece inaugurar Copilot se consolida.
En palabras de Butterick:
"Podría decirse que Microsoft está creando un nuevo jardín amurallado que inhibirá a los programadores de descubrir comunidades tradicionales de código abierto. O al menos, eliminará cualquier incentivo para hacerlo. Con el tiempo, este proceso matará de hambre a estas comunidades".
"Los desarrolladores de código abierto no lo hacen por el dinero, pero tampoco lo hacen por nada. [Lo hacen porque] nuestras comunidades nos ayudan a mejorar nuestro software de maneras que no podríamos por nuestra cuenta. Esto es lo que hace que esta labor sea divertida y colaborativa".
"Pero Copilot introduce lo que podríamos llamar una motivación más egoísta para el software de código abierto: '¡dame lo que quiero y ya!'. Con Copilot, los usuarios de código abierto nunca tienen que saber quién hizo su software. Nunca tienen que interactuar con una comunidad. Nunca tienen que contribuir".
Una perspectiva poco halagüeña la que plantea Butterick. A nosotros, por otra parte, nos queda otra duda: ¿cómo se van a entrenar las IAs que sucedan a Copilot cuando tengan que ir incorporando nuevos lenguajes para los que apenas haya código de muestra original en Internet?
Ver todos los comentarios en https://www.genbeta.com
VER 7 Comentarios