GitHub se burla de la nueva función Copilot que permite a los desarrolladores codificar con su voz

GitHub lanza Copilot para el plan de negocios ya que las cuestiones legales siguen sin resolverse

GitHub Copilot, el servicio de GitHub que sugiere inteligentemente líneas de código, es ya disponible en un plan para empresas meses después del lanzamiento para usuarios individuales y educadores.

Llamado GitHub Copilot for business, el nuevo plan, que cuesta $19 por usuario al mes, viene con todas las características del nivel Copilot de licencia única junto con licencias corporativas y controles de políticas. Eso incluye una opción que permite a los administradores de TI evitar que se muestre a los desarrolladores el código sugerido que coincide con el código público en GitHub, una respuesta probable a las controversias de propiedad intelectual que se están gestando en torno a Copilot.

Disponible como una extensión descargable para entornos de desarrollo que incluyen Microsoft Visual Studio, Noevim y JetBrains, Copilot funciona con un modelo de IA llamado Codex, desarrollado por OpenAI, que está entrenado en miles de millones de líneas de código público para sugerir líneas de código y funciones adicionales dadas las contexto del código existente. Copilot, que tenía más de 400 000 suscriptores en agosto, puede presentar un enfoque o una solución de programación en respuesta a una descripción de lo que un desarrollador quiere lograr (p. ej., “Di hola mundo”), basándose en su base de conocimientos y el contexto actual.

Al menos una parte del código en el que se capacitó a Codex está protegido por derechos de autor o bajo una licencia restrictiva, un problema con el que algunos grupos de defensa se han mostrado en desacuerdo. Los usuarios han podido solicitar a Copilot que genere código de Quake, fragmentos de código en bases de código personales y código de ejemplo de libros como “Mastering JS” y “Think JavaScript”; El propio GitHub admite que, aproximadamente el 1 % de las veces, las sugerencias de Copilot contienen fragmentos de código de más de ~150 caracteres que coinciden con los datos de entrenamiento.

GitHub afirma que el uso justo, o la doctrina de la ley de los EE. UU. que permite el uso de material protegido por derechos de autor sin tener que obtener primero el permiso del titular de los derechos, lo protege en caso de que Copilot se haya desarrollado, a sabiendas o sin saberlo, contra el código protegido por derechos de autor. Pero no todos están de acuerdo. La Free Software Foundation, una organización sin fines de lucro que aboga por el movimiento del software libre, ha llamado a Copilot “inaceptable e injusto”. Y Microsoft, GitHub y OpenAI están siendo demandado en una demanda colectiva que los acusa de violar la ley de derechos de autor al permitir que Copilot regurgite secciones del código con licencia sin proporcionar crédito.

Dejando a un lado la responsabilidad de GitHub, algunos expertos legales han argumentado que Copilot podría poner en riesgo a las empresas si sin darse cuenta incorporaran sugerencias con derechos de autor de la herramienta en su software de producción. Como Elain Atwell notas en un artículo del blog corporativo de Kolide, debido a que Copilot elimina el código de sus licencias, es difícil saber qué código se puede implementar y cuál podría tener términos de uso incompatibles.

El intento de GitHub de rectificar esto es un filtro, introducido por primera vez en la plataforma Copilot en junio, que verifica las sugerencias de código con su código circundante de aproximadamente 150 caracteres contra el código público de GitHub y oculta las sugerencias si hay una coincidencia o una “casi coincidencia”. Pero es una medida imperfecta. Tim Davis, profesor de ciencias de la computación en la Universidad de Texas A&M, descubrió que al habilitar el filtro, Copilot emitía grandes fragmentos de su código protegido por derechos de autor, incluidos todos los textos de atribución y licencia.

@github copiloto, con el “código público” bloqueado, emite grandes fragmentos de mi código protegido por derechos de autor, sin atribución, sin licencia LGPL. Por ejemplo, el mensaje simple “transposición de matriz dispersa, cs_” produce mi cs_transpose en CSparse. Mi código a la izquierda, github a la derecha. No está bien. pic.twitter.com/sqpOThi8nf

—Tim Davis (@DocSparse) 16 de octubre de 2022

GitHub planea introducir funciones adicionales en 2023 destinadas a ayudar a los desarrolladores a tomar decisiones informadas sobre si utilizar las sugerencias de Copilot, incluida la capacidad de identificar cadenas que coincidan con el código público con una referencia a esos repositorios. Y para GitHub Copilot para clientes comerciales, GitHub afirma que no conservará fragmentos de código para capacitación ni compartirá código, independientemente de si los datos provienen de repositorios públicos, repositorios privados, repositorios que no son de GitHub o archivos locales.

Pero no está claro si esos pasos serán suficientes para disipar los temores de las empresas sobre los desafíos legales.




Source link