Google enfrenta una demanda alegando mal uso de datos para entrenar sus LLMs.

Google demandada por mal uso de datos en entrenamiento de LLMs.

En una nueva demanda, Google se enfrenta a acusaciones de mal uso de datos personales para entrenar sus Grandes Modelos de Lenguaje que impulsan sus productos de IA. Esta demanda afirma que el gigante tecnológico recopila los datos de millones de usuarios sin su consentimiento, violando las leyes de derechos de autor en el proceso de entrenamiento de sus productos de IA.

La demanda también apuntará a su empresa matriz, Alphabet, y a DeepMind. La firma Clarkson Law Firm, que presentó una demanda similar contra OpenAI, fabricante de ChatGPT, el mes pasado, fue presentada en un tribunal federal de California. Alega que Google “ha estado robando en secreto todo lo que se ha creado y compartido en Internet por cientos de millones de estadounidenses”.

También afirma que productos como Bard fueron entrenados con dichos datos. Pero la demanda va más allá. También afirma que Google tiene “prácticamente la totalidad de nuestra huella digital”. Esto, por supuesto, incluye “obras creativas y con derechos de autor” para construir sus productos de IA.

En una declaración a CNN, el abogado general de Google, Halimah DeLaine Prado, calificó las afirmaciones presentadas en la demanda como “infundadas”. Continuó diciendo: “Hemos dejado claro durante años que utilizamos datos de fuentes públicas, como información publicada en la web abierta y conjuntos de datos públicos, para entrenar los modelos de IA detrás de servicios como Google Translate, de manera responsable y de acuerdo con nuestros Principios de IA”.

El Sr. Halimah DeLaine Prado continuó señalando precedentes legales que rigen las leyes de uso: “La ley estadounidense respalda el uso de información pública para crear nuevos usos beneficiosos, y esperamos refutar estas afirmaciones infundadas”.

La cuestión de recopilar información de la web para entrenar modelos de IA ha estado en ebullición durante meses. Esto se ha intensificado a medida que las herramientas y productos impulsados por IA han explotado en el mercado. Las preguntas relacionadas con los derechos de autor, la privacidad y más se han convertido en preocupaciones crecientes en círculos que discuten la IA responsable.

Tim Giordano, uno de los abogados de Clarkson que presenta la demanda contra Google, le dijo a CNN: “Google necesita entender que ‘disponible públicamente’ nunca ha significado gratuito para usar con cualquier propósito,…Nuestra información personal y nuestros datos son nuestra propiedad, y son valiosos, y nadie tiene derecho a tomarlos y usarlos para cualquier propósito”.

Giordano continuó separando la diferencia entre la indexación de búsqueda de Google y cómo toma datos para entrenar su modelo. En parte, dijo sobre la indexación, Google puede “mostrar un enlace atribuido a su trabajo que realmente puede llevar a alguien a comprarlo o interactuar con él”. Por otro lado, cuando se trata de recopilar datos, es “una versión alternativa del trabajo que altera radicalmente los incentivos para que alguien necesite comprar el trabajo”.

Lo que la demanda busca de Google es una congelación temporal del acceso comercial y el desarrollo comercial de las herramientas de IA generativas de Google. Si se otorga esta medida cautelar, podría frenar los planes de Google de expandir su IA en 2023.

La demanda también solicita daños y pagos no especificados como compensación financiera a las personas cuyos datos la empresa afirma que Google ha mal utilizado.