Hace algunas semanas comentábamos el peligro que los libros basura disponibles en internet representa para los autores: existen incentivos perversos en las modernas economías de contenidos digitales, que premian el consumo barato y desechable por encima de la calidad o la integridad.
El panorama se ve bastante negro, pero encontré un artículo de Nick Hilden que nos brinda cierta esperanza; abajo le muestro algunas de sus ideas, editadas por mí para fines de espacio y traducción.
Abundante piratería en plataformas
En 2023, la autora Melanie Mitchell descubrió que una imitación barata de su libro, generada por inteligencia artificial (IA) y que irónicamente trataba sobre la IA, estaba a la venta en Amazon. Ella reportó el tema a la empresa, pero ésta no eliminó la copia pirata de la plataforma hasta que la historia captó la atención de los medios.
Otras imitaciones generadas por IA también han aparecido en la plataforma de Amazon. El periodista Rory Cellan-Jones encontró a la venta una versión pirata de sus propias memorias cuando el algoritmo de Amazon le recomendó el libro. En este caso retiraron la copia apócrifa después de que él la reportó.
Pero no está claro cuánta piratería por IA pueden estar disponibles en Amazon, la cual -nos recuerda Hilden- comenzó sus días como una humilde librería digital.
Posteriormente, a finales de 2023, se reveló que tanto la matriz de Facebook, Meta, como OpenAI (la creadora de Chat GPT) habían estado entrenando sus IA utilizando libros pirata; lo que originó la presentación de demandas contra esas empresas por varios autores importantes, de acuerdo con Hilden.
Ausencia de protección legal contra la Inteligencia Artificial
Al día hoy las demandas contra Meta y OpenAI han sido parcialmente desestimadas bajo el criterio de que la IA no ha generado ninguna obra que sea “sustancialmente similar” a los originales. Pero, en opinión de Hilden, el problema de la piratería solamente se agravará para los profesionales creativos que temen al plagio de su prosa e ideas por la IA, con lo que podrían quedarse sin trabajo.
- Una nueva idea
Hilden reporta que en fechas recientes Rodger Morrison, profesor de la Sorrell College of Business de la Universidad de Troy, quien estudia la intersección entre la IA y los negocios, concibió una idea novedosa que podría ayudar a allanar el camino hacia el logro de la protección legal para los creadores.
Actualmente no existe un mecanismo legal para proteger con derechos de autor al contenido generado por IA (al menos en los Estados Unidos, los tribunales han resuelto que ese contenido no goza de protección legal porque no fue producido por un ser humano).
Así el profesor Morrison razonó que si no era posible proteger legalmente al contenido generado por la IA, tal vez los insumos que se usan para generarlo sí podrían gozar de esa protección.
- “Tokens”
El profesor Morrison comenzó a pensar en los tipos de indicaciones (“prompts”) que los usuarios dan a la IA para que imite el estilo de un escritor en particular, las cuales están compuestas por palabras y frases específicas también conocidas como “tokens”. Para ilustrar la forma en que la IA imita un autor, Hilden nos pide considerar al maestro del horror Edgar Allan Poe.
Un usuario humano podría entrenar a Chat GPT para escribir prosa al estilo de Poe con instrucciones como “el estilo de escritura de Poe incluye elementos góticos, imágenes oscuras, profundidad psicológica, simbolismo críptico, tono melancólico, lenguaje intrincado, narradores poco fiables, ritmo de suspenso, exploración sobrenatural, énfasis en el ambiente y en la atmósfera”.
La IA desglosa esas indicaciones en palabras individuales y ya no incluye espacios entre ellas, lo que resulta en una llamada “tokenización” (creación de “fichas”, como las del dominó).
Suponiendo que la cadena de “tokens” logre crear un reflejo fiel del estilo del autor, todo lo que se requeriría hacer para que la IA imite al gran poeta es ingresar una indicación a Chat GPT tal como: “el estilo de escritura de Poe es ElementosGóticos, ImágenesOscuras, ProfundidadPsicológica, SimbolismoCríptico. Por favor, crea un poema al estilo de Poe que hable sobre una persona triste siendo atormentada por un cuervo.”
- Las cadenas de “tokens” pueden protegerse legalmente
El profesor Morrison comenzó a experimentar con su idea y así creó una serie de “tokens” para su propio estilo de escritura, al encontrar 12 palabras que hacían que Chat GPT imitara su estilo con precisión.
En marzo de este año, esa cadena de palabras se convirtió en la primera serie de “tokens” en ser registrada ante la Oficina de Derechos de Autor de los Estados Unidos – hoy por hoy es muy difícil instruir a Chat GPT para que imite el estilo de escritura del profesor Morrison sin con ello violar la ley.
El problema de la imitación de autores se extiende a ámbitos distintos de la prosa, pues en opinión del profesor Morrison cualquiera de las artes puede ser tokenizada, desde la música hasta las artes gráficas y la arquitectura, aunque diferentes disciplinas requerirán diferentes cadenas de “tokens” relevantes.
Para replicar el estilo de un músico en particular, señala Hilden, uno necesitará “tokens” para el estilo de composición, el estilo de interpretación de instrumentos, los patrones de onda vocal y otros factores.
- Protección a los “tokens” contra similares
Igualmente, Morrison (citado por Hilden) dice que precedentes legales aceptados desde hace mucho tiempo pueden hacer que sea difícil para los ladrones de propiedad intelectual eludir los derechos de autor que protejan a los “tokens”.
Aunque en teoría los ladrones podrían intentar usar “tokens” ligeramente diferentes de la versión protegida por derechos de autor, al menos ante los tribunales estadounidenses se podría argumentar que incluso la semejanza estaría prohibida por la ley.
“Si a un libro que está protegido por derechos de autor le cambiara algunas cosas”, explica Morrison (igualmente citado por Hilden), “entonces el autor de la obra original puede argumentar que he violado sus derechos. Esto se llama 'violación de obra derivada' o ' violación de semejanza sustancial'.
Ambos conceptos tienen una larga historia de protección legal y podrían aplicarse fácilmente a la protección de una tokenización.” Así, encontrando y registrando poco a poco los “tokens” que logran que los robots de IA imiten el estilo de autores, se lograría protegerlos de la generación de obras similares por parte de los chatbots.
- Problemas prácticos en los “tokens”
La solución, sin embargo, no es total. La profesora Catherine Clarke de la Universidad de Londres, quien ha analizado el traslape entre la literatura y la IA, también citada por Nick Hilden en su artículo, está de acuerdo en que la protección de “tokens” tiene cierto potencial pero encuentra problemas desde el punto de vista creativo.
Si un escritor toma prestado el tono y el uso del idioma de otro, especialmente dentro de géneros literarios estrechos como las fantasías de vampiros o los consejos para invertir, ¿será ello también considerado una infracción a la ley? La profesora también se pregunta cómo podría aplicarse la protección legal de los “tokens” a autores cuyo estilo varía según el género que escriben, o incluso dentro de una misma obra.
- La protección a los “tokens” es un importante primer paso
Esas son preguntas que exceden al artículo de Hilden, quien concluye citando al profesor Morrison al señalar que “si los derechos de autor sobre los ‘tokens’ no son una solución en sí mismos, al menos son un primer paso para encontrar una y así dar a los autores y artistas cierto control sobre la forma en que su trabajo creativo llega al mundo.”
Precio de Bitcoin de hoy
Puede ver el precio de hoy de Bitcoin aquí, así como también el precio de hoy de Ethereum y de las principales criptomonedas. Por Emilio Carrillo, abogado especializado en temas de financiamiento, tecnología y M&A. X: @ecarrillop; página web: pcga.mx. Las opiniones expresadas son personales del autor y no constituyen recomendaciones de inversión; las inversiones en tecnologías novedosas son de muy alto riesgo y cabe la posibilidad de que todos los recursos destinados a ellas podrían perderse.