SHOW-1 y Agentes Showrunner en Simulaciones Multiagente de IA

Añadir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0
Puntuación0

2023-07-24

👉 Relacionada: Un episodio de South Park generado por IA podría ser un engaño

El problema de la página en blanco

Como se mencionó anteriormente, una de las ventajas de la simulación es que evita el problema de la página en blanco tanto para un usuario como para un modelo de lenguaje grande al proporcionar combustible creativo. Incluso los escritores experimentados a veces pueden sentirse abrumados cuando se les pide que ideen un título o una idea para una historia sin ningún material relacionado previo. Lo mismo podría decirse para los modelos de lenguaje grande. La simulación proporciona contexto y puntos de datos antes de comenzar la cadena de estímulos creativos.

¿Quién lleva la historia?

El proceso de generación de historias en nuestro enfoque es una responsabilidad compartida entre la simulación, el usuario y GPT-4. Cada uno tiene fortalezas y debilidades y un papel único que desempeñar dependiendo de cuánto queramos involucrarlos en el proceso creativo general. Sus contribuciones pueden tener diferentes pesos. Mientras que la simulación generalmente proporciona el contexto basado en la propiedad intelectual, las historias de los personajes, las emociones, los eventos y las localidades que alimentan el proceso creativo inicial. El usuario introduce su intencionalidad, ejerce control de comportamiento sobre los agentes y proporciona los estímulos iniciales que inician el proceso generativo. El usuario también actúa como el discriminador final, evaluando el contenido de la historia generada al final del proceso. GPT-4, por otro lado, sirve como el motor generativo principal, creando y extrapolando las escenas y el diálogo basándose en los estímulos que recibe tanto del usuario como de la simulación. Es un proceso simbiótico en el que las fortalezas de cada participante contribuyen a una historia coherente y atractiva. Es importante destacar que nuestro enfoque multietapa en forma de cadena de estímulos también proporciona controles y equilibrios, mitigando el potencial de aleatoriedad no deseada y permitiendo una mayor alineación consistente con el mundo de la historia de propiedad intelectual.

SHOW-1 e intencionalidad

La forma y el formato de un programa suelen ser una función de las limitaciones del mundo real y los procesos de producción. Por lo general, no cambian, incluso a lo largo de muchas temporadas (South Park actualmente tiene 26 temporadas y 325 episodios).

Una única huella dramática de un programa, que se utiliza para entrenar el modelo SHOW-1 propuesto, se puede considerar como una plantilla altamente variable o «fórmula» para un generador procedimental que produce episodios similares a los de South Park.

Para entrenar un modelo como SHOW-1, necesitamos recopilar una cantidad suficiente de puntos de datos en relación entre sí que caractericen un programa. Un programa de televisión no surge de la nada y está compuesto por las líneas de diálogo finales y las descripciones de los escenarios tal como las ve el público. Los conjuntos de datos existentes en los que se entrenan los modelos de lenguaje grandes actuales solo consisten en el guion final, que tiene el reparto, las líneas de diálogo y a veces una breve descripción del escenario. Falta mucha información, como la sincronización, los estados emocionales, los temas y los contextos que se discuten en la sala de escritores, así como notas detalladas del director. El desarrollo y la mejora de los personajes también son parte de este proceso en curso. Los personajes ficticios tienen personalidades, antecedentes y rutinas diarias que ayudan a los autores a dar forma no solo a las escenas, sino también a los arcos de temporadas completas. Incluso durante un programa, los personajes siguen evolucionando según la retroalimentación del público o los cambios en la dirección creativa. Con la simulación, podemos recopilar datos de forma continua tanto de la entrada del usuario como de los agentes simulados. Con el tiempo, a medida que se crean, perfeccionan y califican episodios, podemos comenzar a entrenar un modelo específico del programa y desplegarlo como un punto de control que permite al usuario seguir perfeccionando y adaptándose a su propio programa original o, alternativamente, llevar un programa existente como South Park en direcciones que los creadores y titulares de derechos de propiedad intelectual no habían concebido previamente. Para ilustrar esto, imaginemos que un usuario genera varios episodios de South Park en los que Cartman, uno de los personajes principales conocido por su temperamento fuerte, cambia lentamente hasta volverse tímido e inocente, mientras que la vida de otros personajes como Butters podría ajustarse para seguir un camino mucho más dominante y agresivo. Con el tiempo, este ciclo de retroalimentación de interactuar y ajustar el modelo SHOW-1 puede llevar a nuevas interpretaciones de programas existentes, pero más emocionante aún, a nuevos programas originales basados en la intención del usuario. Uno de los desafíos para que este ciclo de retroalimentación sea atractivo y satisfactorio es la frecuencia con la que se puede entrenar un modelo. Un modelo alimentado por datos de simulación en tiempo real y entrada del usuario no debe sentirse estático ni requerir recursos costosos para adaptarse. De lo contrario, la salida que genera puede sentirse estática y sin respuesta también.

Cuando un sistema generativo no está limitado en su capacidad para producir rápidamente grandes cantidades de contenido y no hay límite para que el usuario consuma dicho contenido de inmediato y potencialmente de manera simultánea, el problema de las 10.000 tazas de avena puede convertirse en un problema. Todo comienza a verse y sentirse igual o peor aún, el usuario comienza a reconocer un patrón que a su vez reduce su participación, ya que esperan que los episodios recién generados sean como los anteriores, sin sorpresas.

Esto es bastante diferente de una trama predecible que, en combinación con las «alucinaciones positivas» antes mencionadas o los accidentes felices de un sistema generativo complejo, puede ser algo bueno. Sorprender al usuario al equilibrar y cambiar las fases de certeza frente a incertidumbre ayuda a aumentar su participación general. Si no esperaran ni predijeran nada, tampoco podrían sorprenderse gratamente.

Con nuestro trabajo, buscamos la singularidad perceptiva. El problema de la avena de procedimiento de los generadores se mitiga mediante el uso de una simulación continua (un generador oculto) y el contenido de larga duración de episodios de 22 minutos que solo se generan cada 3 horas. De esta manera, el usuario generalmente no consume una gran cantidad de contenido simultáneamente o en un tiempo muy corto. Esta escasez artificial, los límites naturales del juego y el tiempo de simulación ayudan.

Otro factor que mantiene cautiva a la audiencia mientras ve un programa y que hace que los episodios sean únicos es la intencionalidad de los autores. Una premisa moral satírica, un comentario social retorcido, eventos mundiales recientes o cameos de celebridades son elementos importantes para South Park. Otros tipos de programas, como las comedias de situación, generalmente progresan principalmente a través de cambios en las relaciones (algunos de los cuales nunca se cumplen), manteniendo cautiva a la audiencia a pesar de seguir el mismo formato y fórmula.

La intencionalidad del usuario para generar un episodio de alta calidad es otra área de investigación interna. Incluso los usuarios sin experiencia en escritura dramática deberían poder pensar en historias, temas o preguntas dramáticas principales que deseen ver desarrolladas en la simulación.

Para apoyar esto, el sistema del showrunner podría guiar al usuario al compartir su propio proceso de pensamiento creativo y hacer sugerencias alentadoras o incitar al usuario a responder preguntas. Una especie de ingeniería inversa de estímulos donde el usuario responde preguntas.

Una de las preguntas sin respuesta restantes en el contexto de la intencionalidad es cuánto valor de entretenimiento (o valor creativo en general) se atribuye directamente a las personalidades creativas de los autores y directores vivos. Los nombres grandes generalmente impulsan las ventas de boletos, pero el crédito creativo que el público le da al trabajo mientras lo consume parece ser diferente. Ver una película de Disney ciertamente lleva consigo una sensación de calidad creativa, independientemente de los famosos actores de voz, como resultado de la vinculación de la marca y su historia.

El contenido generado por IA generalmente se percibe como de menor calidad y el hecho de que se pueda generar en abundancia reduce aún más su valor. Es difícil decir cuánto cambiaría esta percepción si Disney se enorgulleciera abiertamente de haber producido una película totalmente generada por IA. ¿Y si Steven Spielberg, por sí solo, generara una película de IA? Nuestra suposición es que el valor percibido del contenido generado por IA ciertamente aumentaría.

Un nuevo enfoque interesante para replicar esto podría ser la personificación de modelos de IA creativa como SHOW-1 para permitirles construir una personalidad fuera de su mundo simulado y establecer relaciones a través de las redes sociales o eventos del mundo real con su audiencia. Siempre que un modelo de IA sea percibido como una caja negra y no comparta su proceso creativo y su razonamiento de manera humana y accesible, como es el caso de los escritores y directores vivos, es poco probable que reciba crédito con valores creativos reales. Sin embargo, por ahora, esta es una pregunta más filosófica en el contexto de la IA general.

Deja una opinión

Deje una respuesta

🤖 AI MAFIA
Logo