2023-08-29
Un ecosistema emergente de chatbot se basa en los contenidos web existentes y podría desplazar a los sitios web tradicionales. Al mismo tiempo, la concesión de licencias y la financiación están en gran medida sin resolver.
OpenAI ofrece a los editores y operadores de sitios web una opción de exclusión si prefieren no poner sus contenidos a disposición de chatbots y modelos de IA de forma gratuita. Esto se puede hacer bloqueando el rastreador web de OpenAI «GPTBot» a través del archivo robots.txt. Según OpenAI, el bot recopila contenidos para mejorar futuros modelos de IA.
Los principales medios de comunicación, como el New York Times, CNN, Reuters, Chicago Tribune, ABC y Australian Community Media (ACM) están bloqueando GPTBot. Otros proveedores de contenidos web como Amazon, Wikihow y Quora también están bloqueando el rastreador de OpenAI.
Según un análisis de Originality.ai, el 9,2% de los 1000 principales sitios web bloqueaban GPTBot a finales de agosto, con una tasa de crecimiento semanal del 5%. De los 759 archivos robots.txt analizados, 69 tenían instalado el bloqueo. Entre los 100 primeros sitios, el porcentaje de bloqueo es del 15 por ciento.
Los mayores portales de noticias alemanes Bild.de, t-online.de y n-tv.de aún no han bloqueado GPTbot. Spiegel Online todavía permite OpenAI en su sitio. Otros portales de noticias online como sueddeutsche.de, zeit.de y welt.de han modificado sus robots.txt para excluir GPTBot. La cadena pública alemana SWR también bloquea GPTbot.
Chatbots vs. WWW
Bloquear el GPTBot es sólo la mitad de la batalla: bloqueando el agente de usuario ChatGPT puede ser más relevante. Esto se debe a que los complementos de ChatGPT, como la función de navegación de OpenAI, lo utilizan para acceder a páginas web, extraer contenido de una página web en el chat y discutirlo allí.
Esto elimina el click-through a la página web y por lo tanto la monetización – una pérdida directa para el operador de la página web, incluso si el contenido no se almacena a largo plazo y se utiliza para el entrenamiento de la IA. Así que en la mayoría de los casos, cualquiera que bloquee GPTBot también debería estar interesado en bloquear el agente de usuario ChatGPT.
Por otro lado, OpenAI está en retirada en la navegación de IA de todos modos. Oficialmente, porque permite eludir los muros de pago, un efecto secundario no deseado. Extraoficialmente, la situación no resuelta de los derechos en el tratamiento directo de contenidos de terceros probablemente desempeña un papel más importante.
No obstante, Microsoft sigue ofreciendo Bing Chat, con contenidos de sitios web ligeramente reformulados en la ventana de chat. La búsqueda por IA de Google, que se está probando actualmente, también utiliza métodos similares.
Ninguna de las principales empresas de IA ha presentado aún un plan para que el ecosistema de contenidos WWW no sea víctima del éxito de los chatbots. Hasta ahora, los directivos de empresas como Satya Nadella, de Microsoft, sólo han hablado de boquilla.
Es probable que toda la situación legal tenga que resolverse en los tribunales, muy probablemente entre los grandes editores y las grandes empresas de IA como Google, Microsoft y OpenAI. Se dice que el New York Times está preparando una demanda contra OpenAI que podría marcar la tendencia de toda la industria.