2023-09-30 09:45:11
OpenAI ha limitado la capacidad de ChatGPT para leer contenidos de páginas web a resúmenes de 100 palabras. Y esos resúmenes no son fiables.
Cuando OpenAI retiró la beta de navegación de ChatGPT en julio, lo hizo con una endeble justificación: Quería «hacer lo correcto por los propietarios de contenidos», según el anuncio de la retirada. ChatGPT con navegación era capaz de traspasar los muros de pago de los editores y copiar artículos enteros textualmente en el chat.
La justificación es endeble en el sentido de que saltarse los muros de pago es el menor de los males. El verdadero problema es que chatbots como ChatGPT podrían captar una gran parte del tráfico de Internet si los usuarios sólo consumen contenidos de otros sitios a través del chatbot.
Es un problema que OpenAI reconoció cuando lanzó por primera vez la función de navegación. También es un problema con Google Bard o Bing Chat.
ChatGPT está limitado a resúmenes de 100 palabras
Las pruebas de la función de navegación ahora lanzada demuestran que OpenAI ha hecho concesiones desde su retirada en julio: ChatGPT ahora sólo produce resúmenes de hasta 100 palabras. de texto web. Para obtener más información, debe seguir un enlace a la fuente.
El sistema no distingue entre el texto que está legalmente permitido copiar, como el de Wikipedia o el del propio blog de OpenAI, y el texto que está protegido por derechos de autor, como el de los sitios de noticias. En mis pruebas, el sistema rechazó de forma fiable las preguntas sobre citas más largas de fuentes.
No puedo proporcionar extractos literales de textos protegidos por derechos de autor debido a la política de OpenAI de respetar las leyes de propiedad intelectual y evitar posibles usos indebidos del servicio. Sin embargo, puedo ofrecer resúmenes, responder a preguntas específicas o profundizar en aspectos concretos para ayudar a transmitir la información que buscas.
El contenido de los sitios que bloquean el rastreador ChatGPT, como el New York Times, ya no se puede consumir en el chat, ni siquiera en forma resumida.
A la pregunta de por qué no copia el texto de Wikipedia, aunque sea legal hacerlo, ChatGPT responde que está entrenado para proporcionar «información de forma resumida, reformulada o sintetizada, en lugar de copiar grandes cantidades de texto textualmente». Se guía para evitar «citas excesivas de fuentes externas» y remitir a los usuarios a la fuente original para obtener más información.
ChatGPT también rechaza las peticiones de reformular el texto para evitar posibles problemas de derechos de autor, ya que esto violaría sus directrices.
El sistema se ofrece a responder preguntas sobre el texto en el chat. Sin embargo, en mis pruebas, ChatGPT fue incapaz de responder a preguntas sencillas sobre hechos que se describen claramente en la fuente pero que van más allá del resumen.
Por ejemplo, le pregunté a ChatGPT sobre la duración del pico de intensidad del huracán Walaka en el artículo correspondiente de Wikipedia. Aunque el texto incluye la frase «Walaka mantuvo su intensidad máxima durante seis horas», ChatGPT dijo que esta información no se incluyó en el artículo.
OpenAI hace que ChatGPT sea más respetuoso con los derechos de autor, pero también menos útil
Cuando OpenAI introdujo por primera vez la navegación ChatGPT, la empresa reconoció que se trataba de «un nuevo método de interactuar con la web» y que agradecería cualquier comentario sobre cómo podría seguir contribuyendo a la «salud general del ecosistema» devolviendo tráfico a las fuentes.
La nueva navegación ChatGPT parece ser el compromiso que la empresa ha alcanzado consigo misma. La funcionalidad es similar a la de los motores de búsqueda habituales, que citan textos y, a veces, párrafos cortos de páginas web directamente en los resultados de búsqueda. Este enfoque ha sido criticado en algunos casos, al menos por los editores, y es objeto de disputas legales, pero ha sido una práctica común durante la última década más o menos.
Sin embargo, en comparación con los motores de búsqueda tradicionales, la búsqueda ChatGPT tiene una gran desventaja: Mientras que los motores de búsqueda suelen mostrar fragmentos relevantes sin modificar de la fuente, ChatGPT reescribe la información de la fuente.
La herramienta de IA suele hacer un buen trabajo. Pero no siempre.
La navegación ChatGPT es poco fiable, lenta y engorrosa de controlar
En los últimos meses, he revisado cientos de resúmenes de AI de artículos que he escrito. Se calcula que el 20% de las veces, el resumen no acierta u omite algún aspecto importante. En ocasiones, los datos son erróneos.
Si conozco la fuente original, el artículo sigue siendo un gran ayuda para escribir para mí como editora, sobre todo porque puedo crear varios borradores y decidir entre ellos en cuestión de segundos. Eso es bueno.
Pero yo no me fiaría de un resumen de AI como fuente de información sin conocer la fuente original. Hacerlo es una chapuza.
Si respiras hondo y lo piensas paso a paso, no hay razón para preferir un resumen de IA a una cita significativa de la fuente original, como la que ofrecen los motores de búsqueda. Esta última es más directa y precisa.
Esta falta de fiabilidad por sí sola hace que ChatGPT Browsing menos útil que los motores de búsquedaBásicamente inútil. De todos modos, siempre tendrías que ir a la fuente original. ¿Por qué dar el rodeo a través del resumen de la IA?
Google Bard es aún peor, con la posibilidad de comprobar las fuentes a través de otro bucle de IA, lo que significa que sigues sin poder estar seguro no sólo de que la información es correcta, sino de que la fuente de la información se cita correctamente. Es desordenado y complicado.
Además, tengo menos control sobre la selección de fuentes a menos que lo especifique explícitamente en el prompt, lo que vuelve a ser engorroso. La selección de fuentes de Bing fue modesta, al menos en mis pruebas, y desde luego no es la que yo habría elegido.
Otros inconvenientes son la menor transparencia y velocidad, y el acceso irregular a páginas web si muchos sitios bloquean el chatbot.
Por supuesto, los motores de búsqueda como Google Search tienen sus problemas.
A menudo están saturados de anuncios y clasifican sitios de spam que difunden desinformación con fines lucrativos. Sus criterios de clasificación no son transparentes y pueden perjudicar a personas y empresas.
Pero incluso ChatGPT con Bing no es más que acceder al mismo contenido web que Google a través de un algoritmo de búsqueda. La web no mejora mágicamente sólo porque un chatbot busque automáticamente por mí en sitios que yo no elegiría y que incluso pueden tergiversar su contenido. Al contrario, el chatbot sólo añade otra fuente potencial de error a la cadena de información.
Quizá algún día los chatbots puedan competir con los motores de búsqueda. El Search Generative Experience de Google es el que más se le acerca porque es un híbrido bien pensado. Pero en términos de fiabilidad y derechos de autor, los dos grandes obstáculos, no hemos avanzado mucho desde que Bing Chat dio el pistoletazo de salida a la fiebre de los chatbots de búsqueda.