2023-08-14 08:32:21
Varios motores de búsqueda para encontrar publicaciones científicas se están equipando con funciones de IA. Las empresas prometen tener especial cuidado, ya que la desinformación generada por la IA podría hacer mucho daño, especialmente en el ámbito científico.
El 1 de agosto, Elsevier, una gran editorial científica holandesa, lanzó Scopus AI a un selecto grupo de 15.000 usuarios beta. Se trata de una búsqueda AI basada en GPT-3.5 para la base de datos Scopus existente. El lanzamiento final del producto está previsto para principios de 2024.
La promesa de lo que puede hacer Scopus AI es grande: Se espera que la herramienta proporcione a los investigadores una visión general concisa y fiable de los temas de investigación, incluidas las referencias académicas; reduzca el tiempo de lectura y el riesgo de alucinaciones; facilite la navegación a otros enlaces; y permita realizar consultas en lenguaje natural.
Pronto se introducirá una representación gráfica que permitirá a los usuarios bucear en las relaciones entre distintos artículos.
Digital Science, la empresa que está detrás de la popular búsqueda en bases de datos Dimensions, sigue su ejemplo y anunció el 1 de agosto un periodo de pruebas cerrado para un asistente de IA que utiliza su propio modelo de lenguaje General Science BERT, así como los modelos GPT de OpenAI.
«Cuando un usuario interactúa con el asistente de IA de Dimensions, éste escanea 33 millones de artículos de la base de datos de Dimensions, recupera y clasifica semánticamente los mejores resultados utilizando incrustaciones semánticas», explica el jefe de innovación Martin Schmidt.
A continuación, los resúmenes de los cuatro primeros resultados se procesan mediante una API de OpenAI para generar resúmenes abstractos. A continuación, el modelo BERT de Ciencia General de Dimension proporciona las respuestas de las diez publicaciones más relevantes.
Vídeo: Ciencia digital
Clarivate y su producto Web of Science tienen planes similares. Su asistente se basará en un gran modelo lingüístico de AI21 Labs, posiblemente un derivado de Jurassic-1. La idea es ofrecer a los científicos un acceso rápido a información y respuestas detalladas y contextuales, así como recomendaciones personalizadas, afirma Clarivate en un comunicado de prensa.
Riesgo de desinformación generada por IA
Hasta ahora, los chatbots se han considerado bastante inadecuados para la investigación científica porque pueden inventarse información, incluidas las fuentes. Éstas suenan plausibles, pero no pueden encontrarse tras una investigación más profunda. Por ejemplo, el modelo de lenguaje científico Galactica, publicado por Meta, fue retirado de la red poco después de su publicación tras las protestas masivas de la comunidad científica.
Los proveedores mencionados, Elsevier, Digital Science y Clarivate, se muestran por tanto comprensiblemente cautelosos a la hora de liberar funciones de IA directamente a todos los usuarios. En su lugar, se probarán primero en una beta cerrada. El anuncio no aclara cómo piensan limitar los operadores de bases de datos la difusión de la IA.
Reconocemos los retos inherentes al uso de la IA, especialmente para algo tan fundamental e impactante como la investigación. Las implicaciones éticas y sociales de esta tecnología no pueden ignorarse y, por lo tanto, creemos que es necesario un enfoque ético y responsable, incluso frente a la rápida innovación y el bombo publicitario en torno a la IA.
Nos comprometemos a lanzar herramientas cuyos inconvenientes comprendemos explícitamente y podemos señalar, o en las que tenemos un alto grado de confianza en sus resultados. Creemos que este enfoque es crucial para que los usuarios puedan discernir cuándo pueden confiar en la IA y cuándo deben actuar con cautela.
Daniel Hook, Director General de Digital Science
Es una tesis común que la IA en el contexto de los motores de búsqueda puede ayudar a la recuperación de información además de a la generación de contenidos. Google, por ejemplo, muestra una gran ambición por utilizar la IA generativa para la recuperación de información con la Search Generative Experience, que es más generativa que la búsqueda, o Microsoft con la integración de GPT-4 en Bing. Recientemente, la plataforma de codificación Stack Overflow anunció Overflow AI, un conjunto de nuevas herramientas para ayudar a los desarrolladores a encontrar fragmentos de código muy específicos.