2024-05-07 13:15:17
Google y Meta han presentado nuevos modelos de lenguaje grandes (LLMs) específicamente diseñados para tareas médicas, Med-Gemini y Meditron, que prometen revolucionar la atención médica con IA. Estos modelos ofrecen capacidades mejoradas para procesar información médica multimodal y brindar asistencia confiable a los profesionales de la salud.
Google ha presentado Med-Gemini, un modelo de lenguaje multimodal optimizado para tareas médicas, construido sobre la familia Gemini. Este LLM ha sido entrenado exhaustivamente con datos médicos para mejorar su capacidad de sacar conclusiones lógicas, comprender diferentes modalidades como imágenes y texto, y procesar contextos largos.
En pruebas realizadas, Med-Gemini logró nuevos puntajes máximos en 10 de 14 evaluaciones médicas, incluida la respuesta a preguntas de exámenes médicos. Una de sus características clave es la búsqueda web basada en la incertidumbre, donde el modelo realiza búsquedas en la web si tiene dudas sobre una pregunta, utilizando la información adicional para reducir la incertidumbre y mejorar la calidad de las respuestas.
Si bien su rendimiento en responder preguntas médicas es ligeramente superior a su predecesor Med-PaLM 2 y se acerca a GPT-4, su verdadera fortaleza radica en tareas multimodales como evaluar imágenes médicas. En estas tareas, Med-Gemini supera a GPT-4 en un promedio del 44.5%.
Google visualiza a Med-Gemini como un asistente de diagnóstico capaz de realizar búsquedas confiables basadas en LLM en registros de pacientes pseudonimizados largos y de responder preguntas sobre videos instructivos médicos.
Esto puede parecer una pequeña mejora, pero cuando se trata de desarrollar un modelo médico confiable, cada punto porcentual cuenta, y cuanto más alto se llega, más difícil es realizar mejoras. Aun así, demuestra una vez más que GPT-4 como una LLM genérica ya es capaz en áreas especializadas.
Según Google, la diferencia de rendimiento es más evidente para tareas multimodales como evaluar imágenes médicas. Aquí, Med-Gemini supera a GPT-4 en un promedio del 44.5 por ciento. A través de ajustes y codificadores adaptados, también se pueden procesar modalidades como registros de ECG.
Google utiliza el procesamiento de contextos largos para realizar búsquedas confiables basadas en LLM en registros de pacientes pseudonimizados largos, y Med-Gemini también puede responder preguntas sobre videos instructivos médicos.
Meta dice que Meditron es la LLM de código abierto más capaz
En colaboración con la ETH Lausanne y la Universidad de Yale, Meta ha desarrollado Meditron, un conjunto de modelos de lenguaje basados en su LLM de código abierto Llama 3. Meditron ha sido preentrenado continuamente en datos médicos cuidadosamente compilados para evitar sesgos causados por el entrenamiento web original de Llama 3.
Según Meta, Meditron es actualmente la LLM de código abierto más capaz para medicina, logrando los mejores resultados en pruebas como responder preguntas de exámenes biomédicos. Sin embargo, aún no está al nivel de los modelos propietarios de Google y otros.
Meditron está siendo probado y desarrollado en una «Validación y Evaluación Abierta en Línea Masiva» (MOOVE) por médicos de todo el mundo, especialmente de países en desarrollo.
Meditron está siendo probado y desarrollado en una «Validación y Evaluación Abierta en Línea Masiva» (MOOVE) por médicos de todo el mundo, especialmente de países en desarrollo. Meditron está disponible en Hugging Face en versiones 7B y 70B.
Desafíos y próximos pasos
Aunque estos modelos muestran un progreso significativo, tanto Google como Meta enfatizan que se necesita más investigación y desarrollo antes de que puedan ser utilizados en tareas médicas críticas para la seguridad. Aún quedan por responder importantes preguntas sobre riesgos, rastreabilidad y responsabilidad, especialmente en lo que respecta a su uso en diagnósticos.
No obstante, la introducción de Med-Gemini y Meditron marca un hito importante en la integración de la IA en la medicina. A medida que estos modelos continúen evolucionando y superando las pruebas clínicas, podrían convertirse en herramientas invaluables para respaldar a los profesionales de la salud en la toma de decisiones, el análisis de datos y la prestación de una atención médica más precisa y eficiente.
.