MechGPT abre nuevas oportunidades de investigación al unir los puntos entre conocimientos inconexos

Añadir a tus IAs favoritasQuitar de tus favoritasQuitar de favoritos 0
Puntuación+1

2023-11-25 15:43:05

Reconocer correlaciones es una de las capacidades básicas de un modelo de IA. Los modelos lingüísticos especializados lo utilizan para mostrar conexiones entre distintas áreas de investigación.

Markus J. Buehler, investigador del Instituto Tecnológico de Massachusetts (MIT), presenta una estrategia denominada «MechGPT» que se desarrolló específicamente para el estudio del fallo de materiales.

Pero MechGPT también es interesante para otros campos. Demuestra cómo se pueden entrenar modelos lingüísticos especializados para recuperar conocimientos, generar hipótesis y establecer conexiones entre distintas áreas de investigación.

El modelo LLaMa-2 como base

Buehler desarrolló MechGPT en varios pasos. En primer lugar, utilizó un modelo de lenguaje general para extraer pares específicos de pregunta-respuesta de pasajes de texto del libro «Atomistic Modeling of Materials Failure».

A continuación, utilizó los datos extraídos para entrenar un modelo especializado. Buehler eligió OpenOrca-Platypus2-13B, que se basa en LLaMa-2 y puede generar respuestas al mismo nivel que GPT-3.5 de OpenAI, dependiendo de la tarea.

En su artículo, el investigador presenta tres versiones de MechGPT con tamaños de modelo de 13.000 y 70.000 millones de parámetros, que pueden manejar entradas de texto de más de 10.000 tokens.

El estudio de Buehler demuestra que MechGPT es al menos adecuado para diversas tareas en el área de investigación estudiada. Por ejemplo, un biólogo y un experto en modelado molecular hablan de crear un material superresistente. El experto quiere fijarse en los átomos diminutos y en cómo se rompen, mientras que el biólogo quiere aprender de las cosas fuertes de la naturaleza, como las conchas y las telas de araña.

En otro ejemplo, modelamos una conversación entre un «Biólogo» y un «Experto en modelado molecular». El experto en molecular se define mediante estas instrucciones: «Eres un experto en el fallo de materiales, especialmente utilizando modelado atomístico y dinámica molecular. Proporcionas muchos detalles sobre mecanismos de fractura y detalles atomísticos. Usted da muchas ideas para los métodos de modelado que se pueden utilizar para estudiar cualquier idea de diseño de materiales o fenómenos discutidos.»

El otro agente, el biólogo, tiene estas características: «Eres un experto en biología. Argumentas a favor del uso de principios biológicos en el estudio del fallo. Aportas muchas ideas detalladas sobre cómo diseñar y fabricar materiales mejores, más elásticos y resistentes a las fracturas.»

La conversación se desarrolla:

Biólogo: ¿Cuál es la mejor manera de diseñar un material nanocompuesto resistente a la fractura compuesto de grafeno y polímero PLA? Discuta cuestiones específicas como la escala y los mecanismos.

Experto en modelado molecular: El diseño de un material nanocompuesto resistente a la fractura compuesto de grafeno y polímero PLA requiere una comprensión exhaustiva de la estructura atómica del material y de los mecanismos que rigen su fallo. El modelado atomístico y las simulaciones de dinámica molecular pueden utilizarse para estudiar el comportamiento del material a escala nanométrica, lo que permite optimizar sus propiedades. Al diseñar un material de este tipo, es esencial tener en cuenta la escala a la que se utilizará, ya que la resistencia del nanocompuesto puede verse afectada por su tamaño.

Además, la interfaz entre el grafeno y el polímero PLA debe diseñarse cuidadosamente para garantizar una adhesión y una resistencia a la fractura óptimas. Entre los métodos de modelización que pueden utilizarse para estudiar el comportamiento del material se incluyen las simulaciones de dinámica molecular con potenciales interatómicos, como el potencial de Lennard-Jones, para modelizar la interfaz grafeno-PLA. Estas simulaciones pueden ayudar a identificar los mecanismos críticos de fallo y sugerir formas de mejorar la resistencia a la fractura del material.

En general, el diseño de un material nanocompuesto resistente a la fractura compuesto de grafeno y polímero PLA requiere un conocimiento profundo de la estructura atómica del material y de los mecanismos que rigen su fallo, así como el desarrollo de métodos de modelización optimizados para estudiar su comportamiento.

Biólogo: Has tocado algunos puntos importantes. Sin embargo, como biólogo, yo diría que también podemos aprender mucho de la naturaleza a la hora de diseñar materiales resistentes a las fracturas. La naturaleza ha perfeccionado el arte de crear materiales fuertes y resistentes a lo largo de millones de años de evolución. Pensemos, por ejemplo, en la estructura del nácar. Está formado por tabletas microscópicas de aragonito, una forma de carbonato cálcico, dispuestas en forma de ladrillo y mortero. Esta estructura confiere al nácar su increíble dureza y resistencia a la rotura. El nácar puede ser hasta 3.000 veces más duro que el aragonito del que está hecho, debido a la forma en que las tabletas microscópicas se deslizan unas sobre otras en lugar de romperse cuando el material se somete a tensión.

En el caso de nuestro nanocompuesto de grafeno y PLA, podríamos imitar esta estructura de ladrillo y mortero a nanoescala, disponiendo las láminas de grafeno y el polímero PLA en un patrón similar para aumentar la resistencia a la fractura. Además, el estudio de los sistemas biológicos también puede ayudarnos a comprender mejor los mecanismos de fallo. Por ejemplo, estudiar cómo se fracturan y curan los huesos puede aportar ideas para diseñar materiales que resistan las fracturas o incluso se autocurezcan cuando sufren daños. En conclusión, la incorporación de los principios biológicos al estudio de los fallos puede aportar valiosas ideas para el diseño de materiales más elásticos y resistentes a las fracturas.

Gracias a su estructura parcialmente modular mediante Incrustaciones Posicionales Rotativasla base científica puede ampliarse fácilmente.

Buehler advierte que hay que tener cuidado al interactuar con el modelo y elegir los parámetros. Recomienda ser lo más preciso posible a la hora de preguntar y pedir al modelo que explique su resultado paso a paso para minimizar las alucinaciones.

Modelos lingüísticos múltiples que se complementan

En futuros desarrollos, las estrategias multiagente en las que varios modelos lingüísticos especializados se comunican entre sí podrían complementar la interacción con MechGPT.

MechGPT abre nuevas oportunidades de investigacion al unir los puntos 2023-11-25 15:43:05
Imagen: Markus J. Buehler
1700876567 512 MechGPT abre nuevas oportunidades de investigacion al unir los puntos 2023-11-25 15:43:05
Imagen: Markus J. Buehler

Según Buehler, MechGPT tiene un amplio abanico de aplicaciones potenciales más allá de las áreas de investigación estudiadas. Por ejemplo, el modelo podría servir de asistente para experimentos en un «laboratorio virtual» o permitir diálogos simulados entre profesor y alumno mediante interacciones con agentes. También tiene un gran potencial para aplicaciones industriales, como el desarrollo de nuevos conceptos tecnológicos o la resolución creativa de problemas.

La optimización o predicción del comportamiento de los materiales también es posible mediante la combinación con métodos como el «aprendizaje de pocos disparos». En la interfaz entre ciencia y arte, MechGPT también podría contribuir al uso del proceso para aplicaciones generativas y creativas, por ejemplo, mediante diseños y visualizaciones individuales.

Este artículo es un primer paso hacia el desarrollo de un marco de modelos lingüísticos afinados para la investigación. Si se entrenan con mayores cantidades de datos y se integran métodos modernos de extracción de texto, como el reconocimiento óptico de caracteres para fórmulas, podrán desarrollarse modelos más potentes.

Los resultados de las primeras variantes del modelo son prometedores, aunque es esencial una cuidadosa validación e integración en un canon más amplio de métodos. En general, los enfoques presentados abren nuevas vías para el uso de métodos de IA en la investigación científica.

Deja una opinión

      Deje una respuesta

      🤖 AI MAFIA
      Logo