Recientemente Google Research y Google DeepMind publicaron un paper que describe un nuevo modelo amplio de lenguaje (LLM) para el desarrollo de fármacos. Denominado Tx-LLM, se perfeccionó a partir de PaLM-2, la tecnología de inteligencia artificial generativa (GenAI) de Google que codifica información sobre modalidades terapéuticas.
Para el entrenamiento de Tx-LLM se utilizaron 709 conjuntos de datos orientados a 66 tareas que abarcan varias etapas del desarrollo de fármacos. Para afinar los resultados que obtiene, Tx-LLM intercala instrucciones escritas en texto libre con representaciones de moléculas pequeñas descritas con el método tipográfico SMILES. (Simplified Molecular Input Line Entry System o especificación de introducción lineal molecular simplificada es un método que utiliza secuencias de código ASCII para describir sin ambigüedad la estructura de una molécula dada).
Luego, para predecir la sinergia de los fármacos, los investigadores utilizaron indicaciones compuestas de instrucciones, contexto y una pregunta. El proceso de afinamiento (denominado TxT) se enfocó a resolver la clasificación, regresión y generación de tareas en el desarrollo de fármacos y tratamientos farmacéuticos.
Futuro promisorio del nuevo Tx-LLM
Así, el lenguaje es capaz de procesar simultáneamente entidades químicas o biológicas (moléculas pequeñas, proteínas, ácidos nucleicos, líneas celulares, enfermedades) intercaladas con texto libre. Eso le permite hacer predicciones en la evaluación de la eficacia y la seguridad, el logro de objetivos y la facilidad de fabricación. En consecuencia, se facilitaría el desarrollo de nuevos fármacos y tratamientos.
Se encontró que Tx-LLM tiene un rendimiento competitivo en 43 de las 66 tareas designadas al evaluarlo contra los parámetros que definen la tecnología de vanguardia (state-of-the-art) en ese campo. De hecho, los excede en 22 tareas.
De acuerdo con sus desarrolladores, «Tx-LLM representa un paso importante hacia la codificación del conocimiento bioquímico en un modelo amplio de lenguaje. Podría tener un papel futuro como herramienta integral en todo el proceso de desarrollo de descubrimiento de fármacos».