Skip to main content

¿Qué métodos computacionales podemos usar para predecir propiedades de sustancias?

En la entrada del blog anterior hablábamos de la quimioinformática dentro de los llamados métodos alternativos, pero, desde el punto de vista de la normativa vigente, ¿qué métodos computacionales podemos utilizar para predecir una propiedad toxicológica o físico-química de una sustancia? ¿Cómo decidimos cuál de ellos utilizar? En esta entrada os traemos la respuesta.

Existen cuatro métodos comúnmente aceptados por las normativas reguladoras como REACH, que regula la producción e importación de productos químicos en Europa. Estos cuatro métodos son:

Normativa REACH

Estos métodos computacionales se basan en el cálculo de descriptores moleculares, que se pueden definir como valores numéricos que cuantifican propiedades calculadas a partir de la estructura de las moléculas. Estos descriptores pueden ser de distintos tipos, desde físico-químicos (p.ej. número de átomos de cada elemento que posee la molécula), topológicas (relación uni- o bidimensional entre diferentes átomos de la molécula), estructurales (relación tridimensional), etc.

Cuando no existe información experimental sobre la molécula de interés, es frecuente que se recurra a la búsqueda de análogos estructurales. Estos se pueden definir como compuestos químicos que tienen una estructura química similar a la molécula de interés. En el caso de que existan estos análogos estructurales, el siguiente paso será definir qué tipo de predicción se va a realizar: cualitativa o cuantitativa.

Las predicciones cualitativas  son aquellas que nos permiten obtener clasificaciones, como por ejemplo activo / inactivo, tóxico / no tóxico, etc. Por otro lado, las predicciones cuantitativas o de regresión son aquellas que permiten cuantificar la propiedad que se quiere predecir, como por ejemplo log Kow (coeficiente de partición octanol-agua), log S (unidad de solubilidad en agua), punto de ebullición, etc.

Si la predicción es cualitativa, un primer método computacional posible es el read across o extrapolación. Este método se basa en la agrupación de sustancias en función de sus similitudes estructurales, como grupos funcionales comunes, precursores, etc., permitiendo realizar una extrapolación para predecir una propiedad de la molécula de interés a partir de los datos de compuestos similares. Si la predicción es de tipo cuantitativo, podemos efectuar un trend analysis o análisis de tendencia. Este método es muy similar al read across pero nos permite realizar una regresión para predecir la propiedad estudiada.

Si no se dispone de análogos estructurales a la molécula de interés, se recurre a los métodos basados en la relación estructura-actividad, ya sea de forma cualitativa (SAR) o cuantitativa (QSAR). Este tipo de métodos están basado en la relación que se establece entre la estructura química de un compuesto y su actividad biológica o química. Estos métodos se llevan aplicando desde el siglo XIX, cuando se correlacionó la actividad biológica de ciertos alcaloides con su composición molecular, pero han tenido grandes avances en los últimos años, debido entre otras causas al aumento de la capacidad computacional y los algoritmos de aprendizaje artificial (machine learning).

Los métodos SAR hacen uso de reglas y alertas estructurales creadas por expertos para construir modelos que relacionan subgrupos o fragmentos de moléculas con una propiedad biológica o química. Este método consiste en detectar un fragmento estructural concreto de las moléculas que es conocido por ser responsable de la propiedad investigada, como por ejemplo toxicidad, mutagenicidad, carcinogenicidad, etc. Estos métodos nos permiten hacer predicciones cualitativas.

Los modelos QSAR se generan usando métodos estadísticos o métodos de aprendizaje automático que utilizan la correlación entre los descriptores moleculares y la propiedad biológica o química estudiada. Entre los métodos más utilizados en los modelos QSAR están la regresión lineal múltiple, el algoritmo de k vecinos más próximos (k-nearest neighbours), las máquinas de vectores de soporte (support vector machines), redes neuronales, etc. Estos métodos nos permiten realizar tanto predicciones cualitativas como cuantitativas.

Ir al contenido