Una reciente investigación uruguaya publicada en la revista Scientific Reports aporta un enfoque innovador que utiliza inteligencia artificial para predecir las funciones de los genes. Su originalidad reside en que, usando estas herramientas computacionales, demuestra que la ubicación de un gen a lo largo del genoma puede ser suficiente para predecir su función.
Imagen: Flavio Pazos.
Un gen es un segmento del ADN que tiene las instrucciones necesarias para producir una proteína. Las proteínas son tanto bloques de construcción de la célula como máquinas que ejecutan una o más funciones dentro de ella. Así, las funciones de los genes pueden ir desde incidir en el color de los ojos o en la altura de una persona, hasta indicarle a las células de la piel que produzcan melanina, hacer que los glóbulos rojos sean capaces de transportar oxígeno en la sangre o que el sistema inmune produzca anticuerpos para combatir un patógeno. Por eso, cuando un individuo tiene una versión alterada de uno o más genes (mutación) las instrucciones que ofrece fallan y se pueden desarrollar enfermedades o trastornos.
Conocer las funciones de los genes es clave para entender todos los procesos biológicos que suceden en un organismo. A lo largo de las últimas décadas la ciencia ha logrado establecer las funciones de miles de nuestros genes. Sin embargo, la función de un tercio de los genes humanos sigue siendo desconocida o está pobremente caracterizada. En casi todos los otros organismos, la proporción de los genes de función desconocida es aún mayor.
Para determinar fehacientemente la función de un gen es necesaria la experimentación con modelos biológicos, una tarea que insume mucho tiempo y dinero. Hay muchos grupos de investigación que dedican años a analizar un solo gen. “La predicción computacional de funciones de genes busca acelerar este proceso, identificando genes con alta probabilidad de tener cierta función específica”, explica Flavio Pazos”, uno de los autores del estudio, investigador de la Unidad de Bioquímica y Proteómica Analíticas del Instituto Pasteur de Montevideo, y del Departamento de Biología del Neurodesarrollo del Instituto de Investigaciones Biológicas Clemente Estable (IIBCE).
Con Pazos trabajaron también Diego Silvera, Pablo Soto y Rafael Cantera, del IIBCE; Gustavo Guerberoff del Instituto de Matemática y Estadísticas de la Facultad de Ingeniería de Udelar; y Patricio Yankilevich de Instituto de Investigación en Biomedicina de Buenos Aires.
Apoyándose en el conocimiento acumulado, la gran cantidad de datos disponibles y el creciente poder de cómputo, el campo de la predicción computacional de funciones de genes, utiliza herramientas informáticas para estimar, a partir de diferentes parámetros, la función de un gen.
Desde hace muchos años se utiliza, por ejemplo, la secuencia de letras que conforma al gen (ATCG), asumiendo que dos genes con la misma secuencia probablemente tengan la misma función.
Ahora, la importancia de esta investigación radica en que demuestra —por primera vez en organismos eucariotas— que la predicción de la función de un gen se puede hacer exclusivamente a partir de su ubicación relativa respecto a los otros genes que componen el genoma.
Tanto la ubicación de los genes como las funciones ya conocidas son datos que están disponibles para la comunidad científica en diversas bases de datos de muchas especies. Lo que hizo el estudio fue aprovechar esta información disponible para entrenar algoritmos de aprendizaje automático, utilizando como parámetro para inferir la función de un gen su ubicación a lo largo de la cadena de ADN respecto a otros genes de función conocida.
En particular, el estudio se hizo analizando datos de los genomas de cinco organismos eucariotas: una levadura (Saccharomyces cerevisiae), un gusano (Caenorhabditis elegans), un insecto (Drosophila melanogaster), un ratón (Mus musculus) y el ser humano (Homo sapiens).
En la región no hay otros grupos trabajando en la predicción de función de genes mediante inteligencia artificial.