El primer genoma humano secuenciado, ese que se anunció en mayúsculas hace ahora dos décadas, estaba compuesto por ADN de 20 personas anónimas que respondieron a un anuncio puesto en 1997 en un periódico de Buffalo, ciudad situada a unos 400 kilómetros de Nueva York.
Se trataba de un logro tecnológico con una gran carga simbólica, pero a nivel funcional había muchas dudas para trabajar con él. ¿Cómo sabíamos si esas secuencias eran las 'normales' en un individuo? Aunque un análisis posterior concluyó que había una alta contribución afroamericana a este primer genoma, el resultado estaba muy lejos de ser representativo.
La publicación, este miércoles en Nature, del primer borrador del pangenoma humano busca resolver esa representatividad y recoger la amplia diversidad genética humana para servir de auténtica referencia a los investigadores.
[Hito científico: descifran por primera vez el genoma completo del ser humano]
Se trata de la combinación de 47 individuos genéticamente diversos, donde predomina la población africana, que es la que tiene mayor variación genética del mundo: el 51% del total proceden de dicho continente, por un 34% de genoma americano, 13% asiático y un 2% europeo.
La razón de incluir poco material genético de individuos europeos es, básicamente, porque la inmensa mayoría de genomas secuenciados hasta el momento tiene este origen. Los dos primeros genomas secuenciados pertenecientes a una única persona fueron de dos individuos blancos anglosajones: James Watson, codescubridor de la doble hélice de ADN, y Craig Venter, emprendedor que retó al Proyecto Genoma Humano (de financiación pública) para luego unirse a él.
Desde la publicación del primer genoma humano, los científicos han consensuado varios genomas de referencia. Esto les permite, por ejemplo, analizar y detectar las mutaciones responsables de ciertas enfermedades. El último genoma de referencia, llamado GRCh38, fue publicado en 2017 y partía de la información de más de 60 bibliotecas genómicas distintas.
Este pangenoma humano ha descubierto 1.115 nuevas duplicaciones en el genoma, añadiendo 119 millones de pares de bases a las más de 3.200 que ya contiene GRCh38. También ha detectado un 104% más de variantes estructurales.
Este nuevo mapa genético humano, más completo, permitirá separar mejor el grano de la paja a la hora de buscar variaciones en las secuencias de ADN significativas para detectar no solo enfermedades monogénicas –las que comúnmente decimos que son de origen genético– sino también la influencia de los genes en patologías comunes como la diabetes, el asma, las enfermedades cardiovasculares o el cáncer.
El responsable de este nuevo macroproyecto es el Consorcio del Pangenoma Humano de Referencia, liderado por el Instituto Nacional de Salud de EEUU y participado por una red de universidades e instituciones norteamericanas (las universidades de Stanford, Washington y Yale, entre otras) y europeas (el Instituto Wellcome Sanger, la Universidad Heinrich Heine y el Laboratorio Europeo de Biología Molecular).
Mayor diversidad genética
La idea no es quedarse en estos 47 individuos. Un segundo paso, actualmente en marcha, busca llegar a los 100 genomas, incluyendo poblaciones cuyo aislamiento les ha dotado de unas características genéticas peculiares, y culminar el proyecto con el ADN de 350 individuos para lograr un genoma auténticamente representativo de la humanidad.
"Hasta ahora utilizábamos un genoma mayoritariamente caucásico porque solo se habían estudiado genéticamente más personas caucásicas que de otros orígenes", explica Guiomar Pérez de Nanclares, genetista en el Hospital Universitario de Araba y portavoz de la Asociación Española de Genética Humana. El genoma español, por ejemplo, tiene parte caucásica pero también una parte africana que no estaba tan presente en los genomas de referencia.
[La lectura completa del genoma abre la puerta a la cura de múltiples enfermedades]
El artículo publicado en Nature supone un "salto mortal", pues implica también la posibilidad de estudiar grandes cambios en las secuencias genéticas, no como se hacía hasta ahora, donde solo se miraban los exones, esto es, la parte de los genes que se transcriben para fabricar proteínas, dejando fuera los intrones (parte de los genes que no se transcribe) y el ADN no codificante, que es la mayoría.
"Al permitirnos lecturas más largas con la nueva tecnología, vemos que en diferentes poblaciones existen alteraciones de tamaño, deleciones o ganancias de material genético que difieren de unas poblaciones a otras, y pueden ser elementos importantes en la regulación de los genes", apunta.
El año pasado se publicó el genoma humano más completo hasta el momento, que incluía un 8% de ADN que, por sus características (repeticiones interminables de la misma serie de letras), había sido imposible secuenciar hasta ahora.
Al igual que el primer Genoma Humano, suponía un logro más simbólico que práctico. El nuevo pangenoma es todo lo contrario, pues servirá a los genetistas para trabajar desde un primer momento, por ejemplo, en el diagnóstico de enfermedades.
"En mi día a día va a suponer un cambio", afirma Pérez de Nanclares. "Nos va a dar más luz respecto a las variaciones que encontramos. Si lo comparamos con la población de referencia adecuada, podremos tener más certeza sobre lo que encontramos, y que tendrá más visos de ser patológico".
Qué nos une y qué nos diferencia
"Cuando el número de personas analizadas es muy pequeño y encontramos una variante", continúa, "no tenemos la certeza de si esa variante es causal de una enfermedad o simplemente es la más frecuente en una población". Con una secuencia que sirva auténticamente de referencia podrán discernir mejor las variaciones que son patológicas.
Pérez de Nanclares explica que, hoy por hoy, resulta imposible saber qué parte del genoma es idéntica en todos los humanos y qué parte pertenece a variaciones no patológicas. Asimismo, hoy por hoy es muy difícil discernir la influencia genética en enfermedades donde el ambiente juega también una parte importante, pero el pangenoma de referencia permitirá avanzar en este campo.
Por su parte, Gemma Marfany, catedrática de Genética de la Universidad de Barcelona y jefa de grupo del Ciberer (la red de investigación española en enfermedades raras), ha apuntado, en declaraciones al Science Media Centre, que este hito "no se trata de un salto conceptual, sino de un avance sustancial en precisión. Cuanto mayor conocimiento tengamos de nuestro genoma, mayor precisión en las inferencias genéticas del análisis".
Según señala, la nueva referencia "mejorará sustancialmente el diagnóstico genético, tanto el de las enfermedades raras como, especialmente, de las enfermedades complejas, en que las variantes estructurales han sido un caballo de batalla, ya que no eran fácilmente detectables con el genoma de referencia actual y las técnicas usadas hasta el momento".