Hasta ahora todos los estudios en genómica se han basado y han utilizado de referencia la secuencia del genoma humano producida hace más de dos décadas y catalogada como GRCh38 del Proyecto del Genoma Humano. En aquel momento supuso todo un éxito y revolucionó la medicina, pero por limitaciones tecnológicas, algunas regiones genómicas quedaron sin resolver, en concreto un 8 % del total.
“La secuencia del genoma de hace 21 años acertó en la mayor parte (92 %), pero dejó fuera las regiones difíciles que eran altamente repetitivas”, explica a SINC Evan Eichler, investigador del departamento de Ciencias Genómicas de la Universidad de Washington en EE UU que participó en el primer borrador. Además, no se terminó ningún cromosoma de punta a punta, y persistían cientos de lagunas en todo el genoma.
Ahora el Consorcio Telomere-to-Telomere (T2T), del que Eichler es copresidente y que cuenta con la participación de más de 100 investigadores de decenas de centros de investigación internacionales, ha logrado el ensamblaje de referencia más completo hasta la fecha para cualquier mamífero. Catalogado como T2T-CHM13, representa un paso importante hacia modelos que representen a todos los humanos, lo que ayudará a mejorar la medicina personalizada, el análisis genético poblacional y la edición genómica.
“Este proyecto no ha sido posible hasta que la tecnología de secuenciación de fragmentos grandes de ADN no ha alcanzado un grado de calidad suficiente”, señala al SMC España Alfonso Valencia, profesor ICREA, director de Ciencias de la Vida en el Centro Nacional de Supercomputación de Barcelona (BSC), un científico independiente del proyecto.
Según el investigador, en el presente trabajo, financiado por el Instituto Nacional de Investigación del Genoma Humano (NHGRI, por sus siglas en inglés), se alcanza un 99 % de fiabilidad secuenciando fragmentos que pueden ser de hasta 200 MB de información genética, equivalentes a un cromosoma humano de principio a fin.
La importancia de la secuencia completa
El hito, que se recoge en seis estudios científicos publicados hoy en la revista Science, que se suman a otros artículos complementarios en varias otras revistas, supone la finalización, de telómero a telómero –los extremos de los cromosomas–, de todas las bases ordenadas y orientadas de cada cromosoma humano.
Para Eichler, coautor de varios de los trabajos, la secuencia proporciona “la primera visión completa de todos los genes, añadiendo unos 120 nuevos que codifican proteínas y que no habían sido caracterizados anteriormente”.
Pero también se ofrece, por primera vez, la visión completa de los centrómeros –las partes del genoma importantes para la segregación–, y “los brazos cortos acrocéntricos de los cromosomas 13, 14, 15 y 21, donde residen los genes de ADN ribosómico que son importantes para la producción de proteínas de una célula”, concreta.
Los científicos disponen ahora de una secuencia sin huecos de los cerca de 3.000 millones de bases (o ‘letras’) de nuestro ADN, una información fundamental para comprender todo el espectro de la variación genómica humana, así como las contribuciones genéticas a determinadas enfermedades.
El análisis de la última versión de la secuencia del genoma contribuirá de manera significativa al conocimiento de los cromosomas, incluyendo mapas más precisos de cinco brazos cromosómicos, lo que abrirá nuevas líneas de investigación. Esto ayudará a responder a preguntas de biología básica sobre cómo los cromosomas se segregan y dividen adecuadamente.
Un paso más para entender la evolución humana
El consorcio T2T utilizó la nueva secuencia como referencia para descubrir más de dos millones de variantes adicionales en el genoma humano. Estos estudios proporcionan así información más precisa sobre las variantes genómicas dentro de 622 genes de importancia médica.
“La generación de una secuencia del genoma humano verdaderamente completa representa un logro científico increíble, ya que proporciona la primera visión exhaustiva de nuestra huella de ADN”, destaca Eric Green, director del NHGRI, “y esta información fundamental reforzará los esfuerzos en curso para comprender todos los matices funcionales del genoma humano, lo que a su vez potenciará los estudios genéticos de las enfermedades humanas”.
Además, un genoma completo mejorará la localización y el descubrimiento de variables genéticas y, al hacerlo, “mejorará nuestra capacidad para mapear enfermedades complejas”, añade Eichler.
De hecho, la principal aplicación será, por primera vez, la caracterización de genes y regiones del genoma hasta ahora inaccesibles. Proporcionará también nuevos conocimientos funcionales sobre, por ejemplo, la segregación de los cromosomas y la división de las células.
Por otra parte, como algunos de los genes importantes para la evolución humana se encuentran en regiones donde había lagunas, en principio mejorará la comprensión de cómo evolucionamos como especie con la caracterización de estas regiones.
Los resultados apuntan a patrones más complejos de variación en los genes que pueden haber contribuido a crear la especie humana, y podrían explicar nuestra rápida evolución. Por ejemplo, revela que algunos genes asociados a cerebros más grandes son muy variables, explica Eichler.
Entender las variaciones del ADN
La secuencia del genoma humano será de este modo especialmente valiosa para los estudios que pretenden establecer visiones completas de la variación genómica humana, o de cómo difiere el ADN de las personas. Estos conocimientos son vitales para comprender las contribuciones genéticas a determinadas enfermedades y para utilizar la secuencia del genoma como parte rutinaria de la atención clínica en el futuro.
“Me sigue sorprendiendo la cantidad de variación que existe entre los humanos en estas regiones más difíciles del genoma. Su tasa de diversidad es mucho más alta, mientras que gran parte del genoma es prácticamente idéntico entre dos humanos. Esas regiones son la excepción”, apunta Eichler. “El hecho de que contengan genes importantes para la adaptación debe significar que esta variabilidad sigue siendo relevante”.
Alfonso Valencia aclara al SMC España que esta nueva versión ya ha permitido localizar mutaciones y cambios asociados a condiciones y enfermedades que hasta ahora no conocíamos”. Es una información particularmente relevante en el caso de enfermedades neurológicas relacionadas con duplicaciones de segmentos de cromosomas”, recalca.
Para los científicos esta gesta es un nuevo comienzo, y aunque queda mucho por descubrir, la nueva secuencia proporciona otro punto de referencia para observar y profundizar en la genética que subyace a nuestro ser completo.