Se publica el primer ‘borrador’ de 'pangenoma' humano, añadiendo millones de componentes al genoma humano de referencia

Publicado originalmente por Stephanie Pappas, el 10 de mayo de 2023

Una nueva versión del genoma humano de referencia incorpora datos genéticos de 47 individuos de todo el mundo, proporcionando a los científicos una visión más pormenorizada sobre el funcionamiento de los genes.

 

El nuevo "pangenoma" humano de referencia incluye datos de ADN de 47 personas. (Crédito de la imagen: Darryl Leja, NHGRI)

Los científicos han publicado el primer "pangenoma" humano, una secuencia genética completa que incorpora genomas no solo de un individuo, sino de 47 individuos.

Son 47 individuos que provienen de diferentes zonas del mundo y que, por lo tanto, han aumentado enormemente la diversidad de los genomas representados en la secuencia, en comparación con la secuencia anterior del genoma humano completo que los científicos utilizan como referencia para el estudio. La primera secuencia del genoma humano se publicó con algunas lagunas en 2003 y ya en 2022 "sin estas lagunas”. Si ese primer genoma humano podía representarse como una simple cadena lineal de código genético, la representación del nuevo pangenoma sería una serie de caminos ramificados.

El objetivo final del Human Pangenome Reference Consortium, que publicó el primer borrador sobre el pangenoma el pasado miércoles 10 de mayo en la revista Nature, es secuenciar al menos 350 individuos de diferentes poblaciones de todo el mundo. Aunque el 99,9% del genoma es el mismo en todas las personas, se ha encontrado una gran diversidad en ese 0,1% restante.

"En lugar de usar una sola secuencia del genoma como nuestro sistema de coordenadas, deberíamos tener una representación que se base en los genomas de muchas personas diferentes, para que se pueda captar mejor la diversidad genética de los seres humanos", explicaba a Live Science Melissa Gymrek, investigadora de genética de la Universidad de California en San Diego, que no participó en el proyecto.

El pangenoma humano recientemente compilado es una colección de diferentes genomas a partir de los cuales se pueda comparar una secuencia genómica individual. Al igual que un mapa del sistema de metro, el gráfico del pangenoma tiene muchas rutas posibles para una secuencia, representada por diferentes colores. Las trayectorias de desvío, en la parte superior de la imagen, representan Variantes de Nucleótido Unico (SNV), que son diferencias de una sola letra. El camino amarillo, que gira alrededor de sí mismo y repite los mismos nucleótidos, representa una variante de duplicación. La trayectoria rosa, que gira en sentido contrario a las agujas del reloj y sigue la secuencia de nucleótidos hacia atrás, representa una variante de inversión. En la parte inferior, la trayectoria verde y la azul oscuro pierden el nucleótido C en su ruta y representan una variante de deleción. La trayectoria azul claro, que tiene nucleótidos adicionales en su ruta, representa una variante de inserción. (Crédito de la imagen: Darryl Leja, NHGRI)

Una referencia para la salud

La primera secuencia completa del genoma humano fue completada en 2003 por el Proyecto Genoma Humano y se basó en el ADN de una persona. Más tarde, se agregaron fragmentos de otros 20 individuos, pero el 70% de la secuencia que los científicos usan para comparar la variación genética todavía proviene de una sola persona.

Los genetistas usan el genoma de referencia como guía al secuenciar piezas de los códigos genéticos de las personas, según explicaba a Live Science Arya Massarat, estudiante de doctorado en el laboratorio de Gymrek y coautora de un editorial sobre esta nueva investigación en la revista Nature. Emparejan los fragmentos de ADN recién decodificados con el genoma de referencia, para averiguar cómo encajan dentro del genoma en su conjunto. También utilizan el genoma de referencia como estándar para identificar variaciones genéticas (diferentes versiones de genes que divergen del genoma de referencia) que podrían estar relacionadas con afecciones de salud.

Pero al disponer de una sola referencia, principalmente de una persona, los científicos solo disponen una ventana limitada de diversidad genética para estudiar.

El primer borrador del pangenoma duplica ahora el número de las principales variantes del genoma, conocidas como variantes estructurales, que los científicos pueden detectar, alcanzando ahora la cifra de 18.000. Son lugares del genoma donde grandes pedazos han sido eliminados, insertados o reorganizados. El nuevo borrador también agrega 119 millones de nuevos pares de bases, es decir, las "letras" emparejadas que componen la secuencia de ADN, y 1.115 nuevas mutaciones de duplicación de genes respecto a la versión anterior del genoma humano.


"Realmente, comprender y catalogar estas diferencias entre los genomas es lo que nos permite comprender la biología y el funcionamiento de las células, así como en qué medida contribuyen las diferencias genéticas a comprender las enfermedades humanas", dijo en una prensa la coautora del estudio Karen Miga, genetista de la Universidad de California, Santa Cruz, en una conferencia celebrada el 9 de mayo pasado.

“El pangenoma podría ayudar a los científicos a comprender mejor las afecciones complejas en las que los genes desempeñan un papel influyente, como el autismo, la esquizofrenia, los trastornos inmunitarios y enfermedades coronarias,” dijeron los investigadores involucrados en el estudio en la conferencia de prensa.

“Por ejemplo, se sabe que el gen de la lipoproteína A es uno de los mayores factores de riesgo para la enfermedad coronaria en los afroamericanos, pero los cambios genéticos específicos involucrados son complejos y poco conocidos,” dijo a los periodistas el coautor del estudio Evan Eichler, investigador de genómica de la Universidad de Washington en Seattle. Con el pangenoma, los investigadores pueden ahora comparar más a fondo las variaciones en personas con enfermedades cardíacas y sin ellas, lo que podría ayudar a aclarar el riesgo de enfermedad cardíaca de determinados individuos, en base a las variantes del gen que portan.

Una comprensión mucho más diversa

El borrador actual del pangenoma utilizó datos de los participantes en el Proyecto 1000 Genomas, que fue el primer intento de secuenciar genomas de un gran número de personas de todo el mundo. mundo. Los participantes incluidos aceptaron que sus secuencias genéticas se incluyeran en bases de datos disponibles públicamente bajo anonimato.

El nuevo estudio también utilizó una tecnología de secuenciación avanzada llamada "secuenciación de lectura larga", a diferencia de la secuenciación de lectura corta que vino antes. “La secuenciación de lectura corta es lo que sucede cuando envías tu ADN a una compañía como 23andMe,” dijo Eichler. “Los investigadores leen pequeños segmentos de ADN y luego los unen en un todo. Este tipo de secuenciación puede capturar una cantidad aceptable de variación genética, pero puede haber poca superposición entre cada fragmento de ADN. La secuenciación de lectura larga, por otro lado, captura grandes segmentos de ADN a la vez.”

“Si bien es posible secuenciar un genoma con secuenciación de lectura corta por unos 500 dólares, la secuenciación de lectura larga sigue siendo costosa, aproximadamente 10.000 dólares por genoma”, dijo Eichler. Sin embargo, el precio está bajando, y el equipo de pangenoma espera secuenciar sus próximos lotes de genomas a la mitad de ese coste o incluso menos.

“Los investigadores están trabajando para reclutar nuevos participantes para continuar llenando los vacíos de diversidad en el pangenoma”, según informaba a los periodistas el coautor del estudio Eimear Kenny, Profesor de Medicina y Genética en el Instituto de Salud Genómica de la Escuela de Medicina Icahn en Mount Sinai en la ciudad de Nueva York. Debido a que la información genética es sensible y, debido a que las normas que rigen el intercambio de datos y la privacidad varían en diferentes países, este es un trabajo delicado. “Incluye aspectos como privacidad, consentimiento informado y posibilidad de discriminación basada en la información genética”, según dijo Kenny.

Los investigadores ya están descubriendo nuevos procesos genéticos con el borrador del pangenoma. En dos artículos publicados en Nature junto con este trabajo, los investigadores analizaron segmentos que se repiten con elevada frecuencia en el genoma. Estos segmentos han sido tradicionalmente difíciles de estudiar, dijo a Live Science el bioquímico Brian McStay de la Universidad Nacional de Irlanda Galway, porque la secuenciación a través de la tecnología de lectura corta hace que sea difícil entender cómo encajan. La tecnología de lectura larga permite leer largos trozos de estas secuencias repetitivas a la vez.

Los estudios encontraron que en un tipo de secuencia repetitiva, conocida como duplicaciones segmentarias, hay una cantidad de variaciones mayor de lo esperado, lo que potencialmente podría ser un mecanismo para la evolución de nuevas funciones de los genes a largo plazo. Sin embargo, en otro tipo de secuencia repetitiva que es responsable de construir las máquinas celulares que crean nuevas proteínas, el genoma se mantiene notablemente estable. El pangenoma permitió a los investigadores descubrir un mecanismo potencial de cómo estos segmentos clave de ADN se mantienen consistentes a lo largo del tiempo.

"Esto es solo el comienzo", dijo McStay. " Habrá una gran cantidad de novedades en biología a partir de este estudio". 

Artículo original



Comentarios

Entradas populares de este blog

Las simulaciones por ordenador explican el movimiento celular: como una red ferroviaria de células

Un nuevo modelo de aprendizaje profundo utiliza el vídeo para identificar las diferentes fases del desarrollo embrionario

Un estudio que revela la estructura beta-amiloide arroja luz sobre la función del fármaco Leqembi