Un enorme árbol genealógico para comprender la familia humana
La secuenciación del genoma humano en las dos últimas décadas ha dado lugar a un conocimiento más profundo de nuestro pasado evolutivo. De esta forma, se han generado datos genómicos de cientos de miles de individuos, incluidos los de miles de personas prehistóricas.
Un equipo de científicos ha aplicado un nuevo método no paramétrico que combina datos de registro en árbol de genomas humanos antiguos y modernos, lo que les ha permitido deducir una genealogía completa humana.
Con esta técnica, el ancestro de dos individuos se asigna geográficamente al punto medio entre la localización geográfica de sus dos descendientes y se van determinando sus ancestros en el pasado. “Aunque sabemos que este método es imperfecto, parece recapitular bien muchos de los movimientos humanos conocidos. Quizás la sorpresa es, de hecho, que funciona razonablemente bien”, declara Aida Andres, del Instituto de Genética del University College de Londres y autora de un artículo en la misma revista, como comentario a este trabajo.
Hasta la fecha, se habían recogido miles de genomas humanos, que contienen segmentos de diferentes y múltiples ancestros de distintas edades. En consecuencia, la elaboración de una imagen completa de la genealogía y la variación genómica a lo largo de la historia humana representa un reto técnico.
Ahora, Wong y su equipo han logrado construir un enorme árbol genealógico para toda la humanidad. “Al tratar toda nuestra ascendencia como una sola red, podemos estimar características generales de los antepasados comunes en el árbol genealógico humano, como su edad e incluso potencialmente su ubicación. Nuestro método se podrá escalar potencialmente a millones de genomas”, asegura Wong.
La historia que generó toda nuestra variación genética.
Dado que las regiones genómicas individuales solo se heredan de un progenitor, la ascendencia de cada punto del genoma puede considerarse como un árbol. El conjunto de árboles, conocido como ‘secuencia arbórea’ o ‘gráfico de recombinación ancestral’, enlaza las regiones genéticas a través del tiempo con los ancestros en los que apareció por primera vez la variación genética.
En total, se usaron ocho bases de datos diferentes que incluyeron un total de 3.609 secuencias genómicas individuales de 215 poblaciones. Los genomas antiguos incluían muestras halladas en todo el mundo, con edades comprendidas entre 1.000 y más de 100.000 años. Los algoritmos predijeron dónde debían estar presentes los ancestros comunes en los árboles evolutivos para explicar los patrones de variación genética. La red resultante contenía casi 27 millones de ancestros.
Tras añadir los datos de localización de estos genomas de muestra, los autores utilizaron la red para estimar dónde habían vivido los ancestros comunes. Los resultados recapitularon con éxito acontecimientos clave de la historia evolutiva humana, incluida la migración fuera de África.
“Hace tiempo que se sabe que hubo una dispersión fuera de este continente, quizá hace unos 100.000 años. Las señales de este acontecimiento se encuentran en partes del genoma como el mitocondrial, el cromosoma Y y varios otros genes. Sin embargo, nuestra genealogía muestra, por primera vez, que la señal de este acontecimiento está claramente presente en todo el genoma”, señala Wong.
Los investigadores observaron señales de linajes ancestrales muy profundos en África, el evento fuera de África, y la introgresión o incorporación arcaica de genes en Oceanía.
Las mutaciones que nos dan las pistas.
Este método también tiene en cuenta los datos que faltan y los erróneos, y utiliza genomas antiguos fragmentados para ayudar a identificar el momento de la aparición de los alelos.
“Estos son variantes genéticas. Aparecen por mutación en algún momento, y si se establecen a partir de ese instante, esa posición genómica será variable en la población. Unos cromosomas tendrán un alelo, otros el otro. Podemos inferir la edad de esos alelos usando genomas modernos, pero es un problema difícil y lo hacemos con poca resolución”, revela Andres.
“Esto ayuda a mejorar los modelos que nos permiten inferir la historia demográfica humana. Pero, además, si ese alelo tiene efectos importantes —por ejemplo, si nos permite digerir la lactosa, o si aumenta el riesgo de una enfermedad—, mejorar la inferencia de la edad del alelo nos ayuda a entender la historia de ese fenotipo o de esa enfermedad”, continúa la investigadora del University College.
Gil McVean, otro de los coautores de la Universidad de Oxford, recalca a SINC: “Los conjuntos de datos genómicos que utilizamos se han construido a partir de muchas fuentes diferentes y utilizando distintos métodos. Inevitablemente, se producen ciertos tipos de error. Nuestro enfoque ayuda a identificarlos. Estimamos que la tasa es pequeña, menos del 0,5 % de los lugares de variantes en el genoma, pero su eliminación crea una imagen más precisa y completa de la variación genómica humana”.
Aunque el estudio se centra en los seres humanos, el método es válido para la mayoría de los seres vivos.
Limitaciones del estudio.
Wilder Wohns, por su parte, explica que una de las principales limitaciones de este trabajo es que utilizan un método muy simple para estimar la ubicación de nuestros antepasados.
“Se podría trabajar mucho más en este campo. Además, nuestras estimaciones de la ubicación de los ancestros están limitadas en última instancia por las de las secuencias genómicas. Por ejemplo, la precisión de nuestra reconstrucción de las migraciones de los pueblos indígenas a las Américas se ve dificultada por la relativa escasez de muestras del noreste de Siberia y el noroeste de Norteamérica”, añade.
Además, si se produjeran grandes migraciones históricas que no dejaran descendientes locales, la precisión de dichas estimaciones de la ubicación de los ancestros se vería disminuida.
“Desde mi punto de vista, una de las mayores limitaciones de todo estudio que utiliza las grandes bases de datos de genomas existentes —incluido este— es que no tenemos una representación adecuada de todas las poblaciones humanas. Las bases de datos están sesgadas hacia poblaciones muy estudiadas. Por ejemplo, las europeas. Pero esto ocurre, no solo en esta investigación, sino en la mayoría del trabajo genómico actual, y se solucionará solo secuenciando más genomas de más poblaciones mundiales”, concluye Andres.
Referencia:
Anthony Wilder Wohns et al. «A unified genealogy of modern and ancient genomes». Science
Últimas noticias
El desperdicio alimentario es un problema mundial que afecta el 17% de los alimentos producidos, lo que equivale a más de 930 millones de toneladas anuales, y genera el 8-10% de las emisiones globales de gases de efecto invernadero (ONU, 2021)
El catálogo de estrategias reproductivas que han desarrollado los anfibios a lo largo de la evolución es quizás el más diverso del reino animal. Un equipo liderado por el Museo Nacional de Ciencias Naturales (MNCN-CSIC) añade hoy un nuevo modo de reproducción a este catálogo al descubrir cómo se reproduce Barbourula busuangensis, una primitiva rana que vive en el archipiélago de Palawan, Filipinas.