lunes, 25 de septiembre de 2017

Rastros de ADN antiguo en mi genoma

La historia genealógica reciente de las poblaciones humanas son un complejo mosaico de movimientos individuales, migraciones de poblaciones a gran escala y otros eventos demográficos. Los conjuntos de datos de genómica poblacional pueden proporcionar una ventana a esta historia reciente gracias a que las trazas poco comunes de ascendencia genética compartida son detectables en los segmentos largos de ADN.

Las compañías 23andMe y Family Tree DNA (esta última con el producto de Family Finder) proporcionan información acerca de las regiones mitad idénticas (half-identical region, HIR). Una región mitad idéntica es una región de dos cromosomas pareados donde al menos uno de los dos alelos del par de cromosomas de una persona coincide con al menos uno de los dos alelos del par de cromosomas de otra persona diferente en toda la región. Una región mitad idéntica puede ser idéntica por descendencia (identical by descent, IBD) o idéntica por estado (identical by state, IBS).

Idéntico por descendencia es un término utilizado en la genealogía genética para describir un segmento coincidente de ADN entre dos o más personas heredado de un antepasado común sin la intervención de la recombinación. Los segmentos se consideran coincidentes (match) si todos los alelos de un cromosoma paterno o materno son idénticos (salvo mutaciones raras y errores de genotipado) y si cumplen las condiciones mínimas del umbral establecidas por la empresa que realiza las pruebas.

Todos tenemos dos copias de cada cromosoma, uno heredado del padre y otro de la madre. Los segmentos coincidentes pueden estar en regiones mitad idénticas, con coincidencias en el cromosoma paterno o materno, o en regiones completamente idénticas (fully identical regions, FIR), con coincidencias tanto en el cromosoma paterno como materno. Las FIRs generalmente sólo se encuentran en hermanos y primos dobles, pero a veces se encuentran en parientes más lejanos si el individuo proviene de una población endogámica.

La longitud de un segmento IBD se puede medir en centiMorgans (unidad de distancia genética) o en megabases (unidad de distancia física).

Un segmento IBD se puede analizar tanto para escalas cortas de tiempo como para miles de años. Según la teoría de la genética de poblaciones, todos los individuos tenemos ancestros comunes en el pasado lejano y, por tanto, todos tenemos segmentos de IBD cortos y antiguos en común. Para el propósito de la genealogía genética el foco lo tenemos puesto en la detección de grandes segmentos de IBD dentro de un marco de tiempo genealógico (efectivamente dentro de las últimas diez generaciones) donde existe la posibilidad de identificar al antepasado común a través de registros documentales.

Después de esta breve introducción, damos paso a los resultados obtenidos del análisis de mi genoma.

Rastros de ADN antiguo en mi genoma

El pasado día 18 de septiembre Davidski lanzó una oferta en su blog que consistía en enviar el genoma personal de todos aquellos que estuvieran interesados en saber con que individuos antiguos y modernos se comparten segmentos IBD, y la cantidad de certimorgans heredados. El conjunto de datos genómicos que se ha utilizado para este análisis es de 3.403 individuos modernos y 67 antepasados antiguos. Para este análisis se ha aplicado el método fastIBD, implementado en BEAGLE v3.3.

Como resultado obtuve la siguiente matriz de muestras antiguas con la cantidad de certimorgans heredados por cada individuo antiguo. También obtuve un listado completo de individuos antiguos y modernos.

He aquí una tabla con la relación de muestras antiguas con las que tengo coincidencias ordenado por la cantidad de certimorgans heredados.

Individuo cM
AAB_Spain_LNCA_ATP2 12.154296
AAB_Unetice_RISE150 9.608421
AAB_Anglo_Saxon_NO3423 9.3617289
AAB_Spain_LNCA_Matojo 8.606585
AAB_Nordic_LN_RISE98 7.6308697
AAB_Spain_LNCA_ATP16 7.18066
AAB_Portugal_MN_LugarCanto44 6.754815
AAB_Portugal_MBA_MonteGato104 6.68850484
AAB_Portugal_MBA_TV32032 6.5379326
AAB_Portugal_LNCA_CovaMoura364 6.4564237
AAB_LaBrana1_LaBrana1 6.397674
AAB_Ireland_MN_Ballynahatty_BA64 6.161949
AAB_Ireland_EBA_Rathlin2_RSK1 5.90511
AAB_Nordic_IA_RISE174 5.69514
AAB_Andronovo_RISE500 5.566669
AAB_Anatolia_N_Bar8 5.382943
AAB_Roman_Britain_6DRIF-21 5.336766
AAB_Portugal_LNCA_CovaMoura9B 5.151194
AAB_Andronovo_RISE505 4.884776
AAB_Bichon_Bichon 4.807908
AAB_Roman_Britain_6DRIF-18 3.87896
AAB_Portugal_MN_LugarCanto42 3.523487
AAB_Portugal_MN_LugarCanto41 3.516834
AAC_Karasuk_outlier_RISE502 3.464467
AAB_Yamnaya_Kalmykia_RISE552 3.452883
AAB_Mezhovskaya_RISE523 3.275702
AAB_Loschbour_Loschbour 3.243495
AAB_Slav_Bohemia_RISE569 3.219847
AAB_Motala_HG_Motala12 3.217487
AAB_Hungary_CA_I1497 3.188648
AAB_LBK_Stuttgart 2.9066
AAB_Ireland_EBA_Rathlin1_RM127 2.805886
AAC_Karasuk_outlier_RISE495 2.775052
AAB_Hungary_N_I1496 2.510278
AAB_Hungary_BA_I1504 2.44784
AAB_Iberia_EN_CB13 2.417861
AAC_Altai_IA_RISE601 2.407046
AAC_Karasuk_outlier_RISE493 2.368364
AAB_Yamnaya_Kalmykia_RISE548 2.339761
AAB_Greece_EN_Rev5 2.28117
AAB_Karasuk_RISE496 2.276359
AAB_Hungary_N_I1506 2.17003
AAB_Oetzi_Oetzi 2.157042
AAB_Roman_Britain_6DRIF-22 2.140597
AAB_Anatolia_N_Bar31 2.082461
AAB_Hungary_N_I1495 2.02615
AAC_Altai_IA_RISE602 1.9552
AAB_Afanasievo_RISE511 1.949347
AAB_Karasuk_RISE499 1.933334
AAB_Unetice_RISE577 1.9324181
AAB_Hungary_IA_IR1 1.91747
AAB_Portugal_LNCA_CabecoArruda122A 1.74305
AAB_Portugal_MBA_TV3831 1.73546
AAB_Portugal_LNCA_DolmenAnsiao96B 1.711982
AAB_Roman_Britain_6DRIF-3 1.585151
AAB_Hungary_BA_RISE479 1.36846
AAB_Greece_LN_Klei10 1.32308
AAB_Greece_LN_Pal7 1.21711


Actualización del 2 de noviembre de 2017

Según la lista de muestras antiguas, parece que tengo más ascendencia cuasi-directa del agricultor del calcolítico de la península Ibérica ATP2, seguida de individuos como Unetice_RISE150 y Anglo_Saxon_NO3423 de la Edad del Bronce del centro-norte europeo. Y más abajo en la lista se puede ver entreverado ibéricos y nórdicos. Una aportación de Luis Aldamiz (Maju).

Y aquí un mapa de distancia genética conseguido con el Método de uniéndose de vecinos (en inglés, Neighbour joining clustering), donde se puede obsevar que me agrupa con Ötzi, el «hombre de hielo» que vivió hacia el 3300 a.C.​.


Haga clic para ampliar la imagen

Este resultado no parece que tenga mucho sentido porque tal y como hemos visto en la tabla anterior he heredado bastantes segmentos IBD de individuos antiguos de Iberia, y entonces... ¿Por qué el método de uniéndose de vecinos me agrupa con Ötzi en lugar de hacerlo con el grupo de Iberia?

La respuesta es porque comparto demasiados certimorgans con los individuos de las Edad del Bronce del Norte y Centro de Europa. Para solucionar este problema podría ser útil eliminar las muestras irrelevantes, como AAC_Altai_IA_*, e incluir a los íberos modernos de la matriz principal.

Un saludo

Fuentes

No hay comentarios:

Publicar un comentario