Plataforma de genotipificación

SeeD se ha embarcado en la caracterización de la composición genética de hasta 200,000 muestras de trigo y maíz, incluyendo accesiones de bancos de germoplasma y materiales de programas de pre-mejoramiento. Este esfuerzo generará una de las bases de datos más completas que describen la diversidad genética de dos de los principales cultivos alimenticios de la humanidad. Dichos conjuntos de datos servirán como un marco unificador para los participantes del proyecto y servirán para integrar los datos fenotípicos adquiridos para diferentes subconjuntos de muestras y propósitos en diferentes lugares y tiempos.

Germinación de semillas de accesiones de maíz para extracción de ADN (30 plantas individuales por accesión; tres accesiones por bandeja. ©2012 (CIMMYT)

Las tecnologías de marcadores moleculares están en una transición de métodos de “genotipificación por ensayo”, hacia métodos de “genotipificación por secuenciación” (GBS, por sus siglas en inglés). Dicha transición es similar a la de la fotografía análoga cuando migró hacia la fotografía digital. Los métodos tradicionales de genotipificación por ensayo se basan en ensayos que detectan los polimorfismos de ADN, de manera indirecta, a través de las diferencias en la movilidad de los fragmentos de ADN en geles, la amplificación diferencial por PCR, o la hibridación diferencial a microarreglos. La caída de un orden de magnitud en el costo por base en plataformas de secuenciación de nueva generación, hace posible omitir el paso de desarrollo del ensayo y usar estas plataformas de secuenciación, no sólo para descubrir, sino también para la clasificación directa de los polimorfismos de ADN en los ensayos rutinarios de genotipificación (Elshire et al. 2001, Sansaloni et al. 2011 .

Equipo que coordina la extracción de ADN y sus aspectos logísticos. Primer fila (desde la izquierda a la derecha): Ángel Galindo Fernández, Oscar Ernesto Perez Soriano,Raymundo Blancas Márquez, Facundo Cristian Flores Cano, Ricardo Benavides Alfaro, Martin Rodriguez Espinoza; segunda fila (desde la izquierda a la derecha): María del Socorro Badillo Lopez, Noemi Ortega Jiménez, Sheila Salcido Leyva, María Fabiola Hernandez Leyva, Tania Salcido Leyva, Rosaura Almeraya Quintero, Nizayet Anahí Salas Victores, Martha Lidia Deheza Villejas; tercer fila (de izquierda a derecha): Jorge Alvarado Blancas, Irene Nayeli Benítez Hernandez, Gustavo Alberto Martinez Rodriguez, Sarah Hearne, Emmanuel Baños Galindo, Antonieta Díaz Gutiérrez. ©2012 (CIMMYT)

GBS se basa en re-secuenciar una pequeña y bien definida fracción del genoma (una “representación genómica”), que corresponde a 0.1-1% del genoma. Las representaciones de genomas se preparan usando métodos de “reducción de complejidad” que seleccionan de forma reproducible un subconjunto bien definido de loci de ADN (“etiquetas”) del genoma. Para SeeD, nos concentramos en métodos de reducción de complejidad, basados en enzimas de restricción (ER), métodos que son esencialmente una extensión de la tecnología de marcadores de DArT (Diversity Arrays Technology) (Jaccoud et al. 2001, Wenzl et al. 2004)

Los métodos de GBS, en principio, pueden detectar dos tipos de polimorfismo de ADN:

  • Polimorfismos de un solo nucleótido (SNP, por sus siglas en inglés), que se pueden identificar mediante la comparación de las diferentes variantes de una etiqueta de secuencia sencilla, amplificadas a partir del ADN genómico de diferentes individuos.
  • Variantes de presencia/ausencia (PAV, por sus siglas en inglés), que son causadas por polimorfismos de ADN que conduce a la incorporación o exclusión de segmentos genómicos (etiquetas) en la representación del genoma. En el caso de los métodos de reducción de complejidad basados en ER, éstos incluyen InDels y SNP que afectan a los sitios de reconocimiento de las ER utilizadas. En caso de que se utilicen ER susceptibles a la metilación del ADN, los polimorfismos de metilación en los sitios de reconocimiento de ER también pueden causar PAV.

A pesar de algunas limitaciones, GBS tiene una variedad de ventajas estratégicas para un proyecto como SeeD. La más importante, sin duda, es la capacidad de cuantificar las relaciones o distancias genéticas con un sesgo de evaluación muchísimo menor que los microarreglos de SNP. También existe la posibilidad de estimar las frecuencias alélicas dentro de, y las distancias genéticas entre muestras mixtas de ADN, cada una derivada de una población de varios individuos genéticamente distintos (por ejemplo, muestras de variedades criollas de maíz).

Ensayo de caracterización de trigo de gran escala que también se utilizó para la extracción de ADN de una planta representativa por cada accesión. ©2012 (CIMMYT)

Dependiendo del cultivo y el propósito del ensayo de genotipificación, usamos diferentes implementaciones de GBS, desarrolladas por Diversity Arrays Technology (DArT) y el Instituto para Diversidad Genómica (IGD por sus siglas en inglés) para (a) el análisis de la diversidad del maíz (DArT), (b) el mapeo de asociación en maíz (IGD), y (c) el análisis de la diversidad y mapeo de asociación en trigo (DArT). Éstas difieren en el número de marcadores obtenidos (~ 30,000-750,000), el porcentaje de datos faltantes (~20-60%), y la posibilidad de identificar heterocigotos. Las etiquetas de secuencias analizadas por GBS pueden alinearse con una secuencia de un genoma de referencia.

En el caso del maíz, nuestros colegas de LANGEBIO están generando un genoma de referencia más versátil, volviendo a secuenciar los genomas completos de un conjunto de materiales derivados de variedades criollas tropicales. En el trigo, utilizaremos como referencia una colección de etiquetas GBS no-redundantes que se han identificado de manera reproducible en las accesiones analizadas hasta el momento. Esta colección se actualizará periódicamente y las etiquetas individuales con el tiempo se alinearán con la secuencia del genoma del trigo cuando esté disponible.

Para obtener más información, escríbanos a: seed@masagro.org