¿Cómo funciona la secuenciación de ADN?

La respuesta original es una muy buena descripción de la secuencia de Sanger. La advertencia es que hoy en día la producción anual de la secuencia de Sanger casi con certeza es eclipsada por una sola ejecución de algunos de los instrumentos modernos.

Hay muchas tecnologías diferentes por ahí y este es un campo en rápida evolución, e incluso dentro de tecnologías específicas hay mucha variación e innovación. Pero aquí hay una descripción general rápida.

La secuenciación de Illumina domina el mercado ahora, y probablemente lo hará por un tiempo más prolongado. Para preparar su ADN para la secuenciación, debe convertirlo en una biblioteca de fragmentos que están delimitados por dos secuencias conocidas (llamadas adaptadores ) y la pieza entre los adaptadores es del orden de 100-700 pares de bases de longitud. Hay una gran cantidad de formas de realizar esto.

La biblioteca se carga en un dispositivo especial llamado celda de flujo , aproximadamente del tamaño de un portaobjetos de microscopio. La superficie de la celda de flujo está cubierta con cebadores de oligonucleótidos que se unirán a secuencias complementarias en los adaptadores. En el esquema original, las moléculas de la biblioteca se distribuyen aleatoriamente a través de la superficie de la celda de flujo. Una PCR especial, llamada puente PCR , se usa para amplificar cada molécula original en un grupo de moléculas idénticas confinadas espacialmente. Se pueden generar millones o incluso miles de millones de clusters en una celda de flujo.

Para secuenciar estos, un cebador se une a otra secuencia que se encuentra en el adaptador. Una mezcla de polimerasa más bases terminator (secuenciación de Sanger ala), cada una marcada con un colorante fluorescente diferente, fluye a través de la celda de flujo (de ahí el nombre). Luego se genera una imagen del patrón de manchas (el secuenciador contiene un microscopio de fluorescencia de muy alta potencia). Así que ahora usted sabe para cada punto que es la primera base después de la base para cada grupo. A continuación, fluyen una serie de sustancias químicas para eliminar la química del terminador (pero no la base) y la etiqueta fluorescente. Ahora repite: esto te da la segunda base. Y así. Esto puede continuar por muchos ciclos, hasta 300 en uno de sus instrumentos. La intensidad y calidad de la señal disminuye con el tiempo porque ninguna de las químicas es 100% eficiente y las moléculas en un grupo

Illumina tiene una química inteligente para eliminar la cadena recién sintetizada (porque contiene errores y algunos dentro de un grupo no son de longitud completa, generan una segunda cadena correcta y eliminan la primera cadena. Ahora todo el proceso puede repetirse comenzando con un cebador específico para la segunda cadena, y mediante este proceso se puede obtener otra cadena de nucleótidos comenzando en el otro extremo de cada fragmento de biblioteca. Dicha química de pares combinada duplica la cantidad de datos de una biblioteca actual (aunque la segunda lectura siempre es de menor calidad) Además, hay juegos computacionales inteligentes que se pueden jugar con los dos extremos, ya que sabes que provienen del mismo fragmento (el registro de la imagen dentro de las carreras es muy preciso).

Los instrumentos Illumina varían en tamaño desde aproximadamente el tamaño de una impresora láser hasta algo del tamaño de un escritorio de oficina, y en precio desde $ 50,000 hasta cientos de miles de dólares.

QIAGEN vende una química que es similar en general (exploración cíclica de ADN clonales secuenciados con nucleótidos del terminador marcados fluorescentemente), pero diferente en casi todos los detalles, lo que no abordaré.

La secuenciación de Ion Torrent también comienza con una biblioteca de fragmentos que van en una celda de flujo, aunque aquí cada población clonal está en su cuenta microscópica, que se ajusta en un pozo similar en la celda de flujo. Se usa PCR en emulsión en lugar de PCR de puente, probablemente principalmente por razones de patente. La polimerasa más los nucleótidos nativos fluyen sobre la celda de flujo como poblaciones puras: un flujo de A y luego un flujo de T, luego C y luego G (o algún otro orden); no hay otros pasos de química aparte de los lavados. Cuando la polimerasa agrega un nucleótido, libera un pirofosfato y un ion de hidrógeno (H +). Los iones de hidrógeno reducen el pH, y la celda de flujo contiene sensores electrónicos para cada pozo que pueden detectar la caída de pH. Como los nucleótidos son nativos (sin modificaciones químicas), si la secuencia complementaria contiene una secuencia del mismo nucleótido, entonces la polimerasa agregará el mismo número de copias del mismo nucleótido (por ejemplo, AA o AAA o AAAA). Sin embargo, la señal no es estrictamente lineal, por lo que un error común en los datos de Ion Torrent es contar mal tales ejecuciones de homopolímero . El secuenciador de Ion Torrent es aproximadamente del tamaño de una impresora láser y alrededor de cien mil dólares.

454 es un instrumento ahora descontinuado realizado anteriormente por el mismo equipo que Ion Torrent. Utilizó una serie inteligente de enzimas para convertir el pirofosfato liberado en destellos de luz, que se obtuvieron imágenes ( pirosecuenciación ). Tenía dificultades similares con las ejecuciones de homopolímeros, pero a veces se acercaba a las lecturas de 1 kilobase.

La secuenciación en tiempo real de la molécula única de Pacific Biosciences (SMRT) es exactamente lo que dice: observa una serie de polimerasas que extienden moléculas individuales en tiempo real. La preparación de la biblioteca empareda sus fragmentos de ADN, que pueden tener decenas de kilobases de longitud, entre dos horquillas para crear un ciclo cerrado. Esto está ligado a la celda de flujo, que tiene polimerasas individuales unidas a ella. Las polimerasas están expuestas a un grupo de nucleótidos marcados con fluorescencia, pero a través de un truco ingenioso ( Guías de onda de modo cero ) el microscopio puede ver las etiquetas solo cuando están en la polimerasa. Cuando la polimerasa encuentra el nucleótido correcto, lo mantiene más tiempo, y así se ve la señal. La etiqueta está en el fosfato, por lo que la incorporación de la base libera la etiqueta. La secuencia de SMRT tiene una alta tasa de error (~% 85 de precisión media), pero los errores son casi completamente estocásticos, por lo que al combinar muchas lecturas de la misma área se puede obtener un consenso de muy alta calidad. Lee también puede ser muy largo – decenas de kilobases. Sin embargo, durante la secuenciación, las etiquetas fluorescentes generan radicales libres que pueden matar a la polimerasa, por lo que en las primeras versiones del sistema, la distribución de longitud de lectura disminuyó como una curva exponencial; las químicas más nuevas reducen este efecto. El secuenciador más reciente de Pacific Biosciences tiene aproximadamente el tamaño de un pequeño escritorio y es de varios cientos de miles de dólares.

La secuenciación de Oxford Nanopore es otra técnica de una sola molécula. Las moléculas de la biblioteca se conducen a través de un poro minúsculo en una membrana y, al hacerlo, las interacciones con el poro cambian la conductancia eléctrica a través del poro, que es detectado por sensores electrónicos cercanos. Debido a que varias bases a la vez interactúan con el poro, la señal no es una simple lectura de la secuencia, sino que debe procesarse. Nanopore tiene tres propiedades inusuales con respecto a las tecnologías discutidas anteriormente. Primero, una vez que un poro ha terminado de leer una molécula, puede comenzar a leer otra; en todas las demás tecnologías anteriores, un elemento activo en la célula de flujo puede secuenciar como máximo una molécula de ADN. En segundo lugar, se puede instruir al poro para que rechace una molécula que ha estado secuenciando (secuenciación selectiva en tiempo real, también conocida como lectura hasta). En tercer lugar, las células de flujo se pueden lavar y reutilizar (no para siempre). Lo más destacable es que el primer secuenciador de Oxford Nanopore, llamado MinION, cabe fácilmente en el bolsillo de una camisa, sale de un puerto USB3 y cuesta solo $ 1K. La secuenciación de Nanopore tiene una alta tasa de error y problemas con los homopolímeros, pero el costo y el factor de forma la están llevando a aplicaciones de campo y educativas que son muy difíciles o imposibles con las otras plataformas.

He omitido la secuenciación por ligadura, la secuenciación de moléculas individuales de Helicos y una serie de otras tecnologías que nunca llegaron al mercado o que aún no llegaron al mercado.

Hay algunas maneras diferentes de secuenciar el ADN, pero uno de los métodos más básicos se conoce como el método de terminación de cadena. Fue desarrollado en 1977 por Frederick Sanger y fue ampliamente utilizado durante dos décadas más o menos. Como sugiere su nombre, este método de secuenciación de ADN terminará el alargamiento de la cadena de ADN debido a la incorporación de didesoxinucleótidos (ddNTP). Los ddNTP no tienen el grupo 3′-hidroxilo que tienen los desoxinucleótidos (nucleótidos normales), por lo que la ADN polimerasa no puede alargar la cadena de ADN si se incorpora un ddNTP. Esto sería porque la ADN polimerasa solo puede agregar nucleótidos en una dirección de 5 ‘a 3’ y debe formar un enlace covalente entre el extremo 5 ‘de un nucleótido y el 3’ del anterior. Con un ddNTP en su lugar, la ADN polimerasa no puede unir más nucleótidos normales a la cadena debido al grupo hidroxilo que falta en el ddNTP.

La forma más antigua de realizar esta reacción de secuenciación requiere cuatro cámaras de reacción. Cada uno de los cuatro tubos contendría: el segmento de ADN a secuenciar, los cuatro desoxinucleótidos (normal) y uno de los ddNTP (cada tubo contiene uno diferente de los cuatro). Luego, esta mezcla se someterá a PCR, durante la cual la ADN polimerasa sintetizaría ADN de todos los nucleótidos en la mezcla. Sin embargo, siempre que se tomara un ddNTP en lugar de un nucleótido regular, la síntesis de ADN terminaría. Por lo tanto, si el filamento terminara en la cámara que contiene ddATP, esto indicaría que la cadena de ADN tenía una molécula de timidina donde el alargamiento de la cadena se detuvo (A se une a T). Con la gran cantidad de replicaciones de ADN que tienen lugar en la PCR, los ddNTP generalmente se unirán a cada uno de sus nucleótidos del complemento en la cadena de ADN y detendrán su elongación en esa cadena. La probabilidad juega un papel en este método de secuencia, pero por lo general procede sin problemas.
Una vez que las cuatro reacciones se completan, se someten a electroforesis; las cadenas de ADN difieren en longitud debido a los ddNTP de terminación y, por lo tanto, se diferenciarán en la electroforesis en gel en función de la longitud. Entonces, puede secuenciar el ADN en función de la distancia recorrida por el segmento de ADN en la electroforesis y de la cámara de reacción (por ejemplo, la banda más cercana al punto de partida era desde la cámara ddCTP, lo que significa que el primer nucleótido en la cadena de ADN fue guanosina).

Hoy en día, se puede agregar una etiqueta fluorescente a los ddNTP, un color diferente para cada uno, de modo que solo se necesita una cámara de reacción. Una vez que finaliza la reacción, una máquina de secuenciación puede pasar la muestra de ADN y detectar la fluorescencia del ddNTPS, secuenciando el ADN según el color fluorescente detectado en cada segmento de ADN.

Los diferentes procedimientos incluyen Mapeo híbrido de radiación, FISH (Hibridación fluorescente in situ), BAC y YAC también se utilizan para secuenciar el ADN. Ambos mapas genéticos y físicos se utilizan para secuenciar el ADN de la especie dada .
La secuenciación del genoma es un campo joven pero en evolución. Al principio, la posibilidad de secuenciar genomas eucariotas completos se aplicaba naturalmente a aquellos para los que los datos biológicos ya eran los más abundantes. Hoy en día, sin embargo, estamos recurriendo al mapeo de varias especies, según nuestro requisito.

No es tan fácil como parece. La secuenciación del ADN requiere la secuenciación de diferentes segmentos de ADN, y cada segmento conlleva sus propias dificultades para la secuenciación. De manera similar, los procedimientos para mapear varios segmentos (como Micro-satélites, Macro-satélites, UTRs, etc.) son totalmente diferentes entre sí.

Consulte el libro “Asignación y secuenciación del genoma” para su interés.

¡Buena suerte!