¿Cómo funciona la secuenciación de ADN? Doctor Cirdy

La respuesta original es una muy buena descripción de la secuencia de Sanger. La advertencia es que hoy en día la producción anual de la secuencia de Sanger casi con certeza es eclipsada por una sola ejecución de algunos de los instrumentos modernos.

Hay muchas tecnologías diferentes por ahí y este es un campo en rápida evolución, e incluso dentro de tecnologías específicas hay mucha variación e innovación. Pero aquí hay una descripción general rápida.

La secuenciación de Illumina domina el mercado ahora, y probablemente lo hará por un tiempo más prolongado. Para preparar su ADN para la secuenciación, debe convertirlo en una biblioteca de fragmentos que están delimitados por dos secuencias conocidas (llamadas adaptadores ) y la pieza entre los adaptadores es del orden de 100-700 pares de bases de longitud. Hay una gran cantidad de formas de realizar esto.

La biblioteca se carga en un dispositivo especial llamado celda de flujo , aproximadamente del tamaño de un portaobjetos de microscopio. La superficie de la celda de flujo está cubierta con cebadores de oligonucleótidos que se unirán a secuencias complementarias en los adaptadores. En el esquema original, las moléculas de la biblioteca se distribuyen aleatoriamente a través de la superficie de la celda de flujo. Una PCR especial, llamada puente PCR , se usa para amplificar cada molécula original en un grupo de moléculas idénticas confinadas espacialmente. Se pueden generar millones o incluso miles de millones de clusters en una celda de flujo.

Para secuenciar estos, un cebador se une a otra secuencia que se encuentra en el adaptador. Una mezcla de polimerasa más bases terminator (secuenciación de Sanger ala), cada una marcada con un colorante fluorescente diferente, fluye a través de la celda de flujo (de ahí el nombre). Luego se genera una imagen del patrón de manchas (el secuenciador contiene un microscopio de fluorescencia de muy alta potencia). Así que ahora usted sabe para cada punto que es la primera base después de la base para cada grupo. A continuación, fluyen una serie de sustancias químicas para eliminar la química del terminador (pero no la base) y la etiqueta fluorescente. Ahora repite: esto te da la segunda base. Y así. Esto puede continuar por muchos ciclos, hasta 300 en uno de sus instrumentos. La intensidad y calidad de la señal disminuye con el tiempo porque ninguna de las químicas es 100% eficiente y las moléculas en un grupo

Illumina tiene una química inteligente para eliminar la cadena recién sintetizada (porque contiene errores y algunos dentro de un grupo no son de longitud completa, generan una segunda cadena correcta y eliminan la primera cadena. Ahora todo el proceso puede repetirse comenzando con un cebador específico para la segunda cadena, y mediante este proceso se puede obtener otra cadena de nucleótidos comenzando en el otro extremo de cada fragmento de biblioteca. Dicha química de pares combinada duplica la cantidad de datos de una biblioteca actual (aunque la segunda lectura siempre es de menor calidad) Además, hay juegos computacionales inteligentes que se pueden jugar con los dos extremos, ya que sabes que provienen del mismo fragmento (el registro de la imagen dentro de las carreras es muy preciso).

¿Por qué los humanos comparten mucho de su ADN con plátanos?

¿Cuál sería el efecto si tuvieras que tomar ADN de tigre e inyectarlo en un cuerpo humano?

¿Por qué el tejido postmiotótico requiere una alta demanda respiratoria?

¿Qué pasó con las teorías de que el LSD cambia tu ADN / afecta los cromosomas desde la década de 1960?

Biología sintética: ¿sería posible construir un organismo vivo con ácidos nucleicos xeno (XNA)? ¿Y cuáles serían las consecuencias de eso?

Los instrumentos Illumina varían en tamaño desde aproximadamente el tamaño de una impresora láser hasta algo del tamaño de un escritorio de oficina, y en precio desde $ 50,000 hasta cientos de miles de dólares.

QIAGEN vende una química que es similar en general (exploración cíclica de ADN clonales secuenciados con nucleótidos del terminador marcados fluorescentemente), pero diferente en casi todos los detalles, lo que no abordaré.

La secuenciación de Ion Torrent también comienza con una biblioteca de fragmentos que van en una celda de flujo, aunque aquí cada población clonal está en su cuenta microscópica, que se ajusta en un pozo similar en la celda de flujo. Se usa PCR en emulsión en lugar de PCR de puente, probablemente principalmente por razones de patente. La polimerasa más los nucleótidos nativos fluyen sobre la celda de flujo como poblaciones puras: un flujo de A y luego un flujo de T, luego C y luego G (o algún otro orden); no hay otros pasos de química aparte de los lavados. Cuando la polimerasa agrega un nucleótido, libera un pirofosfato y un ion de hidrógeno (H +). Los iones de hidrógeno reducen el pH, y la celda de flujo contiene sensores electrónicos para cada pozo que pueden detectar la caída de pH. Como los nucleótidos son nativos (sin modificaciones químicas), si la secuencia complementaria contiene una secuencia del mismo nucleótido, entonces la polimerasa agregará el mismo número de copias del mismo nucleótido (por ejemplo, AA o AAA o AAAA). Sin embargo, la señal no es estrictamente lineal, por lo que un error común en los datos de Ion Torrent es contar mal tales ejecuciones de homopolímero . El secuenciador de Ion Torrent es aproximadamente del tamaño de una impresora láser y alrededor de cien mil dólares.

454 es un instrumento ahora descontinuado realizado anteriormente por el mismo equipo que Ion Torrent. Utilizó una serie inteligente de enzimas para convertir el pirofosfato liberado en destellos de luz, que se obtuvieron imágenes ( pirosecuenciación ). Tenía dificultades similares con las ejecuciones de homopolímeros, pero a veces se acercaba a las lecturas de 1 kilobase.

La secuenciación en tiempo real de la molécula única de Pacific Biosciences (SMRT) es exactamente lo que dice: observa una serie de polimerasas que extienden moléculas individuales en tiempo real. La preparación de la biblioteca empareda sus fragmentos de ADN, que pueden tener decenas de kilobases de longitud, entre dos horquillas para crear un ciclo cerrado. Esto está ligado a la celda de flujo, que tiene polimerasas individuales unidas a ella. Las polimerasas están expuestas a un grupo de nucleótidos marcados con fluorescencia, pero a través de un truco ingenioso ( Guías de onda de modo cero ) el microscopio puede ver las etiquetas solo cuando están en la polimerasa. Cuando la polimerasa encuentra el nucleótido correcto, lo mantiene más tiempo, y así se ve la señal. La etiqueta está en el fosfato, por lo que la incorporación de la base libera la etiqueta. La secuencia de SMRT tiene una alta tasa de error (~% 85 de precisión media), pero los errores son casi completamente estocásticos, por lo que al combinar muchas lecturas de la misma área se puede obtener un consenso de muy alta calidad. Lee también puede ser muy largo – decenas de kilobases. Sin embargo, durante la secuenciación, las etiquetas fluorescentes generan radicales libres que pueden matar a la polimerasa, por lo que en las primeras versiones del sistema, la distribución de longitud de lectura disminuyó como una curva exponencial; las químicas más nuevas reducen este efecto. El secuenciador más reciente de Pacific Biosciences tiene aproximadamente el tamaño de un pequeño escritorio y es de varios cientos de miles de dólares.

La secuenciación de Oxford Nanopore es otra técnica de una sola molécula. Las moléculas de la biblioteca se conducen a través de un poro minúsculo en una membrana y, al hacerlo, las interacciones con el poro cambian la conductancia eléctrica a través del poro, que es detectado por sensores electrónicos cercanos. Debido a que varias bases a la vez interactúan con el poro, la señal no es una simple lectura de la secuencia, sino que debe procesarse. Nanopore tiene tres propiedades inusuales con respecto a las tecnologías discutidas anteriormente. Primero, una vez que un poro ha terminado de leer una molécula, puede comenzar a leer otra; en todas las demás tecnologías anteriores, un elemento activo en la célula de flujo puede secuenciar como máximo una molécula de ADN. En segundo lugar, se puede instruir al poro para que rechace una molécula que ha estado secuenciando (secuenciación selectiva en tiempo real, también conocida como lectura hasta). En tercer lugar, las células de flujo se pueden lavar y reutilizar (no para siempre). Lo más destacable es que el primer secuenciador de Oxford Nanopore, llamado MinION, cabe fácilmente en el bolsillo de una camisa, sale de un puerto USB3 y cuesta solo $ 1K. La secuenciación de Nanopore tiene una alta tasa de error y problemas con los homopolímeros, pero el costo y el factor de forma la están llevando a aplicaciones de campo y educativas que son muy difíciles o imposibles con las otras plataformas.

He omitido la secuenciación por ligadura, la secuenciación de moléculas individuales de Helicos y una serie de otras tecnologías que nunca llegaron al mercado o que aún no llegaron al mercado.