Puede ser bastante complicado, y solía ser mucho más complicado. La porción de codificación de los genes casi siempre comienza con el código de tres letras ‘ATG’ y a menudo termina con algo como ‘TTA’ o TTC, eso ayuda un poco si ya tienes la secuencia de ADN alrededor del área del gen.
La forma en que las personas a menudo lo hacen ahora es utilizando una tecnología de secuenciación llamada RNAseq. En lugar de secuenciar el ADN, secuencia el ARNm producido durante la transcripción. De esta forma permitimos que los procesos metabólicos de las células nos digan dónde se inicia y se detiene un gen y cómo los intrones y exones se unen o se corrigen en el caso de los eucariotas.
luego puedes usar una herramienta de alineación de sequwnxe para alinear los resultados de la secuencia de tu experimento con el sequwnxe de ADN del que crees que proviene el gen y encontrarlo donde coincida.