Búsqueda de sitios de restricción en archivos fasta de secuencias de nucleótidos

Búsqueda de sitios de restricción en archivos fasta de secuencias de nucleótidos

En este ejercicio se buscarán sitios d reconocimiento de enzimas de restricción en secuencias ITS de hongos. Para esto usaremos los archivos .fasta de la carpeta ITS_region que se encuentra en este la carpeta _archivos del repositorio de GitHub de este libro.

Para este ejercicio se debe conocer lo que es un mapa de restricción, que es un gráfico en el que se representan los sitios en los que diferentes enzimas de restricción poseen dianas en una molécula particular de ADN

./img/map_plasmid.png
./img/lineal_map.png

En este ejemplo se seleccionaron las siguientes enzimas de restricción:

./img/enz_restriccion.png

En los siguientes ejercicios se buscarán los sitios de reconocimiento de estas enzimas en la región ITS de diferentes especies de hongos.

8.1 Determinar qué archivo(s) poseen la secuencia de reconocimiento de la enzima EcoRI y cuántas de estas secuencias existen en cada uno de los archivos.


8.2 Determinar qué archivo posee doble o triple secuencia de reconocimiento de las enzimas SmaI y TaiI.


8.3 Especificar el número de la línea donde hubo la o las coincidencias del sitio de reconocimiento de la enzima TaiI del archivo T_delbrueckii.fasta


8.4 La enzima HincII presenta una secuencia de reconocimiento «degenerada», en la que la letra Y puede ser los nucleótidos C o T y la letra R puede ser G o A. Buscar la cantidad de estas secuencias en todos los archivos .fasta de las secuencias ITS.


8.5 Buscar las 10 lineas posteriores y 10 anteriores donde hubo la coincidencia de la enzima EcoRI de todas las secuencias .fasta y almcacenar los resultados en un archivo llamado sitios_rec_EcoRI.fasta. Intenta evitar imprimir el nombre del archivo del que provienen las secuencias.


8.6 Verifica si la secuencia del archivo secuencia.txt está presente en el archivo secuencias.txt.


8.7 Utiliza la información del archivo sites.txt para buscar si estos sitios de restricción estań presentes en los archivos fasta de la carpeta ITS_region y cuántos existen.


8.8 Utilizar la información del archivo sites.txt para buscar todos los sitios de restricción únicos presentes en los archivos fasta de la carpeta ITS_region