Extracción de información de archivo de experimento de microarray

Extracción de información de archivo de experimento de microarray

En este ejercicio se obtendrá información de un archivo obtenido de un experimento de microarray, en el que se calcula la expresión génica de una muestra. Para esto usaremos el archivo microarray.txt que se encuentra en este la carpeta _archivos del repositorio de GitHub de este libro.

7.1 Determinar el número genes relacionados con la leucemia (en el documento se encuentra como leukemia). En este caso esto se determinará por la presencia del nombre de la enfermedad en los nombres de los genes.


7.2 De todo el registro, solo queremos el nombre y la descripción de los genes relacionados con leucemia (campos/columnas 3 y 4 del archivo), lo que se desea copiar a un archivo llamado genes_leucemia.txt.


7.3 Se desea eliminar las comillas de los nombres y descripción de los genes relacionados con leucemia, obtenidos en el archivo del literal anterior, y guardar los cambios en el mismo archivo genes_leucemia.txt.


7.4 Ahora, se desea ordenar alfabéticamente los genes del archivo genes_leucemia.txt y eliminar los genes repetidos. Con estos cambios, guardar el resultado en un archivo llamado genes_leucemia_ord_uniq.txt


7.5 Finalmente, se desea determinar el número de genes que estaban repetidos