1. Resumen

El objetivo de este tema es aprender sobre archivos de texto y algunos de los formatos más utilizados en Bioinformática (Fasta, Fastq, BED y PDB), cómo visualizar estos archivos usando diferentes editores de texto (nano, vim y JupyterLab), y el procesamiento de ficheros desde la terminal usando diferentes comandos (grep, sed, cut, sort, uniq y pipes) y expresiones regulares.

  1. Resumen

  2. Archivos y formatos comunes en Bioinformática

  3. Editores de texto

  4. Expresiones regulares (regex)

  5. Grep

  6. Sed

  7. Cut Sort

  8. Pipes

  9. Respuestas ejercicios deber

1.1. Notas adicionales

Nota importante

Ingresa al directorio donde guardas el material del curso si no lo has hecho ya y activa tu ambiente de conda. Si seguiste las instrucciones del capítulo dos de JuptyterLab sería ~/taller_unix. Sigue las instrucciones de abajo si necesitas ayuda.

$ cd ~/taller_unix/
$ conda activate bash
$ jupyter lab

Ahora que has accedido a Jupyter Lab crea un notebook para que puedas hacer los ejercicios dentro. Debes entregar un notebook recopilando todos los ejercicios hechos en este capítulo. Los ejercicios son preguntas y pequeños ejercicios que hay en los diferentes temas, los que han sido marcados con la etiqueta de Pregunta. El notebook debería tener esta ubicación en tu computador: ~/taller_unix/4_ficheros/deber_3.ipynb. Organiza los ejercicios en diferentes celdas del Jupyter notebook por tema y sub-sección.

Tip

Aunque el deber se debe entregar en un jupyter notebook, todo esto se puede hacer en Terminal. Te sugiero que hagas los ejercicios primero en Terminal y luego, cuando tengas la seguridad de que los entiendes, los vuelves a hacer desde un jupyter notebook.