Giter Site home page Giter Site logo

majomonteverde / bioinfinvrepro Goto Github PK

View Code? Open in Web Editor NEW

This project forked from aliciamstt/bioinfinvrepro

0.0 0.0 0.0 42.53 MB

repositorio de apuntes y código del curso "Introducción a la bioinformática e investigación reproducible para análisis genéticos" semestre 2018-II

Shell 0.23% R 0.03% HTML 99.74%

bioinfinvrepro's Introduction

Introducción a la bioinformática e investigación reproducible para análisis genéticos

Join the chat at https://gitter.im/BioinfinvRepro2018-II/Lobby

Este es el repositorio de apuntes y código del curso Introducción a la bioinformática e investigación reproducible para análisis genéticos semestre 2018-II, brindado por la profesora Alicia Mastretta Yanes y la super ayuda de Gustavo I. Giles y Verónica Reyes.

Posgrado en Ciencias Biológicas de la Universidad Nacional Autónoma de México.

Los materiales aquí presentados son de acceso libre.

Dónde y cuándo

Martes y Jueves, 8 - 10 am del 30 de enero al 24 de mayo 2018.

Auditorio del Instituto de Ecología, UNAM. (No dejen que me lleve las llaves por favor)

Transmisión online y videos de clases anteriores en este canal de Youtube.

Sala de chat para anuncios de la clase y dudas si lo ests viendo remotamente: en Gitter

Objetivos del curso

El objetivo general del curso es brindar alumna/os con una formación en biología las herramientas computacionales y las mejores prácticas para manejar y explorar una gran cantidad datos de forma reproducible y robusta utilizando software libre, con un enfoque en datos secuenciación masiva y análisis genómicos.

El curso no se enfocará en ningún software especializado particular (e.g. en ensamblado de novo) sino que brindará las herramientas para que los y las alumnas sean capaces de aprender a utilizar por si mismos cualquier software especializado y organizar su propio proyecto bioinformático.

Los objetivos específicos son:

  1. Introducir a los y las alumnas a los principios de investigación reproducible en bioinformática y su importancia
  2. Introducir a los alumnos a Shell para manejo general de datos
  3. Introducir a los y las alumnos al pensamiento lógico y estructurado de la ejecución de un algoritmo
  4. Presentar a los alumnos los tipos de datos genéticos que se analizan con bioinformática
  5. Introducir a los y las alumnas al uso general de software especializado (ensambladores, alineadores, etc)
  6. Enseñar a los y las alumnas cómo organizar un proyecto bioinformático
  7. Formar a los y las alumnas en el uso de R para análisis bioinformáticos y gráficas

Temario

Tema Horas teóricas Horas prácticas
Unidad 1 Bioinformática e investigación reproducible 2 1
1.1. Reproducibilidad y documentación de análisis bioinformáticos
1.2. Repositorios de datos
1.3. Código en computación
1.4. Scripts y repositorios de código
Unidad 2 Introducción a Unix Shell 1 5
2.1. Introducción a la Consola y Línea de Comando
2.2. Funciones básicas de navegación y manejo de archivos
2.3. Funciones básicas de exploración de archivos
2.4. Github
2.4. Redirección
2.5. Loops
Unidad 3 Algoritmos y programación 1 2
3.1. Lógica de la ejecución de un algoritmo
3.2. Modularidad
3.3. Cómo organizar un script
Unidad 4 Organización de un proyecto bioinformático 2 4
4.1. Organización del contenido
4.2. Markdown
4.3. Github para organizar tu proyecto
4.4. Creación de "pipelines" para análisis de datos crudos a resultados
4.5. Correr R desde la terminal
Unidad 5 Docker y software especializado 3 7
5.1. Docker
5.2. Utilidad de software especializado
5.3. Instalación de software especializado
5.4. Documentación de software especializado
Unidad 6 Datos y análisis utilizados en bioinformática 3 7
6.1. Datos crudos (e.g. Illumina raw reads)
6.2. Información en los archivos FASTQ
6.3. Análisis básicos de calidad y preparación de datos
6.4. Datos procesados (e.g. Plink, VCF, BAM)
6.5. Ensambladores de genomas y transcriptomas
6.6. Ensambladores de datos RAD, GBS y símiles
6.7. Mapeo a genoma de referencia
6.8. Metabarcoding y símiles
6.9. Importancia de elección de parámetros en análisis bioinformáticos
Unidad 7 Introducción a R con un enfoque bioinformático 4 9
7.1. R y RStudio
7.2. Funciones básicas de R más importantes para bioinformática
7.3. Limpieza de datos en R
7.4. Graficar en R
7.5. Funciones propias
Unidad 8 Análisis de filogenias y genética de poblaciones 2 9
8.1. Bioconductor y paquetes bioinformáticos en R
8.2. Exploración gráfica y resumen de datos genéticos
8.3. Estimación de parámetros genéticos
8.4. Filogenias

Bibliografía básica

  1. Haddock SHD, Dunn CW (2011) Practical computing for biologists. Sinauer Associates Sunderland, MA.

  2. Buffalo V (2015) Bioinformatics data skills. O’Reilly.

  3. Adler J (2010) R in a nutshell: A desktop quick reference. O’Reilly Media, Inc.

  4. Beckerman AP, Petchey OL (2012) Getting started with R: an introduction for biologists. Oxford University Press 5

Dinámica del curso

¿Cómo serán las clases?

  • Exposición + ejercicos y ejemplos en clase

  • Todos los materiales de la clase los iremos subiendo a GitHub conforme avance el semestre

  • Dejaremos lecturas a casa antes o después de algunos temas. Es una muy buena idea sí leerlas.

  • ¿Necesito una computadora?

    • El curso es teórico-práctico, por lo que se requiere traigan su laptop con Mac o GNU/Linux (no Windows, sorry, lo intenté 2 años y es una pesadilla para todxs) y:
    • Docker instalado y FUNCIONANDO (ocuparemos Docker dentro de un mes)
  • ¿Necesito instalar algo más? Sí

    1. Un editor de texto decente. Listo para la 2da clase. Recomendaciones:
    2. Un editor de Markdown. Listo para la Unidad 6, mejor si desde antes. Recomendaciones:
    3. R y RStudio.

Si van a tomar notas, que sean ahí o en un editor de Markdown, nooooo en Word, de veritas de veritas.

Este repositorio

El repositorio está dividido en un folder por Unidad. Dentro de cada folder subiremos los apuntes y código utilizado en cada clase conforme los vayamos viendo en el semestre, así como los enlaces a las tareas.

Las notas de este repositorio están escritas en formato Markdown y, como notarás, el repositorio se encuentra hospedado en GitHub.

Cubriremos ambas herramientas en el curso, pero en resumen:

  • Markdown es un procesador texto-a-HTML que de forma sencilla permite formatear texto así. Esto es útil para resaltar los los comandos y los resultados de la terminal del resto del texto en los documentos de clase (y en foros de ayuda).

  • GitHub es un repositorio web especializado en software (pero se puede subir cualquier texto, como este). La parte de arriba enlista los archivos y carpetas dentro del repositorio. La nota de texto a su derecha es el comentario que yo realicé al subir o modificar (commit) el archivo de mi computadora a GitHub. En la parte de abajo puedes leer el contenido de dichos archivos en formato html. Y si los bajas los verás en formato Markdown.

Mecanismos de evaluación:

  • 10% Examen parcial

    • Unidades 1-3
  • 40% Tareas fuera del aula

    • Más o menos una tarea por unidad.
    • Se entregan en formato digital y no se reciben después de la fecha límite (salvo que me avisen días antes si su trabajo de campo interfiere con la entrega).
    • En promedio te tomarán 3-5 hrs resolver c/u.
    • Existirán tareas extras opcionales, pero que cuentan para la calificación
  • 5% Participación en clase

    • Pregunten, respondan, discutan.
  • 5% Exposición tema Unidad 5

    • Por equipo según el tipo de datos con el que trabajes
  • 40% Proyecto final con datos propios (si los tienes) o similares disponibles en un repositorio

    • Individual.
    • Debe incluir temas vistos en las unidades 5 a 8

Copiar o plagiar (tareas, exámenes, trabajo final, lo que sea) es motivo suficiente para reprobarte sin lugar a discusión.

Inscripciones

El curso está abierto a cualquier estudiante que pueda acreditarlo en algún posgrado de la UNAM o que desee entrar como oyente. De estudiantes oyentes se espera que realicen las tareas y proyecto igual que el resto lxs estudiantes.

Para una mejor experiencia de clase el cupo es limitado.

Para pre-inscribirte por favor llena este formulario (fecha límite 18 enero 2018, 11:45 pm). La lista definitiva de estudiantes inscritxs la daré a conocer el 19 de enero del 2018 por correo electrónico.

Bienvenida

Gracias por tomar este curso, aquí puedes encontrar la motivación detrás de brindar un curso así y un pequeño resumen de desde dónde estamos comenzando . A final de semestre veremos a dónde llegamos.

bioinfinvrepro's People

Contributors

aliciamstt avatar majomonteverde avatar tavoibrahim avatar gitter-badger avatar julia1512 avatar

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.