Skip to content

crisale84/labgen

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

25 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

a) La carpeta RADcap, contiene los scripts para hacer un ensamble de secuencias de ADN asociadas a los sitios de restricción enzimática (RADseq), de tipo RADcap, 
estos scripts se ejecutan en Miztli o en cualquier computadora con sistema operativo linux.


d) Análisis de estructura poblacional usando el software Structure en la supercomputadora Miztli:

1.- Copia la carpeta software_structure de mi $HOME a tu espacio de trabajo.
2.- Dentro de la carpeta encontrarás la consola que contiene los siguientes archivos:
 extraparams	mainparams	pops2numb.sh	structure	structure.sh
 
  El archivo pops2numb.sh te permitirá cambiar la notación de missing data a la reconocida por Structure (-9), por lo que primero deberás copiar el archivo 
  populations.structure a esta consola:
  
  cp ~/populations_output/populations.structure .

Y posteriormente ejecutar :
    ./pops2numb.sh
    
En la pantalla observarás el número de loci que contiene tu archivo populations.structure

3.-Abre mainparams con nano y deberás reemplazar:     
    #define MAXPOPS XX      // por el número de poblaciones totales que se analizaron en tus datos y se define desde tu popmap.tsv de Stacks
                             // puedes usar: cat populations.structure | cut -f2 |sort |uniq
    #define BURNIN  100000    // cien mil réplicas de burning   
    #define NUMREPS 200000    // doscientos mil iteraciones 
    
    #define NUMLOCI XXX    //por  el número de loci que arrojó pops2numb.sh
    #define NUMINDS XXX    //por el número de individuos en tu archivo, que es igual al número de columnas en populations.structure.modified.tsv entre dos
    
Guarda este archivo sobre-escribiendo el nombre mainparams
    
4.- Ejecuta:
    cat populations.structure| cut -f2 | sort |uniq
    y utiliza ese output para llenar el apartado 3 de pop2numb.sh
    Con nano, abre: pops2numb.sh 
    nano pops2numb.sh
    
    y, en la sección 3, cambia el nombre de las poblaciones por los números que serán reemplazados, observa que existe un 'tab' antes y después de cada población:
    
cat populations.structure.tsv | sed -E \
-e 's/  BocadeCamichin  /	1	/ ' \
-e 's/  Chametla    /	2	/ ' \
-e 's/  Cuautla /	3	/ '  > populations.structure.modified.tsv

    Ejecuta:
    $./pops2numb.sh
    
    
 5.- Por ultimo, con nano abre structure.sh
    nano structure.sh

En el encabezado, seguido de el signo de gato (#) están los parámetros que leerá Miztli a través de bsub, puedes cambiar todo, aquí te dejo lo básico
de básicos, para mayor información puedes seguir la guía de Miztli:

#!/bin/bash
#BSUB -J strkBco              <---- Nombre del Job, solo te permite 10 dígitos    
#BSUB -q q_residual           <---- Nombre de la cola, opciones: q_residual, q_16p_256g , q_32p_256g , q_gpu , q_hpc
#BSUB -oo salida.p1           <----- aquí se guarda tu output, si no cambias el nombre se sobre-escribe, por favor cámbialo.
#BSUB -eo error.p1            <----- aquí se guardan los errores en tu output, lo mismo, si no cambias el nombre se sobre-escriba, por favor cámbialo.
#BSUB -n 6                    <----- Número de nodos, nuestro máximo son 32
#BSUB -R "span[hosts=1]"     <------ NUNCA LO CAMBIES NI MUEVAS, ESTA LÍNEA CONVERGE TODO EL ANÁLISIS A UN PUNTO DE ENTRADA PARA EL OUTPUT Y QUE NO SE
                                     DIFUMINE LA INFORMACIÓN POR DOQUIER, CAMBIARLO PUEDE CAUSAR ERRORES EN LA EJECUCIÓN DE TU SCRIPT

     EN EL CUERPO DE structure.sh:
     
    Cambia el numero de poblaciones por las poblaciones contadas+uno
    Si gustas puedes aumentar el número de réplicas, yo trabajo con 3!
    NO CAMBIES NADA MÁS!
    Guarda con Ctrl+O
    Ahora si, ejecuta: 
    
    $bsub < structure.sh 

Todos los parámetros serán leídos por bsub y ejecutados en Miztli, dependiendo de la cantidad de burning, réplicas que hayas pedido en mainparams
y el número de cores y la cola a la que hayas enviado tu trabajo, este script puede tardar algún tiempo...
puedes consultar el avance de tu trabajo con:

  $bjobs 
  
o bien,

$bjobs 885413      <-------- con el número del Job
    
Una vez terminado se guarda el Job en una carpeta:
results_DIA_MES_AÑO.zip
Esta la puedes descargar a tu computadora personal y ver los resultados en línea
# upload the results.zip file to the web page:  http://taylor0.biology.ucla.edu/structureHarvester/
# example of an aplication to obtain a structure plot http://omicsspeaks.com/strplot2/

También puedes ir a esta página
http://pophelper.com/ y subir tus archivos .meanQ para obtener los resultados graficados en html 

:)


       

About

Genómica Poblacional con RADs, cluster Miztli, UNAM

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors