08简化测序流程2-无参ddrad

一.主流程

没有参考基因组，直接根据序列聚类来做。

1.1配置文件

1.1.1 样品路径

perl /share/nas6/xul/program/ddrad/create_profile_for_ddrad.pl -n -i 邮件里路径/2.clean_data/
注意老师给的数据命名，自动生成的名字是文件名字前缀，老师可能另外要求了编号，-n 表示无参，-i 输入所有测序数据所在的所有目录。
如果老师重新命名，可以自己编写了对照表，第一列是老的名字，第二列是新的名字，一一对应，然后 -l 参数修改生成配置文件中的名字。

## 当下发路径2.clean_data/ZHX-X-3.clean.R1.fq.gz没有对应文件夹时，可以用如下命令
ls /share/nas1/seqloader/ddrad/GP-20221116-5251-2_qinghaidaxuenongmuxueyuan_165samples_ddrad/all_data/2.clean_data/*.fq.gz | 
awk -F/ '{split($NF,a,"."); sample=a[1]} 
$NF~/R1\.fq\.gz$/{r1=$0} 
$NF~/R2\.fq\.gz$/{r2=$0; printf "\t\t%s :\n\t\t\tread1 : %s\n\t\t\tread2 : %s\n", sample, r1, r2}'  > tmp.yaml
再修改一下

1.1.2 分组文件（无具体分组）

输入文件group.txt格式如下：
群体1    样本1 样本2 样本3...
        样本4 样本5...（自动继承群体1）
群体2    样本6 样本7...

datapath=/share/nas1/seqloader/ddrad/GP-20221116-5251-2_qinghaidaxuenongmuxueyuan_165samples_ddrad/all_data
for i in `ls $datapath/2.clean_data/*.clean.R1.fq.gz`; do filename=$(basename "$i") && echo -e "ALL\t${filename%.clean.R1.fq.gz}"; done > group.txt
分组配置路径填进yaml文件

1.2主流程

主流程： 
nohup perl /share/nas6/zhouxy/pipline/stacks-seq/current/stacks.pip.v2.pl -i ddrad_config.yaml -o analysis &
$ nohup perl /share/nas1/yuj/pipline/stacks-seq/v1.0/stacks.pip.v2.pl -i ddrad_config.yaml -o analysis & # 修改了resub循环数,暂时还没验证好不好用

1.3整理结果

perl /share/nas6/xul/program/ddrad/get_result_noref.pl  analysis complete_dir
# 无分组.不用管treemix结果

1.4 生成报告

cp /share/nas6/xul/program/ddrad/html_for_ddrad_noref/ddrad_noref_report.cfg . && realpath ddrad_noref_report.cfg
填项目名+物种名

生成报告:
perl /share/nas1/yuj/program/ddrad/html_for_ddrad_noref/ddrad_noref_report.pl -id  complete_dir -cfg ddrad_noref_report.cfg # 测序平台改成novaseq 修改电话号码
# perl /share/nas6/xul/program/ddrad/html_for_ddrad_noref/ddrad_noref_report.pl -id  complete_dir -cfg ddrad_noref_report.cfg

二.子代与亲本相似度计算(无参简化)

cd xxxx
python3 /share/nas1/yuj/script/Denovo/calculate_similarity.py -h

  -i1 samples.pop.snp.recode.vcf
  -i2 tags.consensus.fa
  -g relationship.txt    三列,f1 parent1 parent2
  -o similarity_result.txt