08简化测序流程2-无参ddrad
一.主流程
没有参考基因组,直接根据序列聚类来做。
1.1配置文件
1.1.1 样品路径
perl /share/nas6/xul/program/ddrad/create_profile_for_ddrad.pl -n -i 邮件里路径/2.clean_data/
注意老师给的数据命名,自动生成的名字是文件名字前缀,老师可能另外要求了编号,-n 表示无参,-i 输入所有测序数据所在的所有目录。
如果老师重新命名,可以自己编写了对照表,第一列是老的名字,第二列是新的名字,一一对应,然后 -l 参数修改生成配置文件中的名字。
## 当下发路径2.clean_data/ZHX-X-3.clean.R1.fq.gz没有对应文件夹时,可以用如下命令
ls /share/nas1/seqloader/ddrad/GP-20221116-5251-2_qinghaidaxuenongmuxueyuan_165samples_ddrad/all_data/2.clean_data/*.fq.gz |
awk -F/ '{split($NF,a,"."); sample=a[1]}
$NF~/R1\.fq\.gz$/{r1=$0}
$NF~/R2\.fq\.gz$/{r2=$0; printf "\t\t%s :\n\t\t\tread1 : %s\n\t\t\tread2 : %s\n", sample, r1, r2}' > tmp.yaml
再修改一下
1.1.2 分组文件(无具体分组)
输入文件group.txt格式如下:
群体1 样本1 样本2 样本3...
样本4 样本5...(自动继承群体1)
群体2 样本6 样本7...
datapath=/share/nas1/seqloader/ddrad/GP-20221116-5251-2_qinghaidaxuenongmuxueyuan_165samples_ddrad/all_data
for i in `ls $datapath/2.clean_data/*.clean.R1.fq.gz`; do filename=$(basename "$i") && echo -e "ALL\t${filename%.clean.R1.fq.gz}"; done > group.txt
分组配置路径填进yaml文件
1.2主流程
主流程:
nohup perl /share/nas6/zhouxy/pipline/stacks-seq/current/stacks.pip.v2.pl -i ddrad_config.yaml -o analysis &
$ nohup perl /share/nas1/yuj/pipline/stacks-seq/v1.0/stacks.pip.v2.pl -i ddrad_config.yaml -o analysis & # 修改了resub循环数,暂时还没验证好不好用
1.3整理结果
perl /share/nas6/xul/program/ddrad/get_result_noref.pl analysis complete_dir
# 无分组.不用管treemix结果
1.4 生成报告
cp /share/nas6/xul/program/ddrad/html_for_ddrad_noref/ddrad_noref_report.cfg . && realpath ddrad_noref_report.cfg
填项目名+物种名
生成报告:
perl /share/nas1/yuj/program/ddrad/html_for_ddrad_noref/ddrad_noref_report.pl -id complete_dir -cfg ddrad_noref_report.cfg # 测序平台改成novaseq 修改电话号码
# perl /share/nas6/xul/program/ddrad/html_for_ddrad_noref/ddrad_noref_report.pl -id complete_dir -cfg ddrad_noref_report.cfg
二.子代与亲本相似度计算(无参简化)
cd xxxx
python3 /share/nas1/yuj/script/Denovo/calculate_similarity.py -h
-i1 samples.pop.snp.recode.vcf
-i2 tags.consensus.fa
-g relationship.txt 三列,f1 parent1 parent2
-o similarity_result.txt