培训大纲
一.测序原理
1. illumina 测序原理;2. PacBio 测序原理;3. Nanopore 测序原理
二.Linux 基础
1.Linux 简介;2.远程登陆;3. 数据传输;4. Linux 常用命令
三.重测序分析软件流程部署
1. 过滤质控软件:fastqc、fastp;2. 比对和变异检测:bwa、samtools、picard、bedtools、bcftools、vcftools、GATK4、lumpy、 cnvnator 等;3. 变异注释:snpeff、annovar;4. 群体研究:plink、admixture、phylip , SNPphylo、PopLDdecay 等;5. GWAS :emmax、qqman 等;6. BSA:QTLseqr;7. 基因课全套分析流程部署
四.任务练习
1. 任务一:使用 fastp 进行测序数据的过滤和质控;2. 任务二:油脂合成相关基因家族分析案例实操;3. 高级命令:awk、sed、grep、uniq、sort 、wc、xargs 等;4. 任务的后台运行;5. 任务的监控和管理。
五.变异检测原理
1. 变异检测原理及方法;2. sam/bam文件介绍;3. vcf/gvcf, ped/bed文件介绍
六.SNP、InDel检测实操
1. 使用 bwa 进行比对;2. 比对结果排序和去重复;3. 对结果统计;4. 使用 GATK 进行 SNP 和 InDel 检测
七.SV、CNV检测实操
1. 使用 lumpy 进行 SV 检测;2. 使用 cnvnator 进行 CNV 检测
八.变异注释
1. 使用 annovar 进行 SNP 和 InDel 注释;2. 使用 snpeff 进行 SNP 和 InDel 注释;3. 基于 overlap 方法对 SV 及 CNV 进行注释
九.群体结构分析原理
1. 进化树构建原理;2. 主成分分析;3. STRUCTURE 分析;4. 连锁不平衡分析
十.进化树构建和 STRUCTURE 分析
1. 使用ML和NJ法构建进化树;2. 进化树作图展示;3. 使用 admixture 进行 STRUCTURE 分析;4. STRUCTURE 绘图展示
十一.PCA 分析和 LD 衰减分析
1. 使用 plink 进行 PCA 分析;2. PCA 分析结果绘图展示;3. 使用 PopLDdecay 进行 LD 衰减分析;4. LD 衰减分析绘图展示
十二.群体选择分析原理
1. 自然选择的分类;2. 正选择的检测方法;3. π、TajimaD、Fst 及 ROD
十三.群体选择分析实操
1. 使用 vcftools 计算π、TajimaD、Fst等;2. π、TajimaD、Fst 及 ROD 结果展示;3. 提取受选择基因
十四.GWAS 分析原理
1. GWAS 分析原理讲解;2. 曼哈顿图介绍;3. QQ-plot 图介绍
十五.GWAS分析实操
1. 亲缘关系矩阵计算;2. 使用 emmax 进行 GWAS 分析;3. GWAS 结果绘图展示
十六.BSA 分析原理
1. 混池测序及 SNP-index;2. QTL-seq 分析原理;3. Mutmap 分析原理;4. qtl-seq 分析实操