Skip to content

gdengchao/lab_419

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 

Repository files navigation

lab_419--工具集

sample:添加的例子

目录

一、数据获取

  • 1、ncbi 查找SRR号通过sratoolkit下载
  • 2、ncbi_jp 获取链接通过wget下载
  • 3、 hmp
  • 4、 Aspera:快速下载SRR等文件
  • 1、kmc:计算kmer频度
  • 2、metaphlan:测序数据转丰度数据
  • 3、sratoolkit:下载srr文件,并转换为fasta格式
  • 4、fastq转fasta
awk '{if(NR%4 == 1){print ">" substr($0, 2)}}{if(NR%4 == 2){print}}' fastq > fasta
  • 1、cafe:多种距离计算方式
  • 2、Afnn:alignment-free计算方法
  • 3、mash:依据kmer缺失计算
  • 4、skmer:mash优化后的
  • 1、mega:距离矩阵转进化树图
  • 2、树距离计算
    • 2.1、philp:Symmetric difference
    • 2.2、Mothur::Parsimony
    • 2.3、TreeCmp:the triples distance

工具介绍:

sample:

  • 简易使用:
sample

二、数据处理:

kmc:

  • 简易使用:
kmc -k8 -ci2 -cs65536000 -t10 -fm -b -v input output1 ./
kmc_dump2 ouput1  ouput 
#output1由一产生,kmc_dump2产生二进制文件,kmc_dump产生十进制

metaphlan:

  • 简易使用:
 metaphlan2.py SRS014476-Supragingival_plaque.fasta.gz  --input_type fasta > SRS014476-Supragingival_plaque_profile.txt
单线程
zcat  CSM9X23N_R1.fastq.gz CSM9X23N_R2.fastq.gz | metaphlan --input_type fastq 
//一般使用双端fastq作管道输入

--nproc 4 。4线程

 merge_metaphlan_tables.py *_profile.txt > merged_abundance_table.txt
将所有的结果合起来

 metaphlan_hclust_heatmap.py -c bbcry --top 25 --minv 0.1 -s log --in merged_metaphlan2.txt --out abundance_heatmap.pdf
可视化

sratoolkit:

  • 简易使用:
/home/yingwang/data1/wangying/wangkun/sratoolkit.2.9.0-ubuntu64/bin/prefetch -X 41943040 SRR8307275    ----下载

fastq-dump  ./SRR***.sra -O ./   ---转fastq

fastq-dump  --fasta  ./SRR306998.sra  -O ./   ----转---fasta
  • 支持文档:

三、距离计算:

cafe:

  • 简易使用:
 ./cafe_linux -M 0 -O 27ecoli -S 27ecoli -T plain -I  /home/yingwang/jiaxing/27ecoli/E.coli-APECO1.fna,/home/yingwang/jiaxing/27ecoli/E.coli-C-ATCC-8739.fna  -K 14 -D Ma

Afann:

  • 简易使用:
python afann.py -r -a d2star,d2shepp -k 5 -m 0 -f test_file.txt -t 8 -d test_count/ -o test_result/ --adjust

skmer:

  • 简易使用:
./mash sketch /home/yingwang/jiaxing/MammalianGut_Fna/*C.fna  /home/yingwang/jiaxing/MammalianGut_Fna/*H.fna -k 14 -o mammaliangutmash14
./mash dist mammaliangutmash14.msh mammaliangutmash14.msh >mammaliangutmash14dist

skmer:

  • 简易使用:
构建参考树
skmer reference ref_dir -p 4 -o [distance_dir] -l [library_dir]
计算数据库中两两距离
skmer distance library -t(tree) -o jc-dist-mat
计算输入序列与数据库的距离
skmer query qry.fastq library -o output_prefix

四、数据分析

mega:

  • 简易使用: 输入是R处理好的nwk文件,可以多棵树同时操作,放大缩小加颜色,
  • 支持文档: https://www.megasoftware.net/

philp:

  • 简易使用:
计算 Symmetric Difference
cmd进入exe目录,开启treedist.exe程序:
H:\my_task\CRAFT\实验结果数据\利用距离矩阵建树\树之间的距离计算\phylip-3.695\27four_method.nwk
修改D(D回车可以修改,为所要的距离)
修改2为P(所有的树互相计算距离)
F全矩阵输出

Mothur:

  • 简易使用:
parsimony(tree=28.nj,group=28mammalian_gut.groups)
parsimony(tree=27.nj, group=27ecoli.groups)

TreeCmp:

  • 简易使用:
java -jar H:\my_task\TreeCmp\TreeCmp\bin\TreeCmp.jar -m -d qt -i 28four_method.nwk -o 28four_method.nwk.out

About

lab_419 工具集

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published