Merge pull request #3 from AlexanderShane/master

Master
McMinds-Lab · Dec 1, 2021 · 8a91466 · 8a91466
2 parents 9292d55 + 41efff2
commit 8a91466
Show file tree

Hide file tree

Showing 2 changed files with 64 additions and 4 deletions.
diff --git a/microbiomes/qc_amplicons/01_init_QC.sh b/microbiomes/qc_amplicons/01_init_QC.sh
@@ -1,3 +1,4 @@
+
 # get local variables
 source local.env
 
@@ -14,8 +15,8 @@ cat <<EOF > ${outdir}/01_init_QC/01_init_QC.sbatch
 #SBATCH --ntasks=${nthreads}
 #SBATCH --nodes=1
 #SBATCH --cpus-per-task=1
-#SBATCH --mem=20
-#SBATCH --time=01:00:00
+#SBATCH --mem=20G
+#SBATCH --time=24:00:00
 
 # get local variables
 source local.env
@@ -63,5 +64,7 @@ done
 EOF
 
 if $autorun; then
-    sbatch ${outdir}/01_init_QC/01_init_QC.sbatch
+
+sbatch ${outdir}/01_init_QC/01_init_QC.sbatch
+
 fi
diff --git a/microbiomes/qc_amplicons/02_dada2.r b/microbiomes/qc_amplicons/02_dada2.r
@@ -1,3 +1,60 @@
 library(dada2)
 
-#do dada2 stuff
+#some people run packageVersion(dada2) after to see current version, however it's not helpful
+
+path <- "path1"
+
+#need to change "path1" to where the data can be found
+
+merge_reads <- sort(list.files(path, pattern="R1.fastq", full.names=T))
+
+reverse_reads <- sort(list.files(path, pattern="R2.fastq", full.names=T))
+
+#I believe that dada2 might want us to run its own filter and trim function, however we might get away without using it since prevous cutting will be done
+
+#The following is to assign the filtered reads a file
+
+#filtered_merged_reads <- file.path(path, "filtered", paste0(sample.names, "_merged_filtered.fastq.gz"))
+
+#filtered_reverse_reads <- file.path(path, "filtered", paste0(sample.names, "_reverse_filtered.fastq.gz"))
+#move line ahead
+out <- filteredAndTrim(forward_reads, filtered_forward_reads, maxN=0, maxEE=2, truncQ=0, compress=T, multithread=T)#provide number for multireads in local.env
+
+#learning errors is a key component, must be done with filtered reads
+
+err_merged_reads <- learnErrors(filtered_merged_reads, multithread=T)
+
+#err_reverse_reads <- learnErrors(filtered_reverse_reads, multithread=T)
+
+#There is a bult-in function that allows the user to plot errors, just allows user to visualize the estimated error rates
+#If decided to run this plot-
+
+pdf(path)
+plotErrors(err_merged_reads, nominalQ=T)
+dev.off()
+
+#plotErrors(err_reverse_reads, nominalQ=T)
+
+#after dada2 has learned errors, user can denoise
+derepFastq #output will be for dada
+
+dada_merged <- dada(filtered_merged_reads, err=err_merged_reads, multithread=T)
+
+#dada_reverse <- dada(Filtered_reverse_reads, err-err_reverse_reads, multithread=T)
+
+#Inspect the denoising results, if wanted by "dada_forward[[1]]
+
+#After denoising, we can merge the paired reads
+
+#mergers <- mergePairs(dada_forward, filtered_forward_reads, dada_reverse, filtered_reverse_reads, verbose=T)
+
+#Again, if wanted to inspect mergers run head(mergers[[1]])
+
+#Construct ASV
+
+seqtab <- makeSequenceTable(mergers)
+dim(seqtab)
+
+write.table(seqtab, path, sep='\t')
+
+save.image(path)