Skip to content

Process the meta-barcoding (COI-5P) result of Chironomidae larvae

Notifications You must be signed in to change notification settings

jordan841220/MH_Chironomidae

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

15 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Chironomidae Meta-barcoding

  • PI: 郭美華老師
  • 簡單的 Material and Methods 會寫在 03.MM 中

分析流程 1 - ZOUT table

  • 此處的分析目的為生成 Sample-ZOTU 的 matrix 與圖片,結果儲存在 01.ZOTU_Results 中
Script 處理過程 狀態
preprocess.sh - 對 32 個樣站的 raw fastq(fastq)進行前處理,包含用 cutadapt 移除 primers,與用 usearch 做 merge, reverse complement 與 filter (01.ZOTU_Results/fastq_trimmed、01.ZOTU_Results/fastq_merged) Done
otu.sh - 用 usearch 做 denoise 並生成 otu 與格式整理,結果為 zotus.fa、unoise3_result.txt、zotutab97.txt、zmap97.txt 與 zmap97_tidy.txt Done
visualization.Rmd - 用 R 做格式整理與用 R package GUniFrac 生成圖片 "rarecurve.pdf" ,與 zotu matrix "sample_zotu_matrix_raw.csv" 。
- 生成標準化後的 "sample_zotu_matrix_norm.csv",判定可以移除樣站 "A3" "A9" "D6" "S3" "S6" "S9"?
Done
visualization.Rmd - plots: Alpha Diversity, PCoA, Heatmap, and clustering relative abundance (barplot+dendrogram) Done


分析流程 2 - Assign Taxonomy to ZOTU

  • 此處的分析目的為訓練 RDP classifier 並分類所有 ZOTU,結果儲存在 02.Classifier_Results 中
  • ncbi search term: (((((("Arthropoda"[Organism] OR Arthropoda[All Fields]) OR ("Annelida"[Organism] OR Annelida[All Fields])) OR ("Nematoda"[Organism] OR Nematoda[All Fields])) OR ("Platyhelminthes"[Organism] OR Platyhelminthes[All Fields])) OR ("Myxozoa"[Organism] OR Myxozoa[All Fields])) NOT sp.[All Fields]) AND COI[All Fields] AND ("640"[SLEN] : "660"[SLEN])
  • ncbi 下載為 ref/sequence.gb 與 ref/sequence.fasta,因為檔案過大所以會另外給
  • rdp_classifier_2.14 分類器也因為太大而不會上傳上來,只保留根據我們資料訓練好的 02.Classifier_Results/rdp_training
Script 處理過程 狀態
tidy_ref.Rmd - 整理 ncbi 下載 ~640000 個序列的 ref/sequence.gb,儲存為 ref/taxonomy_tidy.txt 與 taxonomy_tidy_IDs.txt,內有分類資訊 Done
train.sh - 根據整理好的 ref/taxonomy_tidy.txt 篩選 ref/sequence.fasta,只留下有完整分類資訊的序列 (ref/tidy_extract.fasta) Done
train.sh - 用工具去整理 ref/taxonomy_tidy.txt 與 ref/tidy_extract.fasta 格式,使其可以被訓練成 rdp classifier Done
train.sh - train rdp classifier,生成 rdp_training 資料夾 Done
classify.sh - 利用訓練好的 rdp classifier 去對 zotu.fa 進行分類,結果為 zotu_taxonomy.txt Done
visualization.Rmd - filter out confidence 不高的分類結果,進行視覺化 Running


其他

Script Description Status
- 寫簡單的 mateirals and methods 在 03.MM Pending

About

Process the meta-barcoding (COI-5P) result of Chironomidae larvae

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages