- PI: 郭美華老師
- 簡單的 Material and Methods 會寫在 03.MM 中
- 此處的分析目的為生成 Sample-ZOTU 的 matrix 與圖片,結果儲存在 01.ZOTU_Results 中
Script | 處理過程 | 狀態 |
---|---|---|
preprocess.sh | - 對 32 個樣站的 raw fastq(fastq)進行前處理,包含用 cutadapt 移除 primers,與用 usearch 做 merge, reverse complement 與 filter (01.ZOTU_Results/fastq_trimmed、01.ZOTU_Results/fastq_merged) | Done |
otu.sh | - 用 usearch 做 denoise 並生成 otu 與格式整理,結果為 zotus.fa、unoise3_result.txt、zotutab97.txt、zmap97.txt 與 zmap97_tidy.txt | Done |
visualization.Rmd | - 用 R 做格式整理與用 R package GUniFrac 生成圖片 "rarecurve.pdf" ,與 zotu matrix "sample_zotu_matrix_raw.csv" 。 - 生成標準化後的 "sample_zotu_matrix_norm.csv",判定可以移除樣站 "A3" "A9" "D6" "S3" "S6" "S9"? |
Done |
visualization.Rmd | - plots: Alpha Diversity, PCoA, Heatmap, and clustering relative abundance (barplot+dendrogram) | Done |
- 此處的分析目的為訓練 RDP classifier 並分類所有 ZOTU,結果儲存在 02.Classifier_Results 中
- ncbi search term:
(((((("Arthropoda"[Organism] OR Arthropoda[All Fields]) OR ("Annelida"[Organism] OR Annelida[All Fields])) OR ("Nematoda"[Organism] OR Nematoda[All Fields])) OR ("Platyhelminthes"[Organism] OR Platyhelminthes[All Fields])) OR ("Myxozoa"[Organism] OR Myxozoa[All Fields])) NOT sp.[All Fields]) AND COI[All Fields] AND ("640"[SLEN] : "660"[SLEN])
- ncbi 下載為 ref/sequence.gb 與 ref/sequence.fasta,因為檔案過大所以會另外給
- rdp_classifier_2.14 分類器也因為太大而不會上傳上來,只保留根據我們資料訓練好的 02.Classifier_Results/rdp_training
Script | 處理過程 | 狀態 |
---|---|---|
tidy_ref.Rmd | - 整理 ncbi 下載 ~640000 個序列的 ref/sequence.gb,儲存為 ref/taxonomy_tidy.txt 與 taxonomy_tidy_IDs.txt,內有分類資訊 | Done |
train.sh | - 根據整理好的 ref/taxonomy_tidy.txt 篩選 ref/sequence.fasta,只留下有完整分類資訊的序列 (ref/tidy_extract.fasta) | Done |
train.sh | - 用工具去整理 ref/taxonomy_tidy.txt 與 ref/tidy_extract.fasta 格式,使其可以被訓練成 rdp classifier | Done |
train.sh | - train rdp classifier,生成 rdp_training 資料夾 | Done |
classify.sh | - 利用訓練好的 rdp classifier 去對 zotu.fa 進行分類,結果為 zotu_taxonomy.txt | Done |
visualization.Rmd | - filter out confidence 不高的分類結果,進行視覺化 | Running |
Script | Description | Status |
---|---|---|
- 寫簡單的 mateirals and methods 在 03.MM | Pending |