화요일, 3월 27, 2018

qiime에서 reference에 tree 파일이 없을때..

qiime을 사용하려고 하는데
기성복처럼 제공되는 천랩 db이나 gg database말고
다른 몬가 나 qiime 좀 잘한다고 자랑하려고
다른 microbiome database(근데 그런게 있나?? 직접 만들어봤자.. ) 사용하고자할때! 바로 그 순간

서열은 가지고 있지만 qiime에서 분석하다보면 db가 custome일 경우
tree파일이 없어서 몇몇 분석은 진행 못합니다.

기껏 폼좀 잡았는데 왠 개망신 Orz

자 그래서 우리의 Rob 횽님께서는 미리미리 준비하셨습니다.

일단 두개의 스크립트를 제공하고 있습니다.
1) align_seqs.py
2) make_phylogeny.py

이름보니깐 딱 느낌이 오죠
사실 이 작업에서 1번 스크립트는 필수 파일은 아닙니다.
2번 스크립트만 있으면 됩니다.
1번은 2번 스크립트에서 입력받을 수 있는 format의 alignment로 대신 할 수 있습니다.
-그러나 저는 그렇지 않았다능!! 어떤 값을 입력값으로 받는지 궁금하시면 직접해보시면됩니다.!

그러나 우리 Rob 횽님께서 qiime 패키지안에 넣어주셨는데 한번 써봐야하지 않겠습니꽈!

우선 분석에 사용할 rep set fasta 파일은 준비합니다.

설명페이지 align_seqs make_phylogeny

align_seqs.py -i ref.fasta -m pynast -o pynast

make_phylogeny.py -i /path/to/aligned.fasta -o /path/to/rep_phylo.tre

두 스크립트를 순서대로 실행시키시면
짜란~!!
rep_phylo.tre를 손에 거머쥘수 있습니다.!

그럼,

May the Genome be with you.


Tip. align_seqs의 -m (--alignment_method) 인 정렬 method에는
pynast, infernal, clustalw, muscle, mafft이 존재하지만
제 경우 pynast이외의 경우 에러가 발생하여 진행이되지 않았었습니다.

Tip. make_phylogeny의 -t (--tree_method)인 tree 생성 method에는
clustalw,raxml_v730, muscle, fasttree, clearcut가 있지만
default 값인 fasttree를 사용해서 진행
이유는 역시 제 경우 다른 method들은 에러가 나서.. Orz

일단 qiime 설치가 제일 중요한것보다 그냥 남들이 만들어 주는 데이터베이스 쓰시라능.. :)


댓글 없음: