ダウンロードして得られた GBFV01.1.fsa_nt ファイルを TransDecoder-TransDecoder-v5.3.0 ディレクトリにコピーします.その後ターミナルから TransDecoder-TransDecoder-v5.3.0 ディレクトリに入り,
./TransDecoder.LongOrfs -t GBFV01.1.fsa_nt
と入力してください.解析は数分で終了します.アウトファイルとして,GBKV01.1.fsa_nt.transdecoder_dir ディレクトリに翻訳済みのアミノ酸配列 (longest_orfs.pep) と,これに対応するするコーディング配列 (longest_orfs.cds) が出力されます.
BLAST+ で類似配列を収集する
ブラスト検索によって,あるアミノ酸配列に類似した配列のセット (アミノ酸と cDNA 配列) を収集します.GBFV01.1.fsa_nt.transdecoder_dir ディレクトリで以下の操作をターミナルで行います.
データベース化:
makeblastdb -in longest_orfs.pep -dbtype prot -parse_seqids
makeblastdb -in longest_orfs.cds -dbtype nucl -parse_seqids
Blast検索:
アミノ酸配列データベースを検索.
blastp -query query.txt -db longest_orfs.pep -num_alignments 10 -evalue 1e-12 -out 010_out.txt
Blast hit した配列の収集:
アミノ酸配列と共通した ID を使って,cDNA 配列を取得.
blastdbcmd -db longest_orfs.cds -dbtype nucl -entry_batch queryIDs.txt -out 020_out.txt
|