MEGA

 
2023 年 8 月 23 日 改訂
井上 潤
MEGA は,配列のエディット,アライメント,系統関係や時間軸付き系統樹の推定,などを行うソフトウェアです.GUI バージョンと CUI バージョン (megacc) があります。

megacc: アライメント

ここでは,Mac のコマンドライン (CC) バージョンを説明します.スライドによる説明も参考にしてください.Documentation はこちらです.

Mac の mega-cc v11 では、cluster アライメントは動きましたが、muscle アライメントは動きませんでした。

megacc (CUI) バージョンは、.mao ファイルをあらかじめ GUI などで作成して解析に用います。

次に、作成した .mao ファイルを使って、megacc を動かします。

[inouejun:megaAlignment]$ megacc -a clustal_align_nucleotide.mao -d Vertebrate6.fas -o out_clustal.txt

MEGA-CC 11.0.13 Molecular Evolutionary Genetics Analysis
Build#: 11220620-x86_64
.....
100% Analysis Complete
MEGA has completed the requested actionTerminating the megacc process with successful exit status

[inouejun:megaAlignment]$

muscle アライメントはエラーが出ました (2023 年 8 月)。

[inouejun:megaAlignment]$ megacc -a muscle_align_nucleotide.mao -d Vertebrate6.fas -o out_muscle.txt

MEGA-CC 11.0.13 Molecular Evolutionary Genetics Analysis
Build#: 11220620-x86_64
23-8-23 14:25:15
Alignment settings:
: Gap Penalties : ====================
....
Message = An unexpected error occurred while performing sequence alignment with MUSCLE. Unable to extract necessary file Private/MUSCLE/muscledarwin64 from RES file, creation of %appdata% folders, and temp folders failed

Please see the summary file for warnings/messages
Please validate all your inputs and try again. If you think this is a
bug, please report it at http://www.megasoftware.net

100% Analysis Complete
MEGA has completed the requested action
Terminating the megacc process with successful exit status

[inouejun:megaAlignment]$

megaAlignment.tar.gz



megacc: BS 値付き NJ tree を推定する

megaNjBoot.tar.gz

megacc -a 010infer_NJ_protein.mao -d 010aaseq.fas -o 020_out

010infer_NJ_protein.mao

解析の設定が書かれています.megaproto で作成します.実際には,エディタでブートストラップ (BS) 計算の回数などを書き換えます.megaproto はmegacc をインストールすると自動的にインストールされます.

010aaseq.fas

ファスタ形式のアミノ酸配列.拡張子は fas でないと,動きません.

020_out

アウトファイルの名前

020_out.nwk

アウトファイル.Newick format です.

まだ充分に確かめたわけではありませんが,NJ 解析ではアウトグループを設定できないようです.おそらく,解析を行った後で,rooting を改めてやることになると思います.また,アミノ酸解析の経験的モデルは, JTT しか対応していません.


GUI: 年代推定
Mega 7 を使って説明します.mega_reltime_example.tar.gz をダウンロードしてください.Mega 11 でもこの例題を解くことができました。MEGA7 より Mac で操作しやすくなっていました (2021 年 10 月)。


=> Data > Open A File/Session から,Vertebrate6.fas

を選んでください.fasta 形式だと,アライメントファイルの読み込みがスムーズです.Phylip 形式だと,面倒です.その後,以下のように選んでください.

"How would you like to open this fasta file"
=> Analyze
=>Nucleotide Sequences
=> OK

"Protein-coding nucleotide sequence data>"
=> No



=> Clocks > Compute Timetree (ML)

Would you like to use the currently active data (Vertebrate6.fas)?
=> Yes




Step 1: Load Seqence Data
すでに選んだので,何もやらなくて良いです.

Step 2: Load Tree File
Browse..
=> Vertebrate6.tre




Step 3: Specify Outgroup
Select Branch...
=>
Please confirm: ....
=> Yes


Step 4: Specify Calibrations
Add Constraints...
上記の制約を,以下の画面を参考に入力してください.
上記の制約は Calibrations Export ファイルに入っています.
File > Import Calibration Data からこのファイルを選ぶことができます.


Setp5: Choose Analysis Settings
Set Options...


最後に,Execute を押して,解析を走らせます.



以下のような結果が得られるはずです.

こちら「RelTime による分岐時間推定」を参照しました.
2019 年 7 月.


推定された時間軸付き系統樹や時間制約、解析設定の要約などを保存できます。以下の画面は MEGA11 です。

 

なお、各分岐に推定された年代は、私の場合、Newick format を FigTree で開き、Node Labels > Display: Node ages で得ています (2021 年 10 月)。

 

Confidence Interval

MEGA では、estimated error bar が confidence interval に相当するようです (Mello et all 2018, P2339右下)。

RelTime-ML 解析を行った後で、Divergece Times のチェックボックスを入れて、Show Node Height error Bars (2SE) をチェックすると、画面にエラーバーが保存されます (下図)。

CI の推定値は、File > Export Timetree (Tabular) を選ぶと、.xlsx ファイルとして保存されます。このファイルがどこに出力されるのかよくわからないですが、Excel で自動的に開かれるので、任意の場所に保存できます (2022 年 1 月)。

 

系統樹の描画

こちらのビデオが参考になります.

 

参考文献

系統樹の作り方: Linux 上の MEGA で作る方法

megacc のインストールと使い方。

Mello B, Tao Q, Tamura K, & Kumar S (2017)
Fast and Accurate Estimates of Divergence Times from Big Data. Mol. Biol. Evol. 34(1):45-50.

ベイズ法によらない分岐年代推定 RelTime は,解析速度が速いが,MCMCTREE や BEAST と同じ結果が得られることを示す.ミトコンドリアゲノムは核ゲノムデータなど 8 つの大規模データを使用.