multicntrl.dat について
2008 年 5 月 21 日 改訂
井上 潤

multidivtime で ベイジアン mcmc によって年代と進化速度の計算を行う際に用いる control file, multicntrl.dat, の説明です.multidistribute の使い方はこちらをご覧下さい.



/* the following lines are all needed in multicntrl.dat ...
do not add or delete lines but change entry on left of each
line as you see fit ... */
example.tree

[ 用いる樹形を変更する場合は,上の行に新たな tree ファイルの名前に変更します]


3 ... number of genes ... FOLLOWING LINES CONTAIN ONLY NAMES OF DATA FILES

[用いる遺伝子 (パーティション) の数を記入]


oest.Gene1
oest.Gene2
oest.Gene3

[estbranches を用いて得られたパーティションごとの outfile の名前を記入します]


10000 ... numsamps: How many times should the Markov chain be sampled?
100 ... sampfreq: How many cycles between samples of the Markov chain?
100000 ... burnin: How many cycles before the first sample of Markov chain?

1.5 ... rttm: a priori expected number of time units between tip and root

[ルートノードの年代.数字はあまり大きくない方がよいようで,4 億 5 千万年前であれば,rttm = 4.5 とします]


1.5 ... rttmsd: standard deviation of prior for time between tip and root

[rttmsd = 0.5*rttm でも良いみたいです.multidivtime は root node age の prior にガンマンぷを仮定しています.rttm と rttmsd はそれぞれ mean と SD にあたります (mean と SD から shape parameter のαが決まります.詳しくはこちらを参照してください).]


0.07 ... rtrate: mean of prior distribution for rate at root node

[100 MYA (1*10^8) (^8: 八乗) を 1 としていれば,0.07 *10^-8 chages/site/year を意味します]

*以下,(1)〜(3) まで書いてありますが,3 のやり方がもっとも簡単で洗練されています.1, 2 を読むことで,解析の内容を理解することができると思います.

(1). [

rtrate = X/rttm

X は Root node から末端までの樹長 (理想的には全ての末端枝までの樹長の平均) です.X は oest.Gene1 の最初の行に出てくる tree から計算します.TreeView で internal ravel を表示させるなど工夫する必要があります.私は一つのパーティションでは 3 OTU ほどの樹長を求め,これをすべてのパーティションから得られた樹長を平均して X としています.DNA の解析であれば,0.07 前後になるようで,私のデータセットでは値を変化させても得られる値はほとんど変化しません]

(2). [TreeStat の Root-Tip Lengths を使うと,末端までの樹長を自動的に求めてくれてとても便利です (宮正樹先生に教えて頂きました).Read me を読めば,5 分程度で使い方がわかると思います.]


(3). [Yang さんによると,rttm は baseml でも計算可能だそうです.こちらをご覧下さい.(2009 年 6 月)]


0.07 ... rtratesd: standard deviation of prior for rate at root node

[rttmsd = 0.5 * rtrate でも良いみたいです]


0.4 ... brownmean: mean of prior for brownian motion constant "nu"

[rttm * brownmean = 1.root node の rate から bownmean の値を使ってそれぞれの rate を算出しています.このつながりを autocorrelation と呼ぶようです]

[brownmean (nu) は time unit に関係ありません.例えば,1 = 100 Myr あるいは 1= 1 Myr とした場合でも,同じ値で良いそうです. (2009 年 10 月)]


0.4 ... brownsd: std. deviation of prior for brownian motion constant "nu"
/* the following lines are all needed (i.e., do not delete them) but you may

[brownmean = brownsd.brownmean と brownsd はそれぞれガンマ分布の mean と SD にあたります]


not want to alter entries unless you are familiar with the computer code */
1.0 ... minab: parameter for beta prior on proportional node depth
0.1 ... newk: parameter in Markov chain proposal step
0.5 ... othk: parameter in Markov chain proposal step
0.5 ... thek: parameter in Markov chain proposal step
100.0 ... bigtime: number higher than time units between tip and root could
be in your wildest imagination

[bigtime は,root node time の考えうる限り最も古い年代を入れるようです.このため Root node に upper constraint があれば,bigtime を upper constraint 以上で変化させても結果に影響を与えないはずである,というのが私の周辺での見解です (2008 年 5 月).

Ruber et al. (2006) では,bigtime は rttm の 2 倍ではどうか,と書かれています.この論文では bigtime の値を変化させると,得られる年代値が変化したようですが,私の解析では今のところ大きな変化は見られませんでした.上記のように,Root node に upper constraint があるためだと思います.]


/* the program will expect the entry below to be the number of constraints
and then the specified number of constraints should follow on
subsequent lines */
3 ... number of constraints on node times

[化石記録などに基づく制約の数]


L 5 1.0
L 7 1.1
U 7 1.4

[化石記録などに基づく lower (L) と upper (U) の制約.multidivtime numbers を行ってから設定します]


0 ... number of tips which are not collected at time 0
0 ... nodata: 1 means approximate prior, 0 means approximate posterior

[Prior の設定がどのようになっているか知りたければ,1 で解析します.この場合,データを用いないで Timetree が Prior として算出されます]


0 ...commonbrown: 1 if all genes have same tendency to change rate, 0 otherwise