幾霜::残日録::2006/10/22 (日)

 

移籍先を探しています。系統樹推定法やメタバーコーディング法などに詳しい研究者を探している方がおられましたらご一報下さい。

2006/10/22 (日)

[Science] 分子進化一定の検定 - 08:55:19

 従来は

  1. 分子進化速度は全ての枝で異なると仮定してlnLmaxを求める(この場合の枝長パラメータ数はOTU数×2−3)
  2. 分子進化速度は全ての枝で同じであると仮定してlnLmaxを求める(この場合の枝長パラメータ数はOTU数−1)
  3. 尤度比=lnLmaxの差の2倍は自由度がパラメータ数の差=OTU数−2(分子進化モデルは同じ場合)のχ2分布に従うはずなので、2つの尤度に差が無いという仮定下においてその尤度比が得られる確率=有意確率(p値)が求められる
  4. 有意確率が有意水準を下回るならば分子進化速度一定は棄却される
というやり方だったわけですが、この場合にχ2近似が適用できるかどうかあやしいという話もある(分子進化モデルさえ適切であれば問題無いとシミュレーションでは示されたが現実のデータで分子進化モデルが適切であることはまずあり得ない)ので、下のparametric bootstrap検定が使えるかもしれませんね。いやparametric bootstrapも分子進化モデルが適切じゃないとマズいか・・・。

[Science] parametric bootstrap検定の手順 - 07:32:46

 理解はしたが詳細な手順をすぐに思い出せなかったので粕谷先生の説明を簡単に箇条書きにしてみた。

  1. 元データにおいてモデル1(対立仮説)とモデル2(帰無仮説)のパラメータ値とlnLmaxを求める(当然lnLmaxはモデル1の方が大きい)
  2. モンテカルロ法でモデル2に基づいてデータもどきを生成する(パラメータ値は1で推定した値にする)
  3. 各データもどきにおけるlnL1maxとlnL2maxを求める(パラメータ値は流用せず最尤推定する)
  4. 元データと各データもどきにおけるlnL1max−lnL2maxを求める
 データもどきにおけるlnL1max−lnL2maxのうちに占める、元データにおけるlnL1max−lnL2maxよりも大きい値の割合が、モデル2(帰無仮説)が正しい確率=有意確率(p値)である。この値が有意水準より小さければ帰無仮説は棄却される。
 これは、モデル2(帰無仮説)が本当に間違っているのなら元データにおけるlnL1max−lnL2maxは、モデル2(帰無仮説)に基づいて生成したデータもどきにおけるそれより大きくなりやすいはずであることを利用している。
 もっと詳しく言うなら、モデル2(帰無仮説)が正しい=lnL1max>lnL2maxとは言えないという仮定下においてlnL1max−lnL2maxがどのように分布するのかを調べ、その上側?%点より上に元データのlnL1max−lnL2maxが来るということは、その仮定下では通常起こり得ないことが起こっている=そもそも仮定が間違っておりlnL1max>lnL2maxと言えるということを示している。

注意:モデル1とモデル2は粕谷先生の説明とは入れ替わっている。

Go to front page
Comments and TrackBacks
Web antenna system: NaTsuMi
Search in this site
Access Count : 1963145