幾霜::残日録::2007/04/18 (水)

 

移籍先を探しています。系統樹推定法やメタバーコーディング法などに詳しい研究者を探している方がおられましたらご一報下さい。

2007/04/18 (水)

[Science] NPRSとPL法 - 15:55:04

 NPRS法による分岐年代推定は以下の値を最小化する(ただし最上位の分岐では親枝が無いので子枝進化速度の分散を足す)。

Σ(rp - r1)^2 + (rp - r2)^2 (= wとしておく)
(rp,r1,r2はそれぞれ親枝の進化速度、子枝1の進化速度、子枝2の進化速度)

 PL法は、与えられた系統樹に対する進化速度群の適合度を表す尤度Lに上記のwを罰則として加えた以下のものを最大化する。

PL = L - wx

xはSmoothing Parameterと呼ばれており、これが0のときにデータへの適合性が最大となるモデルになる(が、進化速度には何の制約も無く、収束計算が難しい)。xが無限大なら無理矢理分子進化一定を当てはめることになる。

 PL法では、Smoothing Parameterの最適値をCross-Validationによって求める。つまり、x=10^-5 〜 10^10まで(この範囲は任意)10倍刻みで変化させながら、OTUを一つ除いてPL最大化したパラメータで除かない場合の各枝の進化速度を求め、通常のPL最大化を行って求めた進化速度との残差平方和を求めることを全OTUに対して行い、その和が最小のxを採用する。複数の年代制約がある場合は、それを用いたCross-Validationもr8sには実装されている。

 そして、PL法の最大の難点はこのCross-Validationに膨大な時間がかかること。OTUが増えてくるとシャレにならん。各xにおいてOTU数の2倍+1回のPL最大化が必要なので、ブートストラップやMCMCサンプルによる繰り返しを行うことも考えると悪夢のよう。しかもたびたび収束に失敗して落ちる。やっとれへんわ。

[Life] またまた間違えた - 10:19:22

 新しい方法が最高の能力を発揮するはずのシミュレーションで見るも無惨な結果・・・。一時呆然。よーくみたら、配列生成時に与えた系統樹が間違っていた。ハァーーー。超焦った。

[Topics] 志賀昆虫普及社創業者の志賀夘助氏死去 - 09:09:17

 採集・標本用具で有名なあの志賀の創業者が亡くなられたそうです。並の研究者よりよほど社会への貢献度は高そうです。死因は老衰とのこと。享年104歳。大往生ですね。何はともあれご冥福を。

[Life] 理解不能 - 09:05:01

 逆恨みであっても、直接の当事者を恨んだり撃ち殺したりというのは理解できる。しかし、長崎市長も大学関係者も直接の当事者ではなさそうです。関係ない人をどうやったら恨むことができるんでしょう。撃ち殺すなんて尚更です。全く理解不能。理解できないものは恐ろしい。

[Topics] バージニア工科大で銃乱射事件、32人死亡 - 08:10:07

 アメリカでは乱射事件。しかもバージニア工科大って名門やんけ。76歳の教授が学生を逃がすためドアを押さえつけている最中に撃たれて亡くなられたそうです。容疑者(死亡)は孤独だったそうで真相解明は難航しそうです。亡くなられた方々のご冥福を。アーメン。

[Topics] 長崎市長が銃撃され死亡 - 07:41:53

 なんてこった。どうも暴力団関係者の逆恨みのようです。法廷で真実が明らかにされ犯人に厳格な処罰が下されることを願います。

 銃弾は心臓を貫通していた模様です。そりゃ助からんわ。亡くなられた市長のご冥福をお祈りいたします。

 なお、選挙期間中ですが、候補者の急逝に伴って公職選挙法に基づく補充立候補が受け付けられるとのことです。

[Science|Software] Visual C++でPHYLIPをコンパイルする - 07:19:46

 基本的には付属のMakefile.msvc7を使う。CFLAGSなどを適当に設定する。ただしソースコードがそのままだとコンパイル時にエラーになる。dnamlk.cとpromlk.cの冒頭に

#define copysign _copysign

という宣言を追記することで回避できるはず。

[Science] 分枝長平均化による分岐年代推定法の関係 - 03:57:19

 分枝長を平均化することによって分岐年代を推定する方法が各種知られています。Mean-Path-Length (Bremer and Gustafsson, 1997)・Linearized Trees (Takezaki et al., 1995)・Adachi and Hasegawa (1995)Purvis (1995)など。これらは全て実装が違います。

 これらの手法の違いは、次の3点に分けられます。

  1. 上位クレードのクレード高計算時に下位クレードの平均化を継承するか、しないか
  2. 上位クレードと下位クレードの間の内部枝長を上位クレードのクレード高と下位クレードのクレード高の差にするか、それとも下位クレード+内部枝を上位クレードのクレード高にスケーリングして求めるか
  3. 分岐の両枝をそれぞれの所属OTU数によって重み付けするか、しないか

 上述の方法におけるこの3点は以下の通り。

  • Takezaki et al. (1995) - 継承しない・スケーリングしない・重み付けしない
  • MPL - 継承しない・スケーリングしない・重み付けする
  • Purvis (1995) - 継承する・スケーリングする・重み付けしない
  • Adachi and Hasegawa (1995) - 継承する・スケーリングしない・重み付けしない

 これらのことから、当然さらに4つの方法が考えられるでしょう。しかしTaxon Samplingの影響をもろに受けるので所属OTU数で重み付けってのはどうもなぁ。やるとしても対数とって重み付けすべきやろ(注:分岐が生じるごとに分岐する可能性のあるlineageは指数関数的に増加するから)。

Go to front page
Comments and TrackBacks
Web antenna system: NaTsuMi
Search in this site
Access Count : 1963255