幾霜::残日録::2006/12/12 (火)

 

移籍先を探しています。系統樹推定法やメタバーコーディング法などに詳しい研究者を探している方がおられましたらご一報下さい。

2006/12/12 (火)

[Topics] 著作権保護期間は延長すべきか - 20:13:07

 原則延長の必要は無い。著作権者が選択できるようにすることと、許諾を得る手続きを手軽に行えるシステムの構築がまずは必要でしょう。その上で、論理的な評価をするための定量的なデータの収集をしていき、十分なデータが蓄積された段階でデフォルト設定をどうするのかを検討すればいいのではないでしょうか。

 しかし相変わらず延長派の言い分は理解不能。
この意見に対して零士さんは、古典の名作の2次利用と、近現代の作品の2次利用は異なると指摘する。「古典と現代を混ぜてはいけない。近現代にあるものを改変したりパロディー化することは作品への侮辱。先人に学ぶというのは事実だが、学んだだけの敬意を払うべき」(零士さん)
謎理論だ。経過時間でなんで作品の取り扱いが変わるのか? 古典と近代作品の境界をどこにどうやって設定するのか? ところで「銀河鉄道の夜」は古典なんでしょうか?
延長賛成派の三田さんは、個人と国家の関係にまで話を発展させる。「日本は、著作物の輸出量よりも輸入量の方が多いから、国全体として見れば保護期間が短い方が経済的に得だ、という議論がある。だが国家のために個人を犠牲にする議論はとうてい民主主義的とは言えない。日本はいつから社会主義国になったのか」(三田さん)
個人が犠牲になるという前提が満たされるとは証明されていない。また、もしも多くの人が「文化の振興のために著作権者の権利は犠牲にする」ということを支持するならまったくもって民主主義的。

 しかし著作権保護期間の議論より先に、著作物による利益分配システムを何とかして欲しいんですけど。ちゃんと著作権者に利益分配されてるんでしょうか。そこが解決していないと保護期間の議論、というか著作権法という文化振興システムそのものに意味が無いんですけど。

[Game] ドラクエIXはDS - 19:49:37

 げ、DS買わんと!

[Life] Picasaウェブアルバム始めました - 19:09:33

 デジカメフルサイズ写真を登録しています。このサイトにアルバム中のランダムに選択した画像を適当に縮小して埋め込み+リンクを張れるJavaScriptが欲しいところです。

追記 - 19:29:42
 Picasaデスクトップはかなり動作も軽くて良いですね。Paint Shop Proとは大違いです。

[Life] 実験室ユーザー増加 - 16:56:41

 最近、分子実験に手を出す人が増えてきて、一人ずつTaqを分けているので未開封品が1本だけになっていた。開封したら注文しろよなぁ。

 TaqはこれまでTaKaRaの品を主に使ってきたのですが、ここしばらくは安価なのでNew England BioLabのTaqを使っていました。最近になってフナコシが扱い始めたAmpliqonのさらに安価な品を使い始めましたが特に問題は無いようです。

 どちらもTaKaRaの製品との違いはdNTPが付属しないことですが、dNTPはかなり余っているのでしばらくは別途注文する必要は無さそうです。AmpliqonはABIのAmpliTaqのように熱変成で活性化するHotStart用のTEMPaseなる製品や、Ex-Taqのようにα型酵素を混ぜることでLA-PCRに対応したUniPOLという製品もあり、これまで通りのプロトコルで使えそうな安価な酵素が多いですね。時々使っていたPhusionは増え具合は良いのですが、プロトコルを専用にする必要があるしバッファの組成に問題があるのかPCR産物をExoSAP-IT処理してシーケンスリアクションに用いるとうまくいかないことが多くて困っていました。

[Life] はてなメンテナンス - 16:15:12

 はてながメンテ中でアンテナが不完全に。ま、たまにはしゃーないか。

[Science] データパーティショニングの尤度に対する最適化は系統推定を改善するか - 07:01:05

 基本的な認識の部分に間違いがあるかもしれませんが、もしあったらご指摘よろしくお願いします。

 さて、系統推定において尤度の改善は重要ではありません。モデルを複雑にすれば尤度を改善するのは簡単です。重要なのは真のモデルがより強く支持されるようになるかどうかです。しかし、Pagelらはシミュレーションデータの解析ではGTR・GTR+Gとの尤度による比較だけで、正解のパーティショニングで分割したGTR+G+GTR+Gよりも真の系統樹の支持率が改善するのかは示していません。EF1a+DDCのデータでも同様です。

 モデル選択規準が改善しなくなるまで分割数を増加させていくことで最適なパーティショニングを探る目的にはある程度は使えると思いますが、それがどこまで有効なのかは判然としません。分割したパーティション毎に適用するモデルのモデル選択を事後的に行ってから再度パーティショニングの最適化を行うとまた結果が異なるかもしれません。それも反復最適化することは可能ではありますが。

 また、RNA領域のパーティショニングを系統樹の尤度に最適化するのは危険な気がします。RNA領域のパーティショニングはRNAの高次構造に対して最適化すべきです。アライメントを系統樹の尤度に最適化するdirect optimizationも同様の問題をはらんでいます。これはタンパクコード領域でも同様です。それらが一致するのなら問題はありませんがそうとは限らないでしょう。論文ではEF1a+DDCのデータでは良さそうな結果に見えますが12Sの結果(stemとloopの多くが一つのパーティションにまとめられている)は誤ったパーティショニングがなされたように私には見えます。もっともこれは分割した領域にGTRを当てはめているせいであってRNAの二次構造を考慮したモデルを当てはめると改善するかもしれませんが、データパーティショニングの最適化によって推定されるモデルが歪められてしまう可能性があるということです。

 上で判然としないと書いたのは「発現時の産物分子高次構造への最適化と系統樹の尤度への最適化がどれくらい一致してどれくらい一致しないのか」と「一致しない場合にどれくらい危険なことが起こるのか」が分からないことを指しています。しかし私の感覚的にはよほどに注意深く適用しないとアーティファクトを得る危険性がかなりあるように思います。

 というわけで、タンパクコード領域ではコドン置換モデルを、RNA領域では二次構造予測をした上でそれらを考慮に入れたモデルを適用するのが良いように思います。コドン置換モデルでのアミノ酸間の置換確率とRNAのstem領域用モデルではパラメータが多すぎてデータから推定するのは難しいので、empiricalなモデルが使われるでしょう。というか提案されて・使われています。ただempiricalなモデルは個人的には非常に嫌いなのでこの方法に転びたい気はします。

 要するに、私が言いたいのは何でもかんでもデータから推定すればいいというものではないということです。推定をしすぎるとどこかの推定の過ちが他の推定の過ちを誘発してしまうことがあるだろうと、別の情報から推定できることは別の情報を使えばいいじゃないのということです。

 最後に、PagelらがMixture modelと呼んでいるものを「混合モデル」と訳すのは誤解を招く表現のように思います。GLMMと混同しそうです。まぁHuelsenbeckらがMixed modelと呼んでいるのもマズいわけですが。PagelらのMixture modelとHuelsenbeckらのMixed modelは中身は全く同じもので、PupkoらがProportional modelと呼んだものです。Pagelらは従来はa prioriに与えなくてはならなかったパーティション分割の情報を系統樹の尤度に最適化することでデータから推定するように実装しただけ(いや十分凄いんですが)のはずです。

Jow et al., 2002, "Bayesian phylogenetics using an RNA substitution model applied to early mammalian evolution", Mol. Biol. Evol., 19, 1591-1601.
Hudelot et al., 2003, "RNA-based Phylogenetic Methods: Application to Mammalian Mitochondrial RNA Sequences", Mol. Phylogenet. Evol., 28, 241-252.
Pagel and Meade, 2004, "A Phylogenetic Mixture Model for Detecting Pattern-Heterogeneity in Gene Sequence or Character-State Data", Syst. Biol., 53, 571-581.
Pupko et al., 2002, "Combining Multiple Data Sets in a Likelihood Analysis: Which Models are the Best?", Mol. Biol. Evol., 19, 2294-2307.
Ronquist and Huelsenbeck, 2003, "MrBayes 3: Bayesian phylogenetic inference under mixed models", Bioinformatics, 19, 1572-1574.
Smith et al., 2004, "Empirical models for substitution in ribosomal RNA", Mol. Biol. Evol., 21, 419-427.

追記 - 07:53:10
 あー全く同じではないわ。Pagelらのモデルは複数ある相対置換速度行列のどこか1カ所だけが基準になるけどもMrBayesのモデルでは各行列毎に基準がある。ただこれが何にどの程度の効果があるのか分かりませんが。

[Science] 生態学会誌届く - 01:37:45

 予想通りにグダグダになってきている。うーん、これからこのレベルに落ち着くようなら生態学会誌も紙媒体は要らんなぁ。

Go to front page
Comments and TrackBacks
Web antenna system: NaTsuMi
Search in this site
Access Count : 1960747