幾霜::残日録::2004/08/06 (金)

 

移籍先を探しています。系統樹推定法やメタバーコーディング法などに詳しい研究者を探している方がおられましたらご一報下さい。

2004/08/06 (金)

また年金過払い - 21:35:07

 とりあえず発注先の業者を公開してくれ。

停電 - 21:33:14

 先ほどから明後日まで。まったく、研究が完全ストップやがな。防犯とブレーカー監視のため見張っとらなあかんし。とりあえずはヒマなので何か書くか。

我々の脅威となるなら、ロシア艦隊が日本を封鎖し孤立させるだろう - 15:24:46

 正直言って封鎖する前に全艦撃沈がオチだと思います。

JabRef - 15:07:05

 BibTeX引用文献データベースエディタ。

Mozilla Firefox用ライフサイエンス辞書検索プラグイン更新 - 08:33:23

 検索CGIの移動に対応しました。

メモ - 08:18:26

XMLスキーマ - 04:21:29

 ということで講演要旨用XMLスキーマを書こうかということになるわけですが、スキーマ言語は何が良いんだろう。というか独自のスキーマを用意した方が良いのか、用意するタグはどんなものが必要か、などなど分からんことが沢山あるなぁ。

講演要旨はCD-ROMになるか - 03:49:47

そのうちCD-ROM要旨集という道を進むことになるのではないですか.
 率直に言ってこれはインターネット不適合者の発想だ。インターネットで公開しておけばCD-ROMなんて物理メディアは不要でしょう。
 また、インターネットで公開すれば「読まれる」だけではない。「リンクしてもらえる」という大きな利点がある(そのためにも軽量なHTMLは重要)。リンクしてもらえるということは「読んでもらいやすくなる」ということだ。このことの意義を過小評価してはいけない。ただ、その際には「固定URLが維持できるか」という問題が生じる。生態学会の場合は大会サイトが学会サイトとは別運営で、永続性に不安がある点が大きなマイナスでしょう。今のところ第49回大会以降は残ってはいますが第50回大会のサイトは実際に移動してますし、大学のサイトはどうしてもドメイン変更を余儀なくされやすいので、やはり独自ドメインは取った方が良いでしょうね。

 固定URL・ディープリンクこそがインターネットの本質。そして今後「semanticity」がそれに加わっていくでしょう。それを十分に生かして情報発信する人間・機関が大きな影響力を持つようになるでしょう。ですが、残念なことにそのような人間・機関と実際に重要な情報、発信されるべき情報を持っている人間・機関とは一致しない。故に重要な情報、発信されるべき情報を持っている人間・機関はこれらを生かした情報発信を行っていく必要がある。義務があると言ってもいい。そこのところをよくよく理解していただきたい。

機械にとっての可読性と人間にとっての可読性−セマンティック要旨集のススメ或いは要旨集XML化計画 - 03:28:15

 先日、進化学会と生態学会の講演要旨が公開されましたが、この両要旨集には大きな違いがあります。それは、「semanticity」です。

 近年XML、そのアプリケーションの一つとしてのRSS/RDFの普及に伴って「セマンティックWeb」という言葉がキーワードとして認識されつつあります。これは、Web上の情報に、「それは何か」を機械に理解させる仕組みを加えようという動きです。例えば上に挙げた要旨集の場合は「発表者」「共同発表者」「所属」「日時」「会場」「講演ID」「タイトル」「キーワード」「分野」「要旨本文」などなどを「それをそれとして」機械に理解できるようにするということです。それによって、例えば生態学会の要旨のように「分野から」「発表者から」などの複数の方法で探索できるようにすることが簡単に実現できます。また、検索エンジンで特定の機関所属者の講演要旨をリストアップしたり、特定の人間の発表を見つけ出したり、特定の単語をタイトルに含む講演を探すことも技術的に容易になります。現実に、RSS/RDFを対象とするそのような検索エンジンは実働段階に入っています。

 これまで、学会の講演要旨は「販売物」となっていたため(かどうか知りませんが)、プログラムなどは公開が進んでいましたが要旨の内容まで全面的に公開されることは多くありませんでした(と思う)。今回、両学会が講演要旨の全面公開に踏み切ったことは非常に高く評価できます。しかしこれは、「読めるようになった」ことだけで評価してはいけません。「読んでもらいやすくなった」こともまた重要な意義であることに疑いの余地はありません。

 最近の研究者は、論文をジャーナルに投稿する際、「インパクトファクター」に注目しています(無論それだけではない)。これは、そのジャーナルの論文がいかに引用されているかということから統計的に算出される値です。分かりやすく言えばジャーナルの「PageRank」です。これの高いジャーナルに論文が掲載されるほど高く評価されるようになってきています。残念ながら、インパクトファクターは論文やジャーナルを評価する際に必ずしも良い指標とは言えませんが、それが現実です。他に代替できる客観的な数値もありません。
 実は、このインパクトファクターがここ数年で急速に下降してきているジャーナルが沢山あります。その中には非常に重要と思われるジャーナルも含まれています。それらのジャーナルにはある共通点があります。それは、電子版を提供していなかったり、提供していてもそもそも高価だったりと、とにかく電子版にしろ印刷版にしろ入手コストが非常に高いという点です。
 つまり、インパクトファクターを上げる・高く維持するためには、引用される必要がある、そのためには「読んでもらう必要がある」ワケです。
 その辺りを理解して「読んでもらえる」ことを目指したのがPLoSです。彼らは論文をWeb上で全面無料公開してしまうことで「読まれる→引用される」ことを狙っているようです。そして、資金は投稿者からお金を取ることで賄うそうです。つまり、「読まれる→引用される→インパクトファクターが高くなる→お金を払ってでも投稿する価値が出てくる」というスパイラルを目指しています。
 ということで、「読んでもらいやすくなった」ことが如何に大きな意味があるかお分かりいただけるでしょう。

 しかし、本当に重要なことは「読んでもらいやすくなること」ではありません。本当に重要なのは「読んでもらえること」であることを忘れてはいけません。「読んでもらう」ためには「より読んでもらいやすくなる」必要があります。「より読んでもらいやすくなる」ための次の段階は「より見つけ出しやすくなる」ことであると考えます。

 ということでやっと本題なワケですが、現代は膨大な量の情報が氾濫しています。その中から必要な情報を見つけ出すのは至難の業と言ってもいいでしょう。「セマンティックWeb」はそのための方法論なのです。それも決定的に重要な。

 ここで生態学会と進化学会のWeb要旨の違いがはっきりと見えてくるはずです。生態学会の要旨集には十分とは言えないものの「semanticity」があるということです。HTMLのソースコードを見ると、class指定から機械にそれぞれの意味を認識させることは十分に可能なように見えます。もっとも、既存の枠組み(RSS/RDFなど)に従っていないためそれは可能性に過ぎませんが、ともかくあるのは間違いない。そもそもHTML自体が構造化文書としての最低限の性質は持っているので、HTML版があるだけでも意味がある。欲を言えば1要旨1ファイルとしてHTMLタイトルに講演タイトルを設定して欲しかったが(複数要旨1ファイルだと複数キーワードのAND検索で予定外にヒットしてしまいやすくなるという問題もある)、見出しを表すHタグを解析すればしおりとして機能する点は評価できる(Mozilla用のContextMenu ExtensionsにはHタグを解析してツリー表示し、所定場所に跳ぶ機能がある)。しかし、両学会のPDF要旨では残念なことに「しおりが設定されていない」。また、各文字列が何なのかを機械が知ることは難しい。

 進化学会の要旨を担当された農環研の三中先生曰く
ぼく個人としては要旨集の〈本〉としての可読性にこだわっている.データだけではなく,ちゃんと読めるかどうかが重要なポイント単なるレファレンスではあるのだが,「読める要旨集」であってほしいという目標はいつも置いている.
とのことで、これはこれで結構なことですが、「機械にとっての可読性の追求」により「読んでもらえる要旨集」であることもまた重要だと私は考えます。

 と、いうわけで、学会の講演要旨も法律のようにXML化して「semanticity」を付加しよう! と言いたいわけです。別にXHTML + class指定でも枠組みさえ決めてしまえばできますが、XMLという枠組みを決めるための枠組みが既にあるのでそれに従った方が良いでしょう。
 別にこれは講演要旨を担当された方にやって欲しいと言っているわけではなくて、学会の側がこういうことは責任を持ってやって欲しいと思います。いっそのこと政府がやってもいいでしょう。いつか、講演要旨XML専門検索エンジンとかができた時、現在とは比較にならないほど講演を探し出すことが容易になっているでしょう(そのためのコストも大変ではあるでしょうけど、LaTeXなら十分自動化できそうですね)。学会事務センターでもいいんですが、無能な上に−政府もそうですが−詐欺機関なので(注:学会事務センターは学会から預かった金を債務返済に流用している)、ヤツラには関わらせたくないですね(笑・・・いごとやないわ)。

Go to front page
Comments and TrackBacks
Web antenna system: NaTsuMi
Search in this site
Access Count : 1965117