論文ネタについて

可変次数 CRF というものについて修士論文で書いて、言語処理学会NLP2011)でも発表したんだけど、これは出したら通る発表会みたいなもので、あまり意味がない。

で、この可変次数 CRF なんだけど、自分ではいいアイデアだと思っている。普通の CRF では 1次の素性しか使えないところを、これを使ったら高次の素性も混ぜられる。その点ではYe et al.(2009) と同じなんだけど、計算量はこちらのほうが少ない。で、本当にいいアイデアだとしたら、どこかちゃんとしたところに出さないといけないんじゃないのかなーみたいなことをずっと漠然と思っている。

でも、なかなかそれが難しい。

なぜか。

論文を書くのに必要な動機付けの問題という気がする。


一般に、論文を書く動機付けとは何か。

アカデミア(学術界)の場合を考える。

  1. 業績
  2. 研究者としてのトレーニング
  3. 学術界への貢献

全体として見れば重要なのは 3 なんだろうけど、それだけじゃシステムが回らないので、個人レベルでは 1 の「業績」というのが主な動機付けで、修士などの場合は 2 の比重が大きいといったところだろうか。

しかし、今のぼくはもう研究者という道は考えていないから 2 はないし、1 の業績もエンジニアとして生きていくうえでどれだけ役に立つかは微妙なところだ。3 だけだと、先行研究をきっちり調べて実験して結果を出して…という地道な作業になかなか身が入らない。いくら無職でふらふらしているといっても、それはやりたいことをやる(「やりたいこと」は何もしないでダラダラすることを含む)ためだし。


だから、何かやったら業績になるような人がやってくれたら、または共同研究という形にでもできたら、と思うんだけど。

しかし、この可変次数 CRF というのは、人に伝えるのが難しい。論文のメイン部分を英訳したのはいいけれど、これって読んでも伝わらないよなぁと思う。情報数学ではありがちなことだけど、ホワイトボードを使ってイメージで伝えたらわかりやすいようなものでも、厳密な式にするとかなり複雑になったりする。可変次数 CRF もそのタイプのもので、ホワイトボードを使ったら伝えられるかもしれないけれど、数式だけでは読んでもなかなかわからない。

そもそも、ぼくがいいアイデアだと思っていても、実際はどうかわからないという問題もある。これが、国際学会に通っていて、いいアイデアだということがある程度保証されているようなものだったら、数式だけでも頑張って読んでもらえるかもしれないけれど、海のものとも山のものともつかないアイデアについて、苦労して数式を解読してもらうということはなかなか期待できない。

これが、もう少し単純なもの、たとえばN-gram デコードみたいなものだったら、解説記事を書いて人に伝えるということができるんだけど、可変次数 CRF はそこまで単純じゃない。CRF の説明には最大エントロピーモデルが必要だけど、そこから解説すると長くなる。普通の CRF を理解している人を対象にすると狭くなりすぎる気がするし…。

Twitter の TL で興味を持ってくれそうな人はいないこともないんだけど、みんなアカデミアじゃないしなぁ。


やっぱり、よく考えると可変次数 CRF のほうは詰んでる気がしてきた。

いったん忘れよう。


とりあえずは、N-gram デコードという単純なネタのほうで、アカデミアの誰かと共同研究する道を探るのがいいのかもしれない。

というわけで、N-gram デコード(解説記事)の研究を一緒にやってくれる人を募集します。

プログラムは PythonC++ のものがあります。