雑感2

今日も引き続き、ソウルジェムの穢れをまき散らすような日記を書いてみる。


なぜ論文を書きたくないか。
それは、「そりゃこれは書かないとだめだよね」と納得できる以上のことを書かないといけないからだ。


まず、先行研究。
修士のころ、論文を書いていて「先行研究の数が少ない」とよく言われた。
はぁぁ?
先行研究が、「少ない」、って?
お前は何を(ry


自分としては、その研究に関連する論文は精一杯列挙したつもり。
もちろん、それで網羅できているとは限らないので、研究内容を誰かが見て「この内容ならこの論文に言及していないのはおかしい」と言ってくれたら、それはすごくありがたい。
でも、先行研究が「少ない」ってねぇ。
量って売るの? 先行研究って。


だいたい、一つの研究に多くの先行研究があって、それらの中身を書かないといけないとしたら、その時点で何かおかしいんじゃないの。「親クラス」にあたるような先行研究についてはそれなりに書かないといけないと思うけど、そういうのが多くあるというのはおかしい。多重継承禁止、とまでは行かなくても、せいぜい 2個ぐらいじゃないのか。また、手法として利用しているというものに関しては、その論文で中身まで書く必要はないんじゃないか。何のために参考文献があるのか。


また、自分がやっていた・やっているのは一貫して「アルゴリズム=計算方法」(可変次数 CRF/N-gram の)なのだが、それについて、応用上の性能(タグ付け精度なりとか)が求められるというのも違和感がある。


例えば、かけ算の筆算を例にとる(わかりやすさのためのたとえであって、自分のしていることの有用性を主張するものではない)。かけ算の筆算を発明した人がいたとして、その人が示すべきなのは、その方法によってそれまでのやり方よりも計算が速くできるということまでなんじゃないか、ということ。アルゴリズムの研究に応用上の性能を求めるというのは、かけ算の筆算を発明した人に「筆算を使うとかけ算が速くなるのはわかったけど、それがどう役に立つか教えてよ」というようなものじゃないの。本人からしたら、「えっ、かけ算使わないの? 速くできたらうれしくないの?」ってところだろう。


昨日も書いた通り、自分では自分のしていることにずっと自信を持っている。可変長 CRF を学会に発表するまでは、「今事故に遭ったらどうしよう」という気持ちがずっとあったぐらいだ。今死んだら、研究内容が失われてしまうんじゃないかと思って。どれだけ小さいものであっても、それが新しい/役に立つことなら、それが失われるのは惜しい。


今ではその心配はしていない。国内とはいっても、第一線の人たちが参加するところで発表して、さらにソフトウェアを作って GitHub で公開して、それ用のサイトを作って、 そのリンクも論文に書いた。これで何かが失われるとしても、それは自分の責任ではないと思えるところまでは頑張ったと思う。