第4回関西入力メソッドワークショップでの発表資料など
関西入力メソッドワークショップ、通称 IM 飲み会で発表してきました。
ワークショップの様子やそれぞれの発表内容については @mamoruk さんが29日の日記に書いてくださっています(それにしても @mamorukさんの執筆能力はすごい)。
私が発表した「用言活用を考慮したN-gramかな漢字変換」の発表資料をアップロードしました。
http://www.slideshare.net/takeda25/ngram-kanakanji-conversion-with-grammatical
また、ソースコードと辞書ファイルは GitHub にアップロードしてあります。
https://github.com/hiroshi-manabe/ngram-converter-cpp/tree/inflection
いろいろと未完成で、とても見せられたものではないのですが、まあ一応。
make
./converter-main -i dict/bccwj
のようにして、
キョウハイイテンキデスネ
のように入力すると、
キョウ/今日/名詞-普通名詞-副詞可能/ ハ/は/助詞-係助詞/ イイ/いい/形容詞-非自立可能/P 連体形-一般 テンキ/天気/名詞-普通名詞-一般/ デス/です/助動詞/H 終止形-一般 ネ/ね/助詞-終助詞/
のような結果が返ってくることになっています。
marisa trie を使っています。
他の環境での動作に自信が持てないので、ブラウザ上での手抜きデモを作りました。
http://vocrf.net/test/morph.html
上の入力欄にカナ列を入れ、convert ボタンを押すと、下に解析結果が出てきます。
よければ試してみてください。