2016-01-01から1年間の記事一覧

ドイツ語分割

ドイツ語分割スクリプトを作りました。デモはこちら。German Word Decomposer Demo上のテキストエリアに例えば"Rindfleischetikettierungsüberwachungsaufgabenübertragungsgesetz"と入れると、下のテキストエリアに"Rindfleisch-Etikettierungs-Überwachung…

ニューラルかな漢字変換の細かいツッコみどころ

ニューラルかな漢字変換という記事へのツッコミです。いや、ニューラル部分はいいんですよ。ぼくはやってないから。 ツッコみどころは、ごく細かいところです。注釈の、「かな漢字変換はN=3以上にしても精度が上がらないことが実験により確かめられています…

責任と対策の分離

通常の場合、何かの問題に責任のある人がいる場合、その人に何とかしてもらうのが筋です。それが原則です。ただ、責任のある人が多数である場合など、その人たちに何とかしてもらうことが難しい場合、発想を「責任」から「対策」に切り替える必要があります…

ちょまど氏をめぐる異常事態

最近、Xamarinという製品についての勉強会で炎上騒動がありました。初期の記事としては、以下のものがあります。 xamarinコミュニティの炎上について思うこと その後、主催者側や批判側からいろいろな記事が出て、泥沼の様相を呈していました。以下はその例…

機械翻訳は自動織機ではなくチェーンソーであるという話と、その帰結

先日、機械翻訳と意味という記事を書きましたが、それ以降も新Google翻訳の精度向上はあちこちで話題になっています*1。 新Google翻訳を使って3700ワードの技術文書を1時間で翻訳したGoogle翻訳の強化でもっとも得するのは翻訳家という妙 共通して述べられて…

機械翻訳と意味

ここ最近、Google翻訳がリニューアルされ、性能が向上したという話が流れてきたので、さっそく試してみた。ぼくが真っ先に試したのは、「母は、父が誕生日を忘れたので、怒っている。」だ。なぜこの文が気にかかっていたかは後述する。 結果は次の通り。 "My…

Wikipediaから人名(姓・名別、読みつき)を取り出す

小ネタです。日本語Wikipediaから人名(姓・名別、読みつき)を取り出すスクリプトを書きました。 https://github.com/hiroshi-manabe/extract_jawp_names 日本語の処理をする際に、Wikipediaのデータを使うことは多いと思います。いろいろと便利なWikipedia…