2017-03-23

青春→鯖鰆みたいなやつ

今日、こんなツイートを見かけました。

娘１のクラスの寄せ書き、「楽しかったよ」「また会おうね」が多い中、キラリとひかる名文発見。「青春って魚編をつけると鯖鰆（サバサワラ）って読めるよね。似たような熟語を見つけたら教えて」By 町田高史(仮名)
彼が無事に社会に適応できますように。
— 藤川ｵﾚﾝｼﾞｰﾅ (@Forangina) 2017年3月21日

ぼくもこういうのは大好きです。

（社会に適応できているかどうかは微妙なところです）

それで、こういうのを探してみることにしました。

漢字の構造については、漢字構造情報データベース（CHISE）というものがあります。

（かなりの労力がかかっていると思われるデータベースです。作られた方に感謝します。）

今回は、これを使わせていただきます。

% git clone http://git.chise.org/git/chise/ids.git

この中の IDS-UCS-Basic.txt が CJK 統合漢字のファイル、IDS-UCS-Ext-A.txt が CJK 統合漢字拡張 A のようです。

表示できない文字ばかり出ても面白くないので、今回はこの二つだけを使うことにします。

それと、元ツイートで言う「青春」のような、加工元の単語が必要です。

今回は、Wikipedia のタイトルを使うことにします。

% curl -LO https://dumps.wikimedia.org/jawiki/latest/jawiki-latest-all-titles.gz
% gunzip jawiki-latest-all-titles.gz

後は、簡単な Perl のワンライナー（1行スクリプト）で、加工元の単語それぞれについて、「すべての文字に共通の部品を足すことができるもの」を探すだけです。

% perl -Mutf8 -CSD -F/\\t/ -nale 'if (@ARGV) { next if $F[2] =~ s{(\p{Han})}{$1}g < 2; for $i(0..length($F[2])-1) { $ch = substr($F[2], $i, 1); if ($ch =~ m{\p{Han}}) { $dict{$ch}->{substr($F[2], 0, $i).".".substr($F[2], $i+1)} = $F[1]; } } } else { next unless $F[1] =~  m{^(\p{Han}{2,})$}; %n=(); @n{split//, $F[1]}=(); next unless keys(%n)==length($F[1]); %t = (); while ($F[1] =~ m{(\p{Han})}g) { for $key(keys %{$dict{$1}}) { $t{$key}++; } } for $key(keys %t) { ($k=$key) =~ s{\P{Han}}{}g; $s=join("", map { $dict{$_}{$key}; } split(//, $F[1])); print "$F[1]+$k=$s" if $t{$key} == length($F[1]) and not exists $e{$F[1].$s}; $e{$F[1].$s} = (); } }' ids/IDS-UCS-Basic.txt ids/IDS-UCS-Ext-A.txt jawiki-latest-all-titles > list.txt

できたファイルはgistに置いてあります。

16万行もあるので見るのはちょっと大変です。

この中から、面白そうなものを見てみることにしましょう。

まずは、一番長いものです。

% perl -Mutf8 -CSD -nle '$dict{$_}=(); END { print for sort {length($b)<=>length($a)} keys %dict; }' list.txt | head

一番長いものは9文字でした。

世田谷区教育委員会+⺡=泄沺浴沤漖淯涹溳浍
連合国軍最高司令官+木=槤㭘椢楎樶槁柌柃棺
国土交通省大臣官房+木=椢杜校樋㮐杕栕棺椖

「世田谷区教育委員会」、全部さんずいがつけられるんですね。

次に、足す部品ごとに、一番長いものを探してみます。

% perl -Mutf8 -CSD -nle '@F=split/[\+=]/; $dict{$F[1]}=$_ if length($_) > length($dict{$F[1]}); END { print $dict{$_} for sort keys %dict; }' list.txt

いくつか拾うと、次のような感じです。

喜多見不動堂+⺖=憘恀悓怀慟憆
共産主義者同盟+⺘=拱摌拄㩘㨋挏擝
青少年委員会+⺼=腈䏚脌腇䐣脍
企業年金連合会+口=㖉㗼哖唫嗹哈哙
喜多見不動尊+火=熺㶴䙺炋㷲燇
風林火陰山雷+疒=瘋痳疢癊疝癗
連邦取引委員会+糹=縺綁緅紖緌縜絵
原子力安全委員会+艹=蒝芓艻荌荃萎蒷荟
世界長者番付+言=詍䛺䛫諸譒詂
月火水木金土+門=閒焛閖閑䦦䦌
軍人皇帝時代+魚=鯶魜鰉䱱鰣鮘
公民身分番号+鳥=䲲鴖鵢鳻鷭鴞

（Wikipedia に「日月火水木金土」という記事はないようですが、「間」があるので「間閒焛閖閑䦦䦌」と揃いますね）

ほかに、よく出てくる単語についても見てみます。

Wikipedia でリンクが張られている数が多いもの順にリストを作ります。

% curl -Ls https://dumps.wikimedia.org/jawiki/latest/jawiki-latest-pages-articles.xml.bz2 | bzcat | head -n 1000000 | perl -Mutf8 -CSD -nle '$dict{$1}++ while m{\[\[(\p{Han}{2,})\]\]}g; END { print for sort { $dict{$b}<=>$dict{$a} } keys %dict; }' > frequent.txt
% perl -Mutf8 -CSD -nle 'if (@ARGV) { m{^(\p{Han}+)}; $dict{$1}->{$_}=(); } else { print for keys %{$dict{$_}}; }' list.txt frequent.txt > frequent_plus.txt

目視でいくつか拾ってみました。

大久保利通+木=杕杦椺梸樋
足利尊氏+⺡=浞浰澊汦
日清食品+艹=䒤蔳䓹䓵
武田信玄+女=娬㚼㜃妶
吉本新喜劇+口=咭呠噺嘻㘌
小林多喜二+亻=仦㑣侈僖仁
長宗我部元親+艹=萇萗莪蔀芫藽

最後に、この記事を公開するにあたって、はてなダイアリーは EUC-JP なので、EUC-JP で表せない漢字を実体参照にしました。

% perl -Mutf8 -MEncode -CSD -i.bak -ple 's{(\p{Han})}{ Encode::encode("shiftjis", $1) eq "?" ? sprintf("&#%d;", ord($1)) : $1; }ge;' draft.txt

やっぱり、こういうちょっとしたテキスト処理には Perl のワンライナーが便利です。

awk や sed やるぐらいなら Perl おすすめですよ！

ツイッターでぼくの言いたいことを言ってくれている人がいたので、ツイートを貼っておきます。

perl、素晴らしいものだと最近ようやく分かってきた。今まで誤解してた。いやまぁ単体の言語としては(?)微妙だけど、コマンドラインオプション諸々を含めた perl コマンドとしてみると拡張 grep、sed、awk といった感じで実に素晴らしい。
— にゃおきゃっと (@nyaocat) February 24, 2017

ミニマルperl読み進めてくたびに perl 最強かよという気持ちになるし、チマチマ find の難儀なオプションおぼえたり sed や grep や awk で使える正規表現の差を把握してしまったり BSD 環境で色々悲しくなってた過去の苦労、無駄だったな……という気分だ
— にゃおきゃっと (@nyaocat) February 24, 2017

単純なので xargs 覚えた時は xargs 最強やん！と思って find の -exec オプションや for とか書かなくなったし、awk 覚えたら大体 awk でいけるやん！となって cut とか使わなくなったし、perl 覚えた今は全部 perl でいいやん！となった
— にゃおきゃっと (@nyaocat) 2017年3月2日

マジで perl ワンライナー最強だなと日々感動するし多くのプログラマが学んだ方が良い、perl という言語ではなく perl というコマンドを学んだ方が良い
— にゃおきゃっと (@nyaocat) 2017年3月10日

紹介されているミニマル Perl、ぼくは読んだことがないので読んでみたいのですが、中古しかないのが残念です。

ところで、漢字に部首をつけるのが何の役に立つかを考えたのですが、検閲のある SNS などでヤバい単語を書くのにいいかもしれません。

リストを見ると、

本番行為+⺡=泍潘洐溈
本番行為+⺮=笨䉒筕䈧
本番行為+艹=苯蕃荇蒍

なんてのがありました。（ろくでもない）

*1:なぜ "shiftjis" にしているかは面倒なので略。

2017-01-21

適当に情報を消費する人たち（Amazon Dash Buttonについて）

Amazon Dash Buttonは何がヤバイのかという記事が最近バズっていましたね。

この記事の中で、「電池の寿命が1年」というのがキーのひとつになっているというところはいいですよね？

また、1年ごとに電池が切れるのもえげつない。

1年で電池が切れるからこそ、Amazonプラットフォームが広告市場として成立するのだ。
Amazon Dash Buttonによって、広告費の投入先がテレビCMから、Amazonプラットフォーム上に移動したのだ。

（強調は引用者）

ところで、"Amazon dash battery"といったキーワードで英語版のGoogleで検索すると、次の記事が出てきます。*1

Amazon Dash Button Teardown

This means the ~1200 mAh battery should be able to power the device for at least four hours while on and decades while in sleep. Since the button is only on for a few seconds when activated, it can probably be used close to 1000 times before the battery dies. Thus, the button should become obsolete long before the battery is depleted.

（つまり、~1200 mAhの電池はオンの状態で最低4時間、スリープ状態で数十年間給電できるはずだということになる。ボタンはアクティベートされたときに数秒間しかオンにならないので、電池が切れるまで1000回近く使えるだろう。そういうわけで、電池が切れるずっと前にボタン自体が必要なくなっているはずだ。）

実際に"decades"（数十年）持つかどうかはともかく、5年でも持つなら、話は全然変わってきますよね。

この記事が正しければ、元記事の「電池の寿命が1年」というのが見当違いであるという点について、問題ないですよね？*2

さて、もうひとつポイントを押さえておきます。

・英語圏で最初に出た製品について情報を得るのに、まず英語で検索するというのは、基本中の基本である。

これは私の意見なのですが、みなさんはいかがでしょうか。

よって、私には、現状が次のように見えています。

・キーとなる情報について、基本中の基本といえるような調査が行われておらず、結果として考察が見当違いになっている記事に、2480ブクマ（はてなブックマーク）もついている。

いや、ネット上の情報が玉石混淆だという点については非常に今さらなんですけどね。

これだけの人数がいて、「おかしい」と思う人がほとんどいないというのはどうなんでしょうね。

目から鱗が落ちたという人がブコメにたくさんいますが、頭大丈夫ですか？

*1:これは旧バージョンについてのものです。新バージョンはこちら。

*2:新バージョンではさらに電力消費が抑えられているのでなおさらです。

2016-12-29

ドイツ語分割

ドイツ語分割スクリプトを作りました。

~~デモはこちら。~~

~~German Word Decomposer Demo~~

上のテキストエリアに例えば"Rindfleischetikettierungsüberwachungsaufgabenübertragungsgesetz"と入れると、下のテキストエリアに"Rindfleisch-Etikettierungs-Überwachungs-Aufgaben-Übertragungs-Gesetz"となって出てきます。

レポジトリはこちらです。

https://github.com/hiroshi-manabe/german-word-splitter

新旧正書法に対応しています。

旧正書法では、例えば"Schiffahrt"は"Schiff-Fahrt"になります。

何をもって分割単位とするかは難しいところなのですが、"Bahnhof"（駅）や"Krankenhaus"（病院）のようなものは切らないという方針で、まあそうすると微妙なものがたくさん出てくるのですが、頻出語についてはある程度目で見て切る切らないを決めました。

2016-12-28

ニューラルかな漢字変換の細かいツッコみどころ

ニューラルかな漢字変換という記事へのツッコミです。

いや、ニューラル部分はいいんですよ。

ぼくはやってないから。

ツッコみどころは、ごく細かいところです。

注釈の、「かな漢字変換はN=3以上にしても精度が上がらないことが実験により確かめられています。詳しくは私の論文(リンク)を参照ください。（ドヤァ」という箇所です。

それ、BCCWJのコアデータだけ使った場合ですよね。

ぼくは以前、N-gram かな漢字変換を作って公開したことがあります。

これは、京都大学で公開している言語モデル配布ページの、BCCWJ全体を使ったものです。

実装はhttps://github.com/hiroshi-manabe/ngram-converter-cppにあります。

http://vocrf.net/test/ime.htmlで、4-gram かな漢字変換をテストできます。

（PCで、PCのIMEを切って、IME On/Off ボタンを押します）

これでやったら、例えば「今日の天気は」等は変換できます。

（ちなみに、例えば「てんきがおとずれた」はちゃんと「転機が訪れた」になります。）

まあ、ぼくのやつはテストデータと訓練データを分離したちゃんとした実験をしていないので、うまくいって当たり前と思われるかもしれません。

でも、BCCWJコーパス全体の中に「今日の天気」は47件もあるので、訓練データとテストデータを分けたとしても、偏りなく分ければ訓練データにも多数含まれることになります。

（ところで、言語モデル配布ページのkkc-BCCWJ.tarの中の3-gram.fwkを見ると「2 今日/きょうの/の天気/てんき」となっていて、3-gram が2個しかないことになっているんですよね。少納言などで調べると47件あるのに。どうしてこうなっているんでしょうか？）

いや、ぼくのやつはちゃんと論文にしてないし、これがどこかの知らない人なら、「お前の 4-gram 変換なんて知らん」と言われたらそれまでなんですけどね。

不思議なのは、yoh_okuno さんは昔Ngramかな漢字変換とMozc辞書の比較（現在はプライベートモード）という記事を書いて、（ぼくがサボってた）精度の検証をしてくれているということです。

そのときに、変換結果を見ていたら、2-gram じゃできないような変換（元記事で書かれているようなもの）が 4-gram でできているということに気づいて、「かな漢字変換はN=3以上にしても精度が上がらない」ということが一般的には言えないとわかってもいいはずだと思うんですよね。

まあ、今回の記事のやつはコアデータだけ使っているということで、それでニューラルでうまくいっているのはほんとすごいとは思うんですけど。

単純に、不思議だなぁという話でした。

2016-12-06

責任と対策の分離

通常の場合、何かの問題に責任のある人がいる場合、その人に何とかしてもらうのが筋です。

それが原則です。

ただ、責任のある人が多数である場合など、その人たちに何とかしてもらうことが難しい場合、発想を「責任」から「対策」に切り替える必要があります。

はい、ちょまど氏の件です。

人間を人間として扱わないからサークラ問題が起きるんだよ

確かに、ちょまど氏は合法手しか打っていないので責任はありません。

責任はちょまど氏をアイドル扱いする側にあります。

ただ、「アイドル扱いをやめろ」「人間扱いしろ」という言葉で、問題が魔法のように解決するというわけではありません。

さて、ちょまど氏がこの状況を意識的に作っているなら、合法手だけを打っているちょまど氏を止める方法はありません。

でも、ちょまど氏は本当にこの状況を望んでいるの？ というのが、前記事の問いかけでした。

ちょまど氏がこの状況を望んでいないのであれば——もちろん、ちょまど氏には何の責任もないのですが——この状況を変える鍵はちょまど氏にあるのではないか。

というのが、私の考えです。

で、ちょまど氏が望んでいないのであれば、という前提で。

そうであれば、ちょまど氏は現状分析ができていないと思われます。

（できていれば、今の行動になっていないはずなので）

だから、現状分析（表層意識で意図していなくても、結果としてチヤホヤされる行動になっている）を提供しようと思ったわけです。

で、なぜその表層意識と行動のずれがあると私は考えているか。

そこで初めて、男性恐怖の話が出てくるわけです。

整理すると、以下のようになります。

1. ちょまど氏は今の状況に対する責任はない。

2. よって、ちょまど氏が今の状況を望むなら、誰もそれに干渉できない。→終わり

3. ちょまど氏が今の状況を望んでいないのであれば、行動を変えるという選択肢がある（変えなければそのまま）。

4. 行動を変えるという選択肢を選ぶ場合、現状分析が必要なので、私なりにそれを提供したい。

5. 私なりの現状分析は、ちょまど氏の表層意識と潜在意識にずれがあるというものである。

6. その原因は、ちょまど氏の男性恐怖である。

つまり、3 の前提が外れている場合（ちょまど氏が今の状況を望んでいる）や、4 の前提が外れている（行動を変えるという選択肢を選ぶつもりはない）のであれば、前の記事は「見当違いかつお節介」でしかなかったわけです。

そこは賭けなのでしょうがないですね。

私としては、3 と 4 の前提が当たっている（ちょまど氏は今の状況を望んでおらず、何かそれに対してできることがあるならしたいと思っている）ことを願っています。

2016-12-05

ちょまど氏をめぐる異常事態

最近、Xamarinという製品についての勉強会で炎上騒動がありました。

初期の記事としては、以下のものがあります。

xamarinコミュニティの炎上について思うこと

その後、主催者側や批判側からいろいろな記事が出て、泥沼の様相を呈していました。

以下はその例です。

JXUG 名古屋ハンズオンでの事実について

続ちょまど問題

これらの記事を見てもわかるように、ちょまど氏をめぐっては、アンチとファンが非常にはっきりと分かれています。

（アンチ・ファンというのは語弊がありますが、あえてこう書きます）

どちらにも著名な人・技術的に優れた人がいるので、お互いに「あの人は技術的には尊敬できるのに、なんでこの問題ではあんななんだろう」と思うようなことも多いんじゃないでしょうか。

これは、はっきり言って異常事態だと思います。

一人の人間をめぐって、アンチとファンの間で分断が起こるということ自体、異常事態である。

まずは、アンチ・ファン共に、この認識からスタートする必要があるのではないでしょうか。

残念ながら、ここで相手の動機を邪推して、それで済ませてしまう人がたくさんいます。

アンチ側の人は、ファン側の人を、「ただやりたいだけなんだろう」と思っている。

ファン側の人は、アンチ側の人を、「ただ嫉妬しているだけだろう」と思っている。

でも、お互い人間なので、実際はそこまで単純ではないのではないでしょうか。

仮にいたとしても、それは双方の最悪なごく一部だけかもしれません。

そういう最悪同士はわかり合うことは無理にしても、残りの人たちはわかり合う余地があるのではないでしょうか。

それが、私がこの記事を書く目的です。

アンチ側の感覚

ファン側の人には、アンチ側の人は嫉妬していると考えている人が多いようです。

ちょまど氏がMicrosoft社のエバンジェリストになったタイミングで、結城浩氏が「妬みについて」という連ツイをしていましたが、その見当外れっぷりに思わず失笑してしまいました。*1

ちょまどがマイクロソフトのエバンジェリストになったタイミングで結城浩が「妬みについて」という連ツイをしたの、正視に耐えないぐらい最高だった https://t.co/rIyntBtYWZ （コロケーションがおかしい）
— Hiroshi Manabe (@takeda25) 2016年11月30日

そもそも、嫉妬という感情は普遍的なものなので、それが原因であれば、いつもそういうことが起こっているはずなんですよね。

それでは、今回の異常事態を説明できません。

「おまえがいま感じている感情はただの嫉妬だ。しずめる方法は俺が知っている。俺に任せろ。」みたいなことを言っても、言われるほうとしては、何言ってんだこいつという感じですよね。

この件に関して、嫉妬というのは主な原因なのでしょうか。

男女に分けて考えてみましょう。

前提として、アンチ側には、ファン側の人がちょまど氏を一人の女性として持ち上げているように見えているということがあります。

（これについては、xamarinコミュニティの炎上について思うことに書かれています）

ファンの人にそういうつもりはなくても、「そう見えている」ということは押さえておいたほうがいいと思います。

その前提で言うと、男性がちょまど氏に嫉妬するというのは明らかにおかしな話です。

男女を入れ替えて考えてみましょう。

学校のクラスで、アイドルのような男子生徒が多くの女子生徒にチヤホヤされているとして、チヤホヤしていない少数派の女子生徒は、その男子生徒に「嫉妬」するでしょうか？

しないですよね。

嫉妬というのは、自分と似たような立場（性別など）の人に対して起こることが多いものです。

一般男性がアイドル女性に嫉妬するというのは、一般女性がアイドル男性に嫉妬するというのと同じぐらい、考えにくい想定です。

では、女性はどうか。

ちょまど氏のようになりたいと思う女性がもしいれば、ちょまど氏に対して嫉妬してもおかしくないかもしれないですね。

でも、私の観測範囲では、以下のような考え方が圧倒的です。

「くっそキモい男達だな、このちょまどって人はこれを好きでやってるのか、それとも会社の命令でやってるのか知らんけど
前者だとしたら何考えているのか分からんし、後者なら気の毒過ぎる」としか思えない

http://anond.hatelabo.jp/20161130112113

女性からすると、好かれたいと思わない人間に好かれてもうれしくないというのが大きいようです。

身近に女性がいる男性の方は、この件に関して一度意見を聞いてみるのもいいのではないでしょうか。

では、アンチ側の男性はどういった考えなのでしょうか。

私が見る範囲では、以下のような考え方が多いように思います。

ちょまどさん問題
ざまりんに興味無いからへらへら笑って見てられるけど、こういう光景が自分が好きな技術勉強会で繰り広げられてることを想像すると吐き気しますね
2016/11/30 15:45

ファン側の感覚

アンチ側の人には、ファン側の人はちょまど氏の性的魅力に目がくらんでいると考えている人が多いようです。

これに関しては、一部にそういう人がいることは事実です。

日本マイクロソフトに入社した「ちょまどさん」がめちゃくちゃ可愛い件について

これは、完璧にちょまど氏を性的な視線で見ていますよね。

ファン側の人で、実際にちょまど氏の性的魅力に目がくらんでいて、それを堂々と表明するような人は、アンチ側の人との和解の余地がありません。

しかし、全員がそうではないはずです。

例えば、上で「妬みについて」を書いた結城浩氏ですが、彼がちょまど氏の性的魅力に目がくらんでいるとは考えにくいところです。

何より、ちょまど氏はずっと顔出しを（あまり）しないでツイッターで活動してきたため、中の人が男性か女性かすらわからないという状態が長く続いていました。

その状態で性的魅力で目がくらむというのはありそうにないですよね。

では、ファン側の人たちはちょまど氏のどういうところに惹かれているのか。

これについては、有名な「フロッピーディスクの正体」のまとめが参考になるのではないかと思います。

これは、フロッピーディスクというものを見たことがないというちょまど氏に、それがどういうものが周りの人が教えてあげるというものです。

あまり悪意のないコメントとして、以下のようなものがあります。

フロッピーディスクの正体 - Togetterまとめ
すごいすごいっていう反応におじさんたちが喜んでる平和な図かな：フロッピーディスクの正体 - Togetterまとめ
2014/06/17 10:53

ちょまど氏は、こういう「すごいすごい」という反応をする、いわゆるマンスプレイニングを聞いてあげるのがすごく上手なんですよね。

こういうところに惹かれてちょまど氏を好きでいる人も多いのではないでしょうか。

アンチの人からすると、それでも気に入らないかもしれませんが、少なくともそれは性的魅力を直接使っているわけではないということは押さえておく必要があると思います。

整理

いったん整理します。

アンチ側の人の中には、嫉妬して叩いているわけではなく、「オタサーの姫と取り巻き」的な状況を嫌っているというだけの人もいる。

ファン側の人の中には、性的魅力に目がくらんでいるわけではなく、ちょまど氏のキャラを好きでいるという人もいる。

こういう人たちの間では相互理解が可能なのではないかというのが、私の考えです。

共通の目標を目指すことはできないでしょうか。

ちょっと現状を離れて、理想的なコミュニティの姿を考えてみましょう。

“男女比が5:5、あるいはそこまで行かなくても7:3ぐらいで、男性も女性も「性」について意識することなく技術に集中している”

これであれば、アンチ側の人もファン側の人も、理想的な姿として考えられるのではないでしょうか。

アンチ側の人にとっては、姫と取り巻きという構図がなくなればそれでいい。

ファン側の人にとっては、元々「性」について意識することは本意ではない。

目標としては、いい落としどころではないかと思います。

現状

では、現状はなぜ今のような惨状（あえてこう書きます）になってしまっているのでしょうか。

そこには、やはり「ちょまど氏のキャラ」を避けて通ることができないのではないかと思います。

（責めることが目的ではないので、ファンの方も激高せずに読んでいただければ幸いです）

ちょまど氏のキャラについては、ファンとアンチで見方が完全に違います。

ファンから見ると、健気にがんばる素直な女の子。

アンチから見ると、キモオタに媚びる姫。

いったい、どちらが本当のちょまど氏なのでしょうか。

これは、「表層意識」と「潜在意識」のずれによるものなのではないかと、私は考えています。

表層意識

ちょまど氏は、本当に心の底から、「よくあろう」としているのだと思います。

こう書くと、アンチ側の人は「そんなはずがあるか」と思うところかもしれません。

ああいう「姫」が計算高くないわけがない、そんな姫は見たことがない、と。

しかし、考えてみてください。

ちょまど氏が普通の「姫」であれば、ここまでの事態になっているでしょうか？

自分の性的魅力に自覚的な計算高い「姫」は、そこら中にいます。

しかし、ちょまど氏は普通の「姫」ではなく、全国レベルの「姫」なのです。

そうなるためには、健気さが本物である必要があった。

作られた健気さでは、例えば結城浩氏のようなレベルの人が「釣れる」こともなかったでしょう。

アンチ側の人も、ちょまど氏が「本物」であるという可能性を真剣に考える必要があります。

潜在意識

アンチ側の人には、ちょまど氏が「男に対する媚びの塊」のように見えています。

これは特に女性に顕著です。

自分がああいう行動を取るとしたら、それは「媚び」以外ではありえない、ということです。

では、ちょまど氏は男に対して媚びているのでしょうか。

私は、それは半分当たっていて、半分外しているのではないかと思います。

「ちょまど氏は、みんなに平等に好かれようとして（媚びて）いる」というのが実際のところではないでしょうか。

ちょまど氏は、人に好かれたいという気持ちが人一倍強い。

それで、無意識のうちに、人に好かれるように自分の行動を調整しているのだと思います。

しかし、ちょまど氏の周囲にいるのは、ほとんどが男性です。

すると、「人に好かれるように」というのが、自動的に「男性に好かれるように」になってしまいます。

それだけのことであって、ちょまど氏本人は女性にも好かれたい、むしろ女性にこそ好かれたいのではないかと推測しています。

それにしても、みんなに好かれたい人が、結果として男性にしか好かれないような行動を取っているとしたら、ちょっと不思議ですよね。

そこには、ちょまど氏の「男性恐怖」が関わっているのではないかと考えています。

男性恐怖

ちょまど氏のことをよく見ている人であればわかると思いますが、ちょまど氏には「男女関係に対する恐怖」があります。*2

男女関係には性欲が強く絡み、人間関係もドロドロしたものになりやすく、ちょまど氏の心はそういうものに耐えられないようです。

ちょまど氏がそういうものに触れた後に動揺し、心を落ち着けるために「ホモ*3」を摂取する、というのを見たことがある人もいるのではないでしょうか。

（私は昔ツイッターでフォローしていたので見ていました）

それがなぜ、男性にしか好かれないような行動につながるのか。

一見、矛盾しています。

これは、ちょまど氏が「男性の性欲に目をふさいでいる」と考えるとつじつまが合います。

上の女性の意見を再掲します。

「くっそキモい男達だな、このちょまどって人はこれを好きでやってるのか、それとも会社の命令でやってるのか知らんけど
前者だとしたら何考えているのか分からんし、後者なら気の毒過ぎる」としか思えない

この女性は、なぜ「男達」を「キモい」と感じるのでしょうか。

それは、彼らの性欲が、あまりにも明らかに透けて見えるからです。

だから、なぜちょまど氏がこういう行動を取っているのか、さっぱり理解できないのです。

しかし、ちょまど氏に彼らの性欲が見えていないとしたらどうでしょうか。

そうすると、ちょまど氏には彼らが「純粋なファン」に見え、自分のことは「ファンに好かれる私」に見えているはずです。

たとえ、外から見るとそれは、「キモオタに囲まれて喜んでいる何考えているかわからない女」であるとしても。

そこには、VRで充実した生活を送る人と、その様子を見る人のような、大きなギャップがあります。

私は「モジャ公」のシャングリラ星を思い出しました。

わかりやすい「悪者」はいない

こう見ると、現在の惨状を招いたわかりやすい「悪者」はいないということがわかるのではないでしょうか。

「醜い嫉妬」「姫になりたい女」「性欲丸出しの男」といったわかりやすい敵を叩けば解決するような、そんな単純なものではないのです。

この問題を真剣に考えるのであれば、複雑さに向き合う必要があります。

（人が集まれば場がどれだけ荒れても構わないと考えるようなクズや、性欲丸出しで何が悪いと開き直るような人については、対話可能性がないので置いておきます）

究極の原因は、「ちょまど氏の表層意識と潜在意識のずれ」にあります（少なくとも、私はそう考えています）。

しかし、これが解決できるかというと、難しいものがあります。

というのは、潜在意識が表層意識の願望をかなえてしまっているからです。

ちょまど氏は、表層意識では「性と関係なしに、人に好かれたい」と思っています。

しかし、潜在意識では、周りの人（＝男性オタク）に好かれるような行動を取っています。

表層意識が「性」の存在さえ無視すれば、「人に好かれたい」という願望は実現されています。

ここで、解決の可能性があるとすると、ちょまど氏の表層意識に「性」を意識させるということがあるでしょう。

「日本マイクロソフトに入社した「ちょまどさん」がめちゃくちゃ可愛い件について」の記事からもわかるように、「性」でちょまど氏を持ち上げている人がそれなりにいる、という現実を確認するということです。

ちょまど氏の表層意識がその現実を認識したら、彼女には二つの選択肢があります。

ひとつは、「性によって好かれている」という望ましくない状況を招かないよう、そういう人に毅然とした態度を取ること。

もうひとつは、これまで無意識にやっていたことを意識的にやる、つまり性を活用していくということ。

どちらを選ぶにしても、意識的になる分だけ状況がわかりやすくなります。

問題は、ちょまど氏本人にとっては、現状維持が最も望ましいということです。

後者（意識的に性を活用していく）の選択肢の不利益は明らかです。

社会的な非難もあるでしょうし、真面目なファンは離れてしまいます。

前者（性的な要素を排除する）でも、不純なファンが大幅に減ってしまうということが考えられます。

また、これまで「人に好かれる」ことに最適化して生きてきた人が、その思考回路を急に変えられるのかという問題もあります。

こう考えると、この状況の解決はやはり難しいのかもしれません。

個人的には、女性目線の意見が出てくることを期待しています。

本来は性別を限定したくないところですが、今回の場合は、ちょまど氏の男性恐怖という特殊事情があります。

それを考えると、男性の言葉はただでさえちょまど氏には届きにくく、もし下心などがあればなおさらです。

しかし、「女性の目にはちょまど氏がどう見えているか」ということを、まっすぐ敵意なしに伝えてくれる女性の声であれば、ひょっとするとちょまど氏に届くかもしれません。

女性にとって

この件に関して、女性は「近寄りたくない」と感じる人が多いようです。

性と承認欲求の渦巻く場はもううんざりだ、という感覚のようです。

女性は、似たような場面を実際に経験する機会が多いためでしょうか。

少なくとも、多くの女性にとって、ちょまど氏の存在は勇気づけられるものではないようです。

「男社会でうまくやっていくためには、あんなふうに男に媚びないといけないのか」と失望している人もいます。

外見や年齢的な条件から、「ブス・ババアのひがみ」と思われることを恐れて意見を表明することを避けているという人もいるかもしれません。

（非常に残念なことですが、そういう心ないことを言う男性はいます）

しかし、上で挙げた理想状態（男性も女性も「性」について意識することなく技術に集中している状態）に至るまでには、女性からの意見（できれば、業界で著名な女性に限らず、ごく普通の女性プログラマのものも含めて）も欠かせないと思います。

今回の件は、男女という要素が少なからず絡むものなのに、男性の意見しか出てこないというのは不自然ではないでしょうか。

女性が声を上げやすい雰囲気になればと思います。

まとめ

現状として、ちょまど氏のファンとアンチの間の争いという惨状があります。

しかし、それは本来であれば、性を利用することを否定するか肯定するかという、よりマシな議論にできるのではないかと思います。

その場合、現状のファンの中で不純な一派を切り捨て、また現状のアンチの中でちょまど氏本人を嫌っているわけではない人と合流することで、「否定派」という大きな枠組みで団結できるのではないでしょうか。

（私自身は明確な否定派です）

そうなることを願っています。

おまけ：元彼について

ちょまど氏の元彼についての心ない噂が出回っています。

というか、ちょまど問題の「さらに追記」部分で引用されていたのは私のツイートなのですが…。

あれは、私の友達がちょまど氏に関する噂について知りたがっていたので、一般的にそう思われていると考えられるところをまとめてあげただけで、事実という保証もありませんし、それに個人的な問題を攻撃に使うのは間違っています。

ちょまど氏の元彼の件でちょまど氏を貶めるような言説が出回っていますが、私はそういうものは唾棄すべきものだと思います。

そもそも、男性については男女関係が取りざたされることはあまりないのに、女性に関してはそういうことが起こりやすいとしたら、あってはいけないことです。

追記

ちょまど氏をめぐる異常事態 - アスペ日記
元カレの話は個人攻撃じゃなくて「ちょまどがおぼこじゃないってわかったらみんな離れていくよ」みたいなことを言ってたのがいたから誰もそんなこと思ってないだろって意味で書いたんだが
2016/12/07 00:44

書いたときの意図としては、「個人的な問題を攻撃に使うのは間違っています」は「ちょまど氏の元彼についての心ない噂が出回っています」にかかっていたのですが、きょうもえさんに言ったように読めますね。すみません。

まあ、それはそれとして。

ちょまど氏は Microsoft のエバンジェリストになった時点でファンの新規流入がだいぶあったと思われるので、「誰もそんなこと思ってないだろ」はちょっと同意できないですね。

例の引用で知った人も多いと思いますよ。

（厳密な割合はわからないので、水掛け論的ですが）

*1:彼の連ツイとちょまど氏の件との間に関連があるかないかは見る人次第だと思いますが、タイミング的に私には関連があるように見えました。

*2:ちなみに、男性恐怖症でも彼氏がいるということは普通にあります。

*3:実際の男性同性愛者同士の関係には性欲もドロドロした人間関係もあると思いますが、ここでの「ホモ」は腐女子のための理想化されたものです。

2016-11-28

機械翻訳は自動織機ではなくチェーンソーであるという話と、その帰結

先日、機械翻訳と意味という記事を書きましたが、それ以降も新Google翻訳の精度向上はあちこちで話題になっています*1。

新Google翻訳を使って3700ワードの技術文書を1時間で翻訳した

Google翻訳の強化でもっとも得するのは翻訳家という妙

共通して述べられているのは、「新Google翻訳の精度が下訳に使えるレベルになった」「新Google翻訳は、翻訳家にとって大きな助けになる」ということです。

さて、この記事を読む人であれば、ラッダイト運動というものについて聞いたことがある人も多いかと思います。

この運動は、機械によって雇用を奪われた手工業者が起こした機械破壊運動なのですが、このときに対象となった機械は、自動織機のような、人手を置き換えるタイプの機械でした。

それに対して、機械翻訳は、人間の能力を拡張（エンハンス）するタイプのものです。

人間の翻訳家を置き換えるものではなく、翻訳家によって使われることで、翻訳家の生産性を何倍にも上げることができることになりそうです。

これは、機械で言うと、自動織機よりもむしろチェーンソーのようなものではないでしょうか。

チェーンソーは作業の効率を上げてくれるものなので、例えば昔の木こりにチェーンソーを渡したとしたら、すごく感謝されそうですよね。

lifehacking.jp のほうの記事には、こんなタイトルの段落があります。

短期的には、英語のスキルを持っている人にとって朗報

まあ確かに、機械翻訳がチェーンソーのようなものであることを考えると、短期的には朗報であることは間違いないでしょうね。

しかし、私はこの「朗報」という言葉に引っかかってしまいました。

（それが、この記事を書くことにした直接のきっかけです）

確かに短期的には朗報かもしれないけれど、それで喜んでいていいのでしょうか。

中期的、長期的にはどうなるのでしょうか。

ここで、ちょっと仮想の世界の話を考えてみます。

この世界では、100人の木こりが働いていて、1日10本の木を切って、合計で毎日1000本分の木材を生産しています。
木こりは、木を1本切るごとに1000円をもらい、1日1万円の収入で生活しています。
ある日、この世界の山の洞窟に無料のチェーンソーの山があるということに、ある木こりが気づきます。
その木こりがチェーンソーを持ち帰って木を切ってみたところ、5倍の速さで木が切れて、1/5の時間でその日の仕事が終わってしまいました。
ゆっくり過ごす時間ができた木こりは大喜びです。

——と、ここまでが、上記の記事で述べられているような、短期的な状況ではないでしょうか。

さて、そこから先を少し考えてみます。

無料のチェーンソーの存在はそのうちみんなに知られてしまい、みんながチェーンソーを持つようになりました。
そうすると、効率が5倍になっているので、何人かの木こりは精いっぱいそれを活用しようとして、「私は50本の木を切る仕事を受けられますよ」と言います。
そういう木こりがある程度出てきたところで、残りの木こりは、受けられる仕事がなくなってしまったことに気がつきます。
そうなると生活ができなくなるので、ある木こりが「私なら、木を1本切るのに、1000円ではなく、500円でやりますよ」と言います。

そうこうするうちに、最終的には報酬は1本200円で落ち着き、20人の木こりが、1日50本の木を切って、1日に1万円を稼ぐようになりました。
残りの80人の木こりは？
失業して、ほかの仕事に就くことになりました。

これが、中期的に起こることです。

これは単純化したモデルで、実際は各人間の生産性の違いも大きいと思いますが、翻訳の単価が安くなる、生き残れる人が少なくなるという流れはわかるのではないでしょうか。

これだけでは救いがないようですが、さらに長期的に考えると、次のようなことが起こると思われます。

これまでは、みんな小さな家に住んでいたのですが、木が1本1000円から200円になったことによって、同じ予算でもっと大きな家が建てられるようになりました。
みんなが大きな家に住むようになったので、必要な木材の量は2倍にもなり、1日に2000本の木が注文されるようになりました。
今では、40人の木こりが、チェーンソーを使ってそれぞれ1日に50本の木を切っています。

翻訳で言うと、単価が安くなったことによって、それまで翻訳されなかったようなものが翻訳されるようになるということになります。

それでも、その新しく生み出された需要は単価の低下によるものであり、元々の翻訳家数を維持できるほどにはなりません。

さて、繰り返しますが、以上に書いたことは非常に単純化したモデルです。

翻訳家の技量の違いや、機械翻訳にかけられないような機密性のある文書の翻訳など、このモデルから外れるところもあります。*2

また実際には、短期・中期・長期という時間がはっきり分かれているわけではないので、単価の低下と市場の拡大は同時進行で起こる、つまり翻訳家の需要は「一旦底をついてから回復する」というより「じわじわと減り続けて安定する」と考えるほうが自然かもしれません。

いずれにせよ、中・長期的には、新Google翻訳は翻訳家にとっては朗報とはいえない（生き残れる翻訳家の数が限られる）というのが私の考えです。

この中で、どうやって生存戦略を考えていくか。

翻訳家にとっては難しい状況になりそうです。

最後に、宣伝を兼ねて、ロボットの脅威 ―人の仕事がなくなる日からちょっと不吉な引用をします。

だが、ロボットや機械学習アルゴリズムをはじめとする自動化の波が次第に、職に必要なスキルのピラミッドを底辺から蝕んでいる。そして人工知能のアプリケーションが徐々に高スキルの職業まで侵そうとしているため、ピラミッドの頂にある安全な領域すら時間とともに減っていくだろう。

教育と訓練へとさらに投資を行うという従来の解決策は、縮小しつつある上位の領域へ全員を詰め込もうとするものだ。そんなことが可能だと考えるのは、農業の機械化の影響で元の職から追われた農場労働者が、トラクターを運転する職を見つけられると考えるのに似ていると思う。数が計算に入っていないのだ。

*1:ですます調とである調をその時々で適当に使い分けています。

*2:ただ、機密性のある文書の翻訳でも、効率が上がるとなると、「抜け駆け」的にこっそり機械翻訳が使われてしまうということも起こるのではないでしょうか。