Wikipediaから人名(姓・名別、読みつき)を取り出す

小ネタです。日本語Wikipediaから人名(姓・名別、読みつき)を取り出すスクリプトを書きました。 https://github.com/hiroshi-manabe/extract_jawp_names 日本語の処理をする際に、Wikipediaのデータを使うことは多いと思います。いろいろと便利なWikipedia…

翻訳の退場勧告

SICPを訳し直したと、一年前の記事の善意のひどい訳についてに関して、はてな匿名ダイアリーのほうで言及していただきました。 翻訳は/誰がやっても/間違える (前編)翻訳は/誰がやっても/間違える (後編) 誤訳の指摘ありがとうございます。差し支え…

SICPの翻訳についての補足と和田訳について

最近、計算機プログラムの構造と解釈(通称SICP)を訳し直すということをやった。そのときに書いた記事にはだいぶ反響があった。ぼくとしても、いろいろ言われることは予想できていたので、ぼくの考えを「腐った翻訳に対する態度について」という別記事にま…

腐った翻訳に対する態度について

今回、SICPの翻訳改訂版を公開するにあたって、minghai氏の非公式日本語版(以下、minghai氏版)については「惨憺たる翻訳」「そびえ立つクソの山」などと書きました。これらの言葉は、もちろん本心からのものです。しかし、それを表に出すかどうかについて…

非公式PDF版SICP・新訳

計算機プログラムの構造と解釈、通称SICPを一から翻訳し直しました。 ファイル: SICP非公式日本語版 翻訳改訂版リポジトリ: https://github.com/hiroshi-manabe/sicp-pdf また、今回の翻訳をするにあたって考えたことを別記事にまとめました。 腐った翻訳に…

「許す」と「赦す」の件(みんな間違っている)

「シャルリー・エブド」誌の翻訳の問題がホットなようです。 銃撃の政治紙「すべては許される」と預言者風刺 「許す」と「赦す」 ―― 「シャルリー・エブド」誌が示す文化翻訳の問題 「許す」と「赦す」は同じ意味ですよ 私から見ると、みんな三者三様に間違っています…

なぜ誤訳指摘をしたか

善意のひどい訳についてについての補足を書く。 まず、「なぜ指摘を公開でやったのか」ということから。「アスペ日記」というタイトルで日記を書いてはいるけれど、「こんなふうに誤訳指摘したら気ぃ悪い(感じ悪い)*1よなぁ」ぐらいの感覚はぼくにもあった…

善意のひどい訳について

2014/10/14 追記: 補足記事を書きました。なぜ誤訳指摘をしたか ぼくは、ずっと昔から「ひどい翻訳」というものに憤りを感じてきた。以前、別の記事に書いたこともある。統計学を拓いた異才たちのようなひどい翻訳を見るたびに、どうして世の中からはこの手…

「C言語でプログラミングする際の覚書」の誤訳箇所

ここでは、C言語でプログラミングする際の覚書の誤訳を列挙します。参考として、私の翻訳はC言語プログラミングの覚え書き(改訳)にあります。 What follows is ... ×従うべきは ○これから述べるのは "What follows" で「続くもの」という意味です。ここで…

C言語プログラミングの覚え書き(改訳)

原文: Notes on Programming in CRob Pike1989年2月21日Copyright (C) 2003, Lucent Technologies Inc. and others. All Rights Reserved.Lucent Public License Version 1.02 前書き KernighanとPlaugerによる“The Elements of Programming Style” (「プロ…

片付けを始めるコツ

個人的にうまくいった、「片付けを始めるコツ」について書いてみます。ぼくと同じタイプの人間向けです。 概要を箇条書きにすると、次のようになります。 限られた回数の「片付け動作」をする。 リラックスする。 以上の繰り返しです。 「片付け動作」とは何…

「履く」と「穿く」が面倒なことになったいきさつ

ズボンや靴を「はく」というのは、どう書くか。*1ご存じの方は多いと思いますが、これはけっこうやっかいな問題なんですよね。 もっとも、「あ、これ正解知ってる」という人もいるでしょう。ズボン・スカートは「穿く」で、靴は「履く」でしょ、と。 ここで…

darts-clone の Java 移植

矢田さんのdarts-cloneをJavaに単純に移植したので、GitHubに上げました。https://github.com/hiroshi-manabe/darts-clone-javadarts-clone については、矢田さんの日記に詳しい解説があります。 これを移植したときは、仕事で使えるかと思ってやってみたの…

TeX の発音

今さら、TeX の発音が話題になっているようです。TeXはテック もう何度目だというぐらい目にしている気がするのですが、この問題は本質的にややこしいのでどうしようもないですね。 この問題について書かれているページのひとつとして、以下のものがあります…

いい話(W社を辞めました)

(2015/09/01追記:この記事は私がW社に在籍した2013年4月から2014年4月までの間の個人的な経験に基づくものです。就職の参考にされる方は、その後W社の社風や開発者の扱いに変化があったかどうか等についてご自身で最新の情報を得ていただければと思います…

マッチョとの戦い

今のネットは面白い。ツイッターでは、毎日のようにエアリプ、つまり相手を書かないほのめかし合いがやりとりされている。時には、ブログでも同じようなことが起こる。ちょっとした愚痴を書いたつもりが、愚痴ってんじゃねーよ的な反応を呼んだりする。 面白…

一般プログラマの妻がゲイツの子供を産めるシステムを作るべき

プログラマの生産性と報酬について考えてみたけど、どう考えても 1万人に 1人ぐらいのトッププログラマ以外には子供が持てる気がしない。子育てをするうえで一番厳しいのは、その間労働力が半分になってしまって、世帯収入を支えられないということ。それに…

プログラマの生産性と報酬

追記: 続編を書きました。マッチョとの戦い 最近、プログラマの生産性が話題です。いろんな意見があるものの、個人的には 10〜100倍の生産性の違いはあると思います。 いや、それは違う、生産性の高いエンジニアは生産性の低いエンジニアに作れないものが作…

「了解」は失礼か?

最近、「了解」は失礼だという説が出てきているようです。どこの誰が言い出したのか知りませんが、ごく最近であることは確かです。 少し前のマナー本には、そんなことは書いてありません。たとえば、2003年のこれだけは知っておきたい! 改訂版 ビジネス・マ…

完備辞書(簡潔ビットベクトル)の解説

以前、「簡潔データ構造 LOUDS の解説」というシリーズの記事を書いたことがあります。LOUDS というのは木構造やtrieを簡潔に表すことができるデータ構造なのですが、この中で「簡潔ビットベクトル」というものについてはブラックボックスとして扱っていまし…

「障害」書き換え説,あるいは戦前の雑さ

いつごろから広まったのか知りませんが、“「障害」は本来「障碍」と書くのに、戦後になって「障害」と書くようになった”という俗説があります。結論から書きます。「障害」は戦前からある書き方です。 今はGoogle ブックスという便利なものがあるので、画像…

「間髪をいれず」が殺された日

最近、マイナビウーマンが「日本語を貧しくしようキャンペーン」を展開しているようです。 じつは読み間違ったことのある漢字1位「貼付」間違っている読み方が定着していると知らずに使っていた日本語1位「輸入(ゆにゅう)【正】しゅにゅう」 「正しい日本語…

Googleのヒット件数について(続き)

Googleのヒット件数は当てにならないの続きです。 はてブで id:blueboy さんという方が 文中の「ページを進めると数が急減したのは、すべての結果を取得して件数が判明した」は誤りです。正しくは「途中で表示をやめるから」です。 と書いていたので、フォロ…

Googleのヒット件数は当てにならない

(2013/11/08: 補足を書きました。Googleのヒット件数について(続き)) 「Googleの検索件数は当てにならない」と言うと、多くの人は「何をいまさら」という反応かもしれません。当てにならないことぐらいわかってるよ、と。でも、「当てにならない」でイメ…

ビット逆転ループ

注意: この記事は読んでも役に立ちません。頭を無駄に使いたい人向け。 普通のループは、たとえば 0 から 255 までなら、0 -> 1 -> 2 -> ... というようにループする。そういう普通のループじゃなくて、ビットを逆転させた数字でループできたらいいのになぁ…

正直に思ったことを書いて、いい結果になったという話

最近、ネットでものが言いにくい雰囲気があるとのこと。 「なんで辞めたの?」とか「次どこ行くの?」など、昨今のインターネットは若干書きにくい空気 退職しました - jarinosuke blog 個人的には、ぶっちゃけた退職エントリを書いたこともあるので、そうい…

「歳」「憶える」「嗤う」…それっぽい漢字

最近、かっこいい漢字を見かける機会が増えました――というのは、前回の記事で書いた話ですが、今回は「訓読み」の話です。その中でも、最近特に増えた感のある 歳(とし) 憶(おぼ)える 嗤(わら)う を取り上げてみたいと思います。 「年」と「歳」 「と…

カッコイイほうの漢字

「醱酵」って漢字、見たことあるでしょうか。「発酵」の別の書き方です。 「日食」「月食」に対する「日蝕」「月蝕」などもあります。難しい分だけ、かっこいいですよね。これらの「かっこいいほうの漢字」のことを、ぼんやりと「旧字=本来の字=正しい字」…

「子ども」表記に関する Q&A

えーっと、これまで何百回も書かれていることで、今さら自分が何か付け加えることもないのですが。(じゃあ書くなと言われそうですが、当たり前のことを繰り返し書くために書きます) 「子ども」は「交ぜ書き」じゃありません。「子ども」は「交ぜ書き」じゃ…

いつからその方法で偏りのない乱数が得られると錯覚していた?

私はつい最近まで勘違いしていました。ここのページに書いてあるような方法で、一様分布する整数が得られると。 int random(int n) { return (int)(( rand() / (RAND_MAX + 1.0) ) * n); } この方法、一見すると実に一様分布が得られそうに見えるんですよね…