2010-06-01から1ヶ月間の記事一覧

一様乱数のソート

「区間[0,M)なるN個の一様乱数を昇順に配列に格納したい.M は十分に大きい.領域計算量O(N),時間計算量O(N)でこれを行う方法を考えよ.」という問題について、バケットソートを使って Python で書いてみた。比較回数(適当だから間違ってるかも)は、1000…

FSNLP7章のEMが怪しい件

FSNLP(Foundations of Statistical Natural Language Processing)は自然言語処理業界の中では知らない人はないというほど有名な本(英語)。出版年度は古く、内容もかなり時代遅れになってきつつあるのだが、自然言語処理の広い範囲を網羅した本ということで…

タガー

今考えていること。タスクは「品詞タグ付け」(英語等、分かち書きのされる言語の場合)または「形態素解析」(中国語・日本語等の場合)(以下、「形態素解析」で統一)。これらのタスク自体時代遅れという意見もあるだろうけど、工学としての自然言語処理…