蛍光ペンの交差点

"科学と技術に支えられ、夢を語る人になる"

この単語を2年間忘れないでいられるだろうか?: 学校が教えてくれない英単語の暗記法について

(この記事は、科学的な発見ではなく、僕が英語学習者として採用している現実的な戦略について記述しています。そのため各所が雑ですが、この程度の雑さでも高校での暗記戦略を遥かに凌駕していることが何より重要なことだと思います。僕はこの雑な戦略を2…

プログラミング初心者にとってなぜ入門書は難しいのか

ソフトウェアの世界は、日進月歩である。 いや、その慣用句すら生ぬるい。 1日は24時間だ。Webアプリケーションフレームワークとして有名なRuby on Railsは、多い日で一日あたり12回の修正が加えられている。この単純な事実を2つ合わせると、ソフトウェアの…

すーがくってなんだろう

いくつか気になったものをメモメモ 古い時代の数学では「空間」は日常生活において観察される三次元空間の幾何学的抽象化であった。ユークリッド(紀元前300年頃)以来、公理的手法を主要な道具とした研究が行われていた。デカルトにより、座標を用いる方法…

Power Lawと明確な楽観主義、あるいは「成功」の考察

Paypal共同創業者の一人、ピーター・ティールによるビジネス書『ゼロトゥワン』の中では、第6章で「テクノロジーに対する明確な楽観主義」、第7章で「ビジネスにおけるべき乗則(Power Law)」が扱われる。 明確な楽観主義は、「思い描いた未来を築けば成…

次元の呪い、あるいは「サクサクメロンパン問題」

超球の体積、すなわち多次元空間における球は、一般的に私たちが観測する3次元の球体の体積とは遥かに異質な性質を示すらしい。 機械学習の有名な教科書によれば、 Our geometrical intuitions, formed through a life spent in a space of three dimension…

p値とAIC(赤池情報量基準)の関係について

現段階での理解をまとめる。 間違った記述があれば、読者諸氏からのご指摘を頂きたい。 (p値を使うNeyman-Pearsonの)検定によるモデル選択と、AICによるモデル選択を比較した図として、管見では以下が最も整理されていた。薄緑の付箋と黄色のハイライトは私…

東京大学は二流の大学である

(この記事は、以下の大学職員の呟きに触発されて書いている。) 地方国立大学が、低学費、低コストで教育格差の解消に役立っているとしたら、「地方都市」たる東京の、東京大学も世界観帝国の文脈では、同じ文脈にあると考えられるでしょう。 — 瀧本哲史bot…

アルゴリズムとビジネス(2つの「高度な技術」)

CS50の授業を3本ほど見て、思うところがあった。 以下の2つの命題は、それぞれ正しいか、誤っているか? 1) 高度なアルゴリズムほど(適用できる人が少ないから)価値がある 2) 問題を解決できれば高度でなくてもアルゴリズムには価値がある 僕の現段階…

本年度のビジネス書大賞を受賞した『ゼロトゥワン』を何故あらゆるビジネスマンが読むべきか

本年度のビジネス書大賞受賞作は、シリコンバレーの起業家、ピーター・ティールによる著作『ゼロトゥワン』だった。 ゼロ・トゥ・ワン 君はゼロから何を生み出せるか 作者: ピーター・ティール,ブレイク・マスターズ 出版社/メーカー: NHK出版 発売日: 2014/…

統計を始めたい人に僕がPythonよりRを勧める理由

今回は「ほぼRしか使ったことがない」人間*1が、できる限り二者の優劣をくっきり述べる。 僕はほとんどRしか使ったことがない。Pythonはtfidfやクイックソートをライブラリ無しで実装した程度。 前半の主張は以下である。 「過去のRでの10回程度の解析…

ニコ動で「もっと評価されるべき」約4900作品の説明文を解析してみた

2年ほど前に、「もっと評価されるべき」タグが付いた動画の投稿だけをTwitterに流すBotを作っていたことがある。つい昨日、もう少しでデータベースが満杯になるから、データを消去しろと通知が来た。 せっかくなので、呟いていたデータを解析してみよう。デ…

推論機構と真実 (3) 既知、洞察、未知の計算量に潜むPower Law

推論機構と真実 (2) 「バカ」のモデル化の可能性と意義

以前の記事(「推論機構と真実 (1)隠れたバグか、隠れた真実か」)で述べたことを、誰もが生きる上で避けられない大問題に即して考えてみる。それは、「バカ」のモデル化である。経済学は、「合理的な行動をする主体」として、人間や投資アルゴリズムを定式化…

推論機構と真実

自分の学部時代の経験において、ひとつ忘れられない出来事がある。 その日は所属学科の卒論発表会だった。発表者が準備を済ませ、発表時間になった段階でも、卒論審査役の一人の教授が場に現れない。 発表者の指導教授が電話すると、彼はまだ研究室に居た。…

価値観の共同体:大学と企業の違い

最近考えたことを書きつけておく。 大学と企業の最も顕著な違いは何だろうか? 大学の最大目的は新知識の創造で、企業の最大目的は利益追求だ。 もちろんどちらもそれだけではないけれど、例えば大学は新知識の創造には至らずとも体系だった知識をほぼ自力で…

Raschモデルに関する覚書

Raschモデルは項目応答理論で扱われる最も単純なモデルの一つ Raschモデルは、形式的には(一般化線形モデルのうち)ロジスティック回帰の一例にすぎない 「人それぞれ(の能力)」を表すパラメタ1つと、nコの問いについて「問いそれぞれ(の難しさ)」を表すn…

Wikipediaの「標準誤差」の編集履歴を追ってみた

この式で重要なのは、標準誤差は抽出する標本サイズの平方根に反比例するという点である。つまり、例えば標本サイズを4倍にすると標準誤差を半分にできる。統計調査を計画する際に、費用や手間をある範囲内に収めた上で誤差を最小にしたい場合が多い。これら…

自宅というデータ構造について(草稿)

この記事で扱う問いは、「自宅をどうすれば最大限に利用できるか?」である。 データ構造さえ分かってしまえば、生じた問題を潰したり、好みに合わせて改変したりが早くできる。 以下の用語は適当に自作したものである。 また「n個ぐらいまでは候補が絞られ…

運命の実装

理系に進んでから出会った考え方の中で、輝いているものは山ほどある。 現象に潜む問題を見つける上で、これ以上ないほど役立つ考え方たちが。 その中で今日は「実装」の話を書いてみたいと思う。 なお、最初は「実装」で書いていたのだが、考えてみたら「製…

数学教師と15秒

高校入学当初、数学のテストが大の苦手だった。 「分からないもの」の扱いが、当時は今よりよほどマズかった。 遭遇するとまず思考が止まる。頭のなかに流れる、記号と音声の混ざった抽象的な思考単位が感覚から遠ざかり、目線、両手、あるいは腰への指令が…

人は日記に一日の何を記録するべきか

読者の反応を目的とする「記事」を書くことが増えた。 反面、自分が見て何かを確かめるのを目的とする「日記」を書くことが減った。 1日をどう記録したら有意義か?とふと考えた。 全く記録しないのはどうか。レポートの更新日時などやTwitterなどの何気な…

失敗とプログラマ

優秀なプログラマ(たとえば、某人工知能の世界選手権で1位を取るような開発者)と接していたとき、明らかに一般人と異なる傾向が見られた。 失敗に対する態度である。 The New Hacker's Dictionaryによれば、ハッカーは非決定論的な世界を嫌うらしい。僕が出…

WikipediaをVoiceOverしやすくするブックマークレット

僕は視力が悪いため、目を酷使せずにパソコンからずっと情報を得続けることはできないかという関心を常日頃抱いている。 一日に活動していて、「目が痛くてこれ以上見ていられない」「頭が痛くてこれ以上考えられない」という理由で学習を終えることが多い。…

思考の積み木

「あなたには、相手を殴ることしかできないとする。この状態で、親愛の念や忠告やジョークを相手に伝えることはできるだろうか」 という問いを、昔ふと考えたことがある。 目的を果たすための道具立てがそもそも無ければ、何をしたとしても、0か負にしか辿…

統計学参考書籍リスト(2016年5月16日版)

数式が苦手な人など向けの情報源 いきなりですが、「この記事の中でいちばん価値があるであろう情報」を書いてしまいましょう。 三中信宏教授のこのページにある「統計高座中継」は、数式を読むのが苦手な人、またはパラメトリック統計学以外の所から(それで…