読者です 読者をやめる 読者になる 読者になる

蛍光ペンの交差点[別館]

"どの点に関心をもつべきか ―をわれわれが学びとるのは,もっぱら仮説からだけである"

象を批判する:あるいは「現象の集合」と「元どうしの違い」について

とある有名なプログラミング言語の開発者が言っていた。自分の開発した言語をユーザーが語るとき、「それはどこかで、誰かにとって、いつかは真実だったのだろう」という感想を抱くと。彼はそれを群盲象を評すの挿絵を用いて説明していたが、この説明は印象に残りやすい一方、理解しないまま何となく覚えてしまいがちだと思う。この話には色々な示唆や応用があるだろうが、一つには相対主義に対してどのような戦略が有効であるかを示していると思う。ここでは、少し(細部を検討している時間がないので、伝わる程度までのあくまで少し)形式的に考えてみる。

 

象(ゾウ)と呼ばれる集合 Z を考える。ウィキペディアとの整合性を取るために、Zの元は Z = {足、尾、鼻、耳、腹、牙}とする。すなわちZの濃度 |Z| は |Z| = 6 である。

 

n(n >= 1)人の就活面接官と数分ずつ会話をするとする。簡単のため n = |Z| = 6 で考える。あなたは自身の採用確率を最大にするため、以下の2つの行動を取る。(1)面接官と同様の経験があれば、それを話題にする。(2)面接官と同様の経験がなければ、彼の話を聞く。

 

面接官 (Interviewer) を表す集合 I = {f、r、n、e、b、t}を考える。面接官 f ∈ I は象の足(foot)を、面接官 r は象の尾(rope、牙tuskとの混同を避けるためtailは使わない)についてそれぞれ詳しく、その話題について会話ができる人材を求めている。

 

あなた( Y )は目の前に現れた面接官がどの話題に詳しいかは分からない。ただし、象の特徴的な部位に関する知識から、目の前の面接官が部位 i について知っている確率 Prob( i ) = {足: 0.10, 尾: 0.05, 鼻: 0.3, 耳: 0.25, 腹: 0.1, 牙: 0.2} だと推測している。これは確かに Σ_{i ∈ Z} Prob( i ) = 1を満たす。

 

その志望企業が象のどの部位に関する業務でも一流レベルであることを知っているため(生態学研究所だろうか)、全ての面接官はそれぞれ違う話題を持ち上げるだろうと想定する。すなわち i_k を k番目の面接官としたとき、たとえば面接官 2 人と面接したあとの事後確率 prob( i_3 | i_2 = f, i_1 = r ) = {鼻: 0.3 / (0.3+0.25+0.1+0.2), 耳:0.25 / (0.3+0.25+0.1+0.2), 腹: 0.1 / (0.3+0.25+0.1+0.2), 牙: 0.2 / (0.3+0.25+0.1+0.2) } などなど

などなど

 

ダルくなってきたので切り上げるが、だいたい何となく言いたいことは伝わったと思われる。象の比喩が言いたいのはequally likely(Prob( 足 ) =Prob( 尾 ) = Prob( 鼻 ) = Prob( 耳 ) = Prob( 腹 ) = Prob( 牙 ) = 1/6)で平等な世界でもなく、(通説だし|Z| > 100万などになったらそうなるが)自分は一面だけしか理解していないことの説明でもなく、ある元 z ∈ Z を誤謬とする攻撃性の話でもなく、「現象の集合」としてしか呼ばれない象 Z について、複数人がZの異なる(性質も異なる)元 z1 とz2 を使用した際に、頻出度や他の制約条件から適切なコミュニケーションが導出される(相対主義に対してどのような戦略が有効であるかを示している)という話だというのがこの記事の主張だ。

 

以上を、形式的に曖昧性の高い自然言語を用いると、極端には

 

あなたは象について詳しい6人の面接官と、象について話をした。

 

となる。僕は「あなたの言っている象と私の言っている象は違う」とか「その「国際政治」ってどういうこと?」と言った表現がなぜかあまり好きではない(必要悪だとは思うのだが…)。そのような表現では、潜在する条件付き確率や集合の濃度を、つまりは違いを過小評価しているように聞こえるからだと思う。下手するとその「象」と呼ばれる集合自体すら定義が不適切なことすらあるのに(例えば上で定義した象には目も口も含まれていない、あるいは観光地に存在する象には動きが不可欠だろう)、まだ僕たちは自然言語から離れられないのかとどこか嫌気がさしているからかもしれない。 

 

まあ、象を批判するときは、あるいは誰かが象を批判するのを聞いたときは、ちょっと気をつけようと、そう思ったということである。

 

データにならない日記

データを日常的に解析する人たちにとって、散文で書いた個人的な日記はどのような意味を持つのだろうか?

 

データという言葉を辞書で引くと、資料、情報、証拠、事実、そのあたりの熟語が目に入るが、実のところこの使い尽くされた言葉は決定的な訳語を持っていない。僕はと訳すのが好きだ。アルゴリズムと訳すのが好きな人間なので、どこか日常語以外のところに明確なイメージを持ちたいのかもしれない。

 

最も、これだけ日常化したカタカナ語をわざわざ訳して使うなんて非効率な、と思う人もいるかもしれない。どちらかというと僕は明治・大正・昭和期の漢字まみれの日本語が好きなので、そこらへんの言語空間であれこれ考えたいがために、無理に変換している節がある。

 

さて、日記というのは生きてきた日々の痕跡を記録したものだ。何を食べたか、天気はどうだったかなどの定常的な記録を記す人もいれば、今日は医者にかかったがどうも◯◯らしい、とか、叔父の家を尋ねたときに父が青年だったころの逸話を聞いた、などの、一回性が高いことを書き留める人もいる。どちらもデータである。

 

僕は日常的に跡を解析しているが、あまり自分の日記(そもそも滅多に付けないが)やブログの記事に対して、いわゆる統計的な自然言語処理をかけようとは思わない。自然言語処理が得意ではないこともあるが、何よりも、僕が日記やブログの記事に求めるのはそういう類の演算で得られる情報ではないからだ。もっと言えば、僕は跡サイエンティストたちが使う「ファインディング」やマーケターが使う「インサイト」を見つけるためではなく、ただ単純に「思い出す」ためだけに文章を書いている。

 

思い出す」。この基本的で単純な日常動作を、僕はこの忙しい現代でよく忘れてしまう。もう昨年の4月に何を食べてどういう生活を送っていたのか思い出せない。思い出すことを思い出さないといけないレベルである。◯◯くん、ケーキはもうさっき食べたでしょう。◯◯くん、ケーキはもう食べたということをさっき思い出したでしょう。

 

日記や記事は、単に折に触れて読み返すものである。別に解析する類のものではない。それで完結しているし、それ以上のものとして完結させるには独創的な研究が必要になる。僕は自分が「ですます」より「だ」を多く使うとか「×■」という形容詞を頻用するとか知ったところで嬉しくはならないし、リコメンデーションは自分で好きな時に類語辞典で引いている。効率を不用意に下げるようなことは好きじゃない。好きに書いて好きに読み返す、この満足感を超えるのはおよそ難しい。

 

日記を思い出すために使うには、2つの要素が必須になる。

1.書かれている内容が重要であること

2.読み返すこと

 

特に自分の場合、1.では書評新生活への雑感何らかの大きな行事や作業の感想記事、あと珍しく思い当たった話題が当てはまる。2.は、たまに読んでくれた方から記事に言及されることがあって、そのときに何を書いたか自分でも忘れているので読み返す、という機会が多い。

 

自分がこうしながら得ている効用をデータ解析で代用するのは難しい。人が文章を書くことは、データ解析の技術的なスコープより遥かに幅が広い。(そもそも、文章はランダムな順に書かれる。丸々消されたパラグラフも多く存在する。完成された文章だけを入力としても大したことは分からない)

 

途中だけど終わり 

ONE to ZERO:敗北者ピーター・ティール

(以下の文章は、2015年2月20日に『蛍光ペンの交差点』本館に掲載したものです。)

 

偶然の縁があって、起業家Peter Thielの講演会に行ってきた。

ティール氏は、想像していたよりは普通の人だった。というより今までに「すごいなーなんでこんなに早く頭が回るんだろう」と思った人たちと比べると、ごくごく普通だったという感じ。話す速度はゆったりとしていた。声は静かで落ち着いた若々しいトーンだった。言葉に詰まったり、人間らしく少しこじつけのような回答を返したりもする。帰る時に至っては気づいたら普通に隣を歩いてて、そんなにバシバシオーラを感じなかった(昔玉木宏の講演会に行った時はヤバかった)。Stanfordのロースクール出て、最高裁判所への採用一歩手前まで上り詰めた上に、FacebookPayPalSpaceXなど数々の名立たるスタートアップを裏から支え、圧倒的なビリオネアである上に、最近UCバークレーで話したときは抗議者が出て逃げるはめになったほど過激な思想を持つ人物としては、あまりに像が平凡に思えた。

ただそんな末梢を除いても、問題意識と危機感が飛び抜けていた。

それはあの場にいた人たち全員と、彼の本を読んだ多くの人が感じたことだと思う。

「世界に関する命題のうち、多くの人が真でないとしているが、君が真だと考えているものは何か?」
(『ZERO to ONE』より引用)

じゃなきゃこんな問いは、出てこない。

彼は「競争の対義語が資本主義なのに、差別化できない場所で戦う人が多すぎる」とか、「範疇(category)で考えることでFacebookの何が特異だったのかが理解しにくくなる」など、人が何を思い込んでいることで問題が生じているのかに対して鋭敏な感受性を持っている。プロダクトさえ良ければ販路がしっかりしていなくても売れると思い込んでいる人への批判もそうだ。人。著書から見える彼がとにかく理解しようと思っている対象は、人に尽きると思う。

ティール氏は確かにすごい。実績も能力も半端ない。

でも対象が無敵もしくは無欠に見えたときこそ、検討を進めなければいけない。じゃなければティール氏が批判している、太陽光発電だとか機械学習だとかのテクノロジーへの過大評価(over-rated)と一緒で、実態の理解に至らない1

講演では、彼がいったいどこに弱みを持つ普通の人間なのか?に注意して話を聴いていた。それは彼を貶めるためではなく、あくまで彼の立ち位置と主張をより良く理解するための試みである。だから、会話のスピードや声質が威圧するようなものでなかったのは助けになった。当たり前だが自分からそんな話を起業家がするワケがない。だからこそ、対談相手の糸井氏の鋭い質問がとても参考になった。

以下では、著書を適宜参考にしながら、ティール氏の人生における最も初期の挫折、最高裁判所のポジション争いにおける敗北について少し考えてみる。

戦争特集の番組でタモリが「この質問の答えが分かったら他はどうでもいいとすら思ってるんですけど」「終戦、って言いますけど、敗戦ですよね」といった旨の発言を歴史学者に尋ねていた。

それと同じで、ティール氏のスタートは敗北である。

彼は弁護士人生を円満に終了させてから臨んだわけではない。 これ以上ないほど明確に敗北して、そして戦うフィールドを変えたわけである。

講演会の終盤に、なんだか話を聞いているとあなたには怖いものがないように思えてくるんですけれど、怖いものはありますか?と糸井氏が質問した。

僕の聞き取りが正しいか怪しいが、彼はそこまで自己認識(self-awareness)していないと断った上で、失敗(failure)は怖いと言っていた。他の質問では競争に負けることは深い心の傷として残る(traumatic)と表現していた。彼は失敗にくよくよすることなく(dwell on)、失敗から学ぶなんてことにも拘らず、たんに次のことに進む(move on)ことで、悪循環のcycleを早期に断ち切ることを強調していた。

彼はポジション競争での敗北から学んだ(=正の影響を受けた)のではない。
単にそこから逃げることで、影響をゼロに近づけたのだと言える。

結果が(試験結果が、試合結果が、提案結果が)全てだと大衆は言う。
過程に評価軸を与えると歪むから、結果を重視するのは正しい。

ただ実際には、その「結果が全て」という公理では、ティールが椅子取りに負けたのに社会的には遥かに大きな影響力を持つ存在になったことが説明できない。小さなゲームの成績の良し悪しがより大きなゲームの最適解として繋がっていない。これは囚人のジレンマとは別の原理に基づくような気がするけれど、一体どうしてだろうか?

ティール氏の話を聞く限り、鍵はnot dwell on, but move onということなのだと思う。スゴロクで目的としていた次のマスに進めなかったとき、人は何をするか。政策の効果を因果推論することが最近の研究課題だったり、6人経由すると世界に繋がれるみたいな話があったりするように、僕らの直観はネットワークについて正確に理解することがほとんどできていない。失敗の際に、自分が求めていた何かへの経路が絶たれたように感じて、そこでn回休み続けるのは、全くの見当違いな対処かもしれない。回り道があるかもしれない。それか、自分が求めていたものとは形が違うけれど、サイズは大きな何かに繋がる道に、たまたま足が向くかもしれない。

現在の科学的知見は、別のマスの先に何があるかは保証しない。
ただ同時に、今のマスにしか目標が存在しないとも断言しない。

同書では、『指輪物語』の一節を引用して、先人とは別の道を行くべきだと説いている。

角を曲がれば、待ってるだろうか、
新しい道が、秘密の門が。
今日はこの道、す通りしても
明日またこの道、来るかもしれぬ。
そして隠れた小道を通り、
月か太陽へ、ゆくかもしれぬ。

(J.R.R トールキン著、瀬田貞二/田中明子訳、評論社文庫)

ショックを受けて立ち直れない期間は、彼の偉大すぎる業績リストと比べて見るとあまりにも短い。だから目に付かない。2015年、きっと多くの人が「良かったね競争に負けて」とティール氏に言葉をかけたことだろう。と思って読み直したら、2004年段階で既にそのような話があったようだ。

ペイパルを売却した後の二〇〇四年、以前に事務官への就職活動を手助けしてくれたロースクール時代の友人に偶然出くわした。ほぼ一〇年ぶりだった。彼の挨拶は「元気かい?」でも「しばらくぶりだな」でもなかった。ニヤリと笑ってこう言ったのだ。「ピーター、事務官にならなくて良かったな」。振り返って初めて言えることだけれど、究極の競争に勝っていたら僕の人生は悪い方向に変わっていたことを、彼も僕も認めていた。もし最高裁の法務事務官になっていたら、おそらく証言を録音したり他人の事業案件の草案を書いたりして一生を過ごしていただろう。 (同書)

その言葉は、敗北感に打ちひしがれていただろう当時の彼の前では、到底かけられないものである。いや、そんなことは、かけてもらう必要すらないのだ。彼はmove onという戦略によって、勝てるゲームに乗り出しにいったのだから。彼が一時期デリバティブのトレーダーになっていることにも人は思考を走らせない(序文の著者は言及しているが)。彼は実は2度続けて失敗しているということだ。そう、だから彼は失敗から学んだのではない。学んだのでは決してない。

 

彼は何度でも逃げたのだ。
資本主義をするために。

 

起業は、君が確実にコントロールできる、何よりも大きな試みだ。起業家は人生の手綱を握るだけでなく、小さくても大切な世界の一部を支配することができる。

 

心理学が説く白黒思考は、あまりに単純化されたネットワークの捉え方である。道は2本だけあって、片方はマイナス無限大、もう片方はプラス無限大。文字にすると馬鹿らしいけれど、試験の結果が出るときにはみんな暗黙にこのことを信じている。明確な基準に基づいて評価を行うと、どうしてもそうなる。じゃなければ片方を追うことなんて、バカバカしくてやっていられない。

ティール氏の著書に書かれた内容は、熾烈な、しかし「小さな」法曹世界の敗北者の、とても資本主義的な圧勝法だった、と僕は思う。
そしてこの本は、大学受験で白黒思考を染みこまされた有名大学の生徒とその卒業生にも読まれるべきだと思う。
彼らは挫折に対して、とても脆い。ティール氏の「立ち直りの早さ」はすさまじい。なお、早すぎて、普通にゼロ・トゥ・ワンを読んだだけでは失敗したことがまるで些事のように読めるが、講演を僕なりに聞いた限りでは、キャリア初期における彼の失敗は相当彼の「勝ち方」への思想に影響を与えていると思う。

 

ゼロ・トゥ・ワン 君はゼロから何を生み出せるか
NHK出版 (2014-09-25)
売り上げランキング: 22

 


  1. ビッグデータについて僕はティール氏とは違う理解をしている。僕自身も以前はバズワードの一つとして捉えていて、ビッグデータなんて実際には計算機を回す時間を不必要に増やすだけで、サンプリングのミスを誘発させる害悪だとすら思っていたが、現役のデータ分析者の意見を聞いて、実務上で意外と便利であるという理解に落ち着いた。その内容は省略。

学習過程においては、解決策に飛びつかない

R言語の標準であるsubset()やaggregate()によるデータの前処理は、多少込み入ってくると非常に読みにくくなる。その解決策としてパイプ演算子 %>% を用いた magrittr が存在しているが、僕は学習者にいきなりパイプ演算子 %>% を紹介するのは最善策ではないという立場である。

 

学習において躓く原因となる要素はいくつかある。典型的なのは解決策がうまく使えない(部分積分に気づけない、%>%で言えば入力でベクターを渡しているのかスカラーをを渡しているのかを誤るなど)ことだが、見逃しがちな原因の一つとしてその解決策が解決しようとしている問題を深刻には実感できていないということがある。

 

その結果が「なぜアルゴリズムXを学ぶのか」「なぜこれを扱うのか」の集積である。なんだか良さそうだが、なんで使ったら良いのかはあまり分からない。ゆえに解決策を学んでいるときも、どこかピントがボケていて、何が欠かせない性質なのかが読めない。

 

この原因の発生過程には、教育それ自体は短時間で解決策を多く紹介しようとする(それこそが効率的な教育だから)のに、実際には多少紹介する数を緩めたほうがよいというパラドックスが絡んでいる。実際にはこの最適化問題は制約付きで、人間は実感したことのない問題の解決策はうまく覚えられないのだ。その場合、実は解決策の数を減らしてでも、問題の深刻さをしみじみと実感する時間を取った方がよい。多くは試行錯誤の時間であり、一見すると無駄のようにも見え、実際度を過ぎると無駄である。ここの調節は非常に難しい。確率的にしか成功しないと覚悟して臨んだほうがいい。

 

最初のうちはsubsetやaggregateで良いのだが、データの前処理過程が複線化して複数の処理済みデータを作成する段になってくると、それらの関数を正しく使えているのに読みにくいという事態が生じる。この事態こそがパイプ演算子が解決しようとしている問題であり、つまるところ用法と複線化は別々の課題なのだ。前者だけを解決するデフォルト関数から、後者も含めて解決する dplyr などのパッケージの関数へ、というのが恐らく論理的な流れとしても正しく、ここは飾りではなく本質である。

 

教える側としては、R言語の前処理と可視化を題材とするケースが多く、教えられる側としては、特別なデータ構造やアルゴリズムが多い。学習をその両面から検討するにあたって、この「いつ解決させるか?」というテーマは注目に値すると思う。

 

プログラマをプログラムできないという問題

100人ぐらいの受講者が居る計算機の授業を受けながら、ふと以下のような問題設定が考えられることに気が付いた。

 

クラウド構築を学ぶ授業Aはとても教育効果が高い。そのうえ、一学期に200人もの学生が技術を身につけることができて効率的だ。履修後には、一人ひとりが全員、クラウドの設計と統括ができるような段階に達せるとする。

 

このとき、それぞれに十分熟練した200名は、いくつの会社に何名ずつ、どのような仕事をするために配属されるのが社会的に望ましいだろうか?

 

クラウドサービスは作るのが手軽というのもあって(ただし高品質なものを作るのは至難)、類似のサービスは山ほど世間に存在する。Aを履修した生徒1と生徒2は、それぞれはクラウドを一人で作れるほどに熟練しているが、しかしそれは生徒1と生徒2が好き勝手にクラウドを作ると良い結果がもたらされることを含意しない。それはもちろん彼らの自由ではあるが、ユーザーにとっては大して違いのないサービスが乱立して迷惑だろう。それを「引き起こし」うる生徒は200名もいる。

 

彼らとしても、どこか違和感を感じるはずだ。クラスタGUIで起動するための公式サイト。Reactを使ってレスポンシブにして、コンテナ技術で起動を高速化して。同じ問題を何回解いているのだろうか?むしろ同じ問題を並列して解いてしまっていることで、マルチスレッドよろしく、新しい問題が生じているのではないだろうか?そういえば、似たようなサービスがあるからと開発をやめるのは、ある種の排他制御と言える気もする。

 

最速最適なベストプラクティスを学ぶはずの授業が、多くの人間に同質に提供されてしまうと、実はむしろ遅くなるというパラドックスが生じていないだろうか?この問題は、オンラインプログラミング学修サイトが激増しているいま、恐らく更に悪化している。

 

もちろん、類似サービスが競合してお互いのいいところを吸収し、最後にはひとつがデファクトとして洗練されるケースは否定できない。しかしこの問題の教訓は、特定の種類の授業においては、生徒にもたらすことが望ましい効果は、生徒数があるスケールを超えると多様化するということにあると思う。

 

ケーススタディを見てみたい。

完全な意志決定など待ってられるか、あるいは意志への満足

自分の人生をふと振り返ってみると、数年間隔で「その後の人生を大きく変えるような決断」をいくつか重ねてきたことに気付く。

 

同時に驚かされるのは、そのどれに関しても、とても誇れるような決断の仕方ではなかったということだ。ある決断は見栄や私利に、また別の決断は選択肢の不在や直観に、あるいはたまたまの機会に大きく影響されて行なったものだったりする。

 

後輩に進路相談されることもあるから、もちろん「AとBとCというメリットを考えてこの選択肢を選んだんだよ」と一息五秒、自然な筋立てに整形して話すことはできるのだが、しかし本当は違う。決断前の時点ではメリットを並び立てられるほど未来は明確に想像できない。どのメリットも不確定要素によって遮断されうる。言葉にしようとすると、それが実現するための前提が多すぎて、説明がとても長くなる。

 

何を責めるべきだろうか?複雑過ぎる現実か?それを超克できない自己か?いや本当に責めるべきは、最善な意思決定は机上の合理性で達成できると考える、僕のなかの素朴過ぎる固定観念ではないだろうか。

 

本当のところは、何が原理となって良い選択になるのか、あまりよく分かっていないのだ。決断したあとそれを成功に持っていく遂行力、細かな軌道修正でマリオのコインよろしくアップサイドを狙う抜け目のなさ、期待値を予め下げておくことによる成長感、いくつかほぼ断言できる選択肢間の不等式を見逃さない審美眼、などなど。

 

決断後は、情報がとても増える。自分が描いていた白地図に、より正確に物質が嵌め込まれていく。それで満ち足りた気分になれるくらい、今に熱中できる性格だからかもしれない。

言語は私たちのツールか、それとも私たちもツールなのか

言語は目的を達成するためのツールである。
では私たち人間はツールではないのだろうか?

 

日本では高等教育まで夢を見て、高等教育から社会人前期に生計を確保しあるいは行動の原動力を確保し、一部は中盤から自己実現をはかる幸運に恵まれ、少数はそれを超えた社会的課題の解決に向かう、というのが私の「ジャパニーズ・ドリーム」的な時系列の理解である(最後の2つは並行することもある)。

 

後半の段階、自己実現を超えた瞬間の自覚が気になっている。
そのとき、自分(の幸せや満足感)は目的になっているだろうか?

 

人間は最大の寿命でも有史の1厘に満たず、有史もまた先史の1に及ばない。実現された空間のなかで考えれば普段目にする塵よりも遥かに小さな存在に過ぎず、言ってしまえば考える葦はそんなに実は大きくない。我々が最大の目標だと前提する道理は、人間のスケールを外して(「客観的」より「「さらに一段階抽象的」」に)考えれば、我々が普段道具や便宜としかみなさない退屈で意義のない物体と共通点を持っている。

 

ツールか目的か、というのは2つの物体間に生じる関係の端点それぞれを呼称しているに過ぎない。Aにとって目的のBは、Cにとってはツールであり、CもまたDにとってツールである、という連鎖からは逃れられない(もしDがあれば、だが)。

 

私は決してそれらのものに、人生の意義や人間の存在に、意味がないと言っているわけではない。ただ普段私たちが快適に過ごすためにツールをいじくるのと同様に、私たちもまたツールとして最適な構成・配置が考えられる、という話をしている。チームの話である。