読者です 読者をやめる 読者になる 読者になる

蛍光ペンの交差点[別館]

"どの点に関心をもつべきか ―をわれわれが学びとるのは,もっぱら仮説からだけである"

データにならない日記

データを日常的に解析する人たちにとって、散文で書いた個人的な日記はどのような意味を持つのだろうか?

 

データという言葉を辞書で引くと、資料、情報、証拠、事実、そのあたりの熟語が目に入るが、実のところこの使い尽くされた言葉は決定的な訳語を持っていない。僕はと訳すのが好きだ。アルゴリズムと訳すのが好きな人間なので、どこか日常語以外のところに明確なイメージを持ちたいのかもしれない。

 

最も、これだけ日常化したカタカナ語をわざわざ訳して使うなんて非効率な、と思う人もいるかもしれない。どちらかというと僕は明治・大正・昭和期の漢字まみれの日本語が好きなので、そこらへんの言語空間であれこれ考えたいがために、無理に変換している節がある。

 

さて、日記というのは生きてきた日々の痕跡を記録したものだ。何を食べたか、天気はどうだったかなどの定常的な記録を記す人もいれば、今日は医者にかかったがどうも◯◯らしい、とか、叔父の家を尋ねたときに父が青年だったころの逸話を聞いた、などの、一回性が高いことを書き留める人もいる。どちらもデータである。

 

僕は日常的に跡を解析しているが、あまり自分の日記(そもそも滅多に付けないが)やブログの記事に対して、いわゆる統計的な自然言語処理をかけようとは思わない。自然言語処理が得意ではないこともあるが、何よりも、僕が日記やブログの記事に求めるのはそういう類の演算で得られる情報ではないからだ。もっと言えば、僕は跡サイエンティストたちが使う「ファインディング」やマーケターが使う「インサイト」を見つけるためではなく、ただ単純に「思い出す」ためだけに文章を書いている。

 

思い出す」。この基本的で単純な日常動作を、僕はこの忙しい現代でよく忘れてしまう。もう昨年の4月に何を食べてどういう生活を送っていたのか思い出せない。思い出すことを思い出さないといけないレベルである。◯◯くん、ケーキはもうさっき食べたでしょう。◯◯くん、ケーキはもう食べたということをさっき思い出したでしょう。

 

日記や記事は、単に折に触れて読み返すものである。別に解析する類のものではない。それで完結しているし、それ以上のものとして完結させるには独創的な研究が必要になる。僕は自分が「ですます」より「だ」を多く使うとか「×■」という形容詞を頻用するとか知ったところで嬉しくはならないし、リコメンデーションは自分で好きな時に類語辞典で引いている。効率を不用意に下げるようなことは好きじゃない。好きに書いて好きに読み返す、この満足感を超えるのはおよそ難しい。

 

日記を思い出すために使うには、2つの要素が必須になる。

1.書かれている内容が重要であること

2.読み返すこと

 

特に自分の場合、1.では書評新生活への雑感何らかの大きな行事や作業の感想記事、あと珍しく思い当たった話題が当てはまる。2.は、たまに読んでくれた方から記事に言及されることがあって、そのときに何を書いたか自分でも忘れているので読み返す、という機会が多い。

 

自分がこうしながら得ている効用をデータ解析で代用するのは難しい。人が文章を書くことは、データ解析の技術的なスコープより遥かに幅が広い。(そもそも、文章はランダムな順に書かれる。丸々消されたパラグラフも多く存在する。完成された文章だけを入力としても大したことは分からない)

 

途中だけど終わり