Translate

2021/03/02

機械可読を最初に考える


 かつては文字と数値くらいしか扱えなかったパソコンだが今は違う。グラフィックスや写真は当たり前、音声も動画もカンタンに扱えるようになった。でも、その応用については道半ばともいえる。

アナログでもデジタルのハイブリッド

 コンピューターは計算機というくらいで、最初は数値計算が得意な道具としてとらえられていた。そのうち文字を扱えるようになり、文字計算、すなわちワードプロセッシングができるようになったことで、文書の作成にも使われることになる。特に、漢字かな交じりの日本語を扱えることが、その応用分野を格段に拡大した。

 今のパソコンは、あらゆるデータを扱えるが、やはり数値と文字という当たり前を引きずっている。既存のワープロ文書やPDFにペンで朱を書き込むといったことは、その典型で、そんなハイブリッドな使い方は双方のいいところを相殺してしまいかねない。紙に印刷された文書にリアルなボールペンで書き込んだのと同じことしかできないのでは進化とはいえない。それでもやってみるのは大事だ。

 

とにもかくにもデータをためる

 パソコンで気軽に扱えるデータの種類が少なかったころは、とにかく機械可読のデータを調達することが最優先された。機械であるパソコンにとって都合がいいように、人間がデータを用意するわけだ。キーボードから文字や数値を入力するのもそのための重要な手段だった。

 そして、あらゆるデータがパソコンで扱えるようになった。

 写真をパソコンで扱うには、プリントされた印画紙をスキャンする準備作業が必要だ。スキャンすることで機械可読のデータになる。でも、いったん紙になったものをスキャンするくらいなら、撮影のときに光景をスキャンしたほうが手っ取り早い。デジタルカメラはまさにリアルな光景をスキャンしてデータ化する機器だ。いい、悪いは別として、とりあえず便利だ。

 デジタルカメラが出始めの1990年の中頃、なんて便利な機器なのかと感動して使っていたものだが、当時のデータを、ほぼ四半世紀過ぎた今表示すると、解像度も低く、色も悪い。今のスマホの足下にも及ばない写真ばかりだ。それでも、瞬時に当時の映像を探し出せる点では、積み重なったなネガやプリントの山をガサゴソやるよりずっとラクだ。データ量もたいしたものではない。そのまま維持温存しておけば、近い将来には画像を言葉で検索するのも、今よりずっと正確にできるようになるだろう。当時はまだフィルムで写真を撮ることが多かったので、デジタル写真はそれほど多くは残っていない。今から思えば、もっとたくさん撮影しておくべきだった。

 同じ事は音声にも、動画にもいえる。とにかく、機械可読のデータにして放り込んでおく。できればクラウドに。うまくすれば、10年後、データは何も変わっていないのに、それを取り巻く環境が変わっている。データとしての可用性は飛躍的に高まっているかもしれない。

 今は意味がないと思うような機械可読化作業も、積み重ねていくことが財産になる。あらゆることをパソコンでというのはそういうことだ。