Translate

2021/01/18

文書のタイトルとメタデータ


 ファイルの身分証明書に相当するのがプロパティだ。ファイルエクスプローラーで、任意のファイルを右クリックし、ショートカットメニューでプロパティを表示させると、そのファイルの素性が一通りわかる。プロパティのウィンドウにある詳細タブを開くと、いろんな情報が表示される。

ファイルの身分証明書

 プロパティの項目はファイルの種類によって異なる。たとえば、デジカメで撮影した写真であればイメージの縦横ピクセル数やどのカメラで撮影したものなのか、撮影日時、シャッター速度、ISO感度、絞り、レンズの焦点距離、GPS情報が緯度経度で埋め込まれていれば、撮影した場所もわかる。

 一方、Wordのようなアプリで作成した文書ファイルであれば、タイトル、件名、コメントといった項目が並ぶ。文書のページ数や単語数、文字数、行数などもここでわかる。

 これらのプロパティ項目は、Windowsの場合、ファイルエクスプローラーでの詳細表示でも一覧表示することができる。見出しを右クリックすると表示できる項目がリストアップされるので、表示したいものを選べばいい。各項目の内容ごとに並び替えができるので便利だ。

 

自動的に生成できないメタデータもある

 写真ファイルでは、カメラが自動的に情報を付加するので手間はかからないが、Wordの文書ファイルは明示的にデータを入力しない限り、各種項目は空っぽだ。大量の文書ファイルを一覧するだけで、特定の文書を見つけるためには、このプロパティ情報をきちんと入力しておくといい。

 とはいうものの、やはりめんどうくさい。本当は自動的に入ってほしいくらいだ。Wordではファイルを初めて保存しようとすると、その最初の行の文字列がファイル名となって保存しようとする。この機能によってファイルに「文書1」といったよくわからない名前がつくのを回避しているわけだ。だったら、最初の行をプロパティの「タイトル」として保存してくれてもいいのにとも思うのだが、そうはなっていない。

 それでもプロパティの各項目には、ファイルの中身やその容量とは別勘定で任意のデータを格納しておける。こういう種類の情報をメタデータと呼ぶ。大量の情報から任意のものを抽出するときに便利だ。リンゴの写真に、それがリンゴであるとメタデータを書き込んでおけば検索のときに便利だということは想像に難くない。

 だが、今や、そんなことをしなくても画像検索ができる時代になってしまった。それでもメタデータとして書き込んでおかなければ検索不可能な情報もある。すべてのファイルに入れるのはたいへんだが、重要なファイルには明確なメタデータを書き込んでおいたほうがよさそうだ。まあ、それもちょっと先にはAIが文書を解析してインデックスを作ってくれるようになるのだろう。そのころにはこんな作業は無駄だったと昔話をすることになりそうだ。