タグ付けの正しいやり方|検索性を高めるためのルール
作品の分類方法(ジャンル・技法・シリーズ)を体系化する
――アーカイブで失敗しないための設計思想――
アーカイブ運用において、最も軽視されやすく、同時に最も重要なのが「名前付けルール」です。
ファイル名やフォルダ名は、単なる目印ではありません。検索性、引き継ぎやすさ、システム移行、自動処理の可否など、アーカイブ全体の品質を左右する基盤です。
多くの現場では、
「後で直せばいい」
「自分が分かればいい」
という判断が積み重なり、数年後に誰も扱えない状態になります。
本記事では、作家・ギャラリー・自治体いずれにも通用する命名ルールの完全設計を、なぜ必要なのか、どう作るのか、どこで失敗するのかという順序で解説します。
命名ルールは、整理のためではなく「運用を成立させるため」に存在します。
ファイル名が整理されていないと、検索が機能しません。OS検索、クラウド検索、アーカイブシステムの内部検索はいずれも文字列に依存しています。制作年や作品名が含まれていないファイルは、存在していても「見つからないデータ」になります。これは実質的に失われたのと同じ状態です。
AtoMやOmekaなどのシステムでは、CSVと画像ファイルをIDや名前で紐付けるケースが多くあります。このとき、命名ルールが不統一だと自動連携が成立せず、手作業が発生します。命名ルールは、人間のためだけでなく、システムのための言語でもあります。
命名ルールがないデータは、本人しか分かりません。しかしアーカイブは長期運用が前提です。数年後の自分、後任の職員、外部協力者が見ても理解できる名前でなければ、運用は止まります。
システム乗り換え時、最も時間がかかるのが命名の整理です。最初からルール化されていれば、移行コストは大きく下がります。
ファイル名には「最低限の意味情報」を含める必要があります。
制作年(YYYY)を先頭に置くことで、時系列で自動的に並びます。これはOS・クラウド・システムすべてに共通して有効です。西暦4桁で統一することで、並び順の崩れを防げます。
作品名を省略すると、後から正式名称が分からなくなります。展示や資料作成時に確認が必要になり、二度手間が発生します。長くなっても正式名称を入れることが基本です。
サイズは作品識別に非常に有効です。同名作品やシリーズ作品を区別する助けになります。cm表記など、表記ルールを統一した上で含めます。
システム連携を考える場合、全角記号や特殊文字は避けます。アンダースコア(_)やハイフン(-)で区切るのが安全です。
一見便利な名前ほど、後で大きな障害になります。
IMG_1234のような自動生成名は、情報を一切含みません。画像が増えた瞬間に検索不能になります。
最終決定2、最新版などは、必ず更新されます。どれが本当に最終なのか、誰にも分からなくなります。状態を名前で表現するのは避けるべきです。
「きれい」「修正後」などの主観語は、第三者には意味が通じません。客観情報だけを使うことが原則です。
日本語ファイル名は使えますが、外部連携や海外ツールでは文字化けの原因になることがあります。将来を見据えるならローマ字も検討します。
ジャンルごとに補助情報を足すと管理が楽になります。
制作年_作品名_技法_サイズ
技法を入れることで、検索や分類が容易になります。
制作年_作品名_素材_サイズ
素材は保存や展示計画にも関わるため重要です。
撮影年_シリーズ名_撮影地_番号
撮影年とシリーズ単位での管理が有効です。
撮影年_展示名_全景/部分_番号
用途が分かる名前にします。
フォルダ名は構造を示す役割を持ちます。
深すぎる階層は運用を難しくします。3〜4階層が目安です。
フォルダは「人」「物」「出来事」で整理すると破綻しにくくなります。
年度別と作品別を混在させると、どこに何があるか分からなくなります。どちらかに統一します。
ファイルと同様、意味のある名前を付けます。「data」「misc」は避けます。
連番は秩序を保つための重要な仕組みです。
1、2ではなく01、02にすることで並び順が崩れません。
_01_full、_02_detailのように、用途を明示します。
最初から余白を持たせた番号設計が重要です。
番号はあくまで識別子です。意味情報は別要素で持たせます。
命名ルールは地味ですが、最も効果が高い施策です。
ルールがあれば、迷わず入力できます。
整理された名前は、何年経っても意味を失いません。
命名ルールは、未来への投資です。
▶ デジタルアーカイブ化を「導入すべきかどうか」から検討している方はこちら
※現状の運用を前提にご相談を承ります