多くの法域には、最低5年間データを保存するという法的要件があります。言うは易し、行うは難し、です。そのため、複数のデータのバックアップが必要になります。

データを内外部の攻撃から保護することの困難さはとりあえず横に置いておいて、短期的および長期的なデータ(構造化データであれ、非構造化データであれ)をきちんと保管することの困難さを考えてみましょう。

私は1980年代前半からPCユーザーですが、(幸いにも、そしてこの幸運が続いてほしいものですが)サーバー攻撃でデータが侵害された経験はありません。確かに、私は集中攻撃しやすいターゲットではなく、フィッシングメールを無視し、知らない誰かからのリンクをクリックしない程度の知恵は持っています。語彙の乏しい「ハッカー」から、毎日、露骨な試みが行われており、結局は、セキュリティに関してどの程度鋭敏な感知能力があるかにかかっていると思います。ランサムウェア、ウイルス、マルウェアがデータ整合性に対する脅威であることは事実ですが、自分自身を保護することは難しいロケットサイエンスではなく、ごく基本的なツールを使ってできることです。しかも、無料のものもたくさんあります。

非エンタープライズユーザーとして、私は自分のオンライン保護のためにシンプルに、Windows Defender、CCleaner、様々なブラウザプラグイン(adblockers 、Ghostery、Privacy Badger、HTTPS Everywhere)、および VPN を使用しています。もしちょっと偏執気味に気になりだしたら、Tor やプライバシー重視の Linux ディストリビューションを使用することもあるかもしれません。

私が心配するデータ関連の問題は、多分ほかの人もそうだと思いますが、光学式メディア(CD、DVD、Blu-Ray )やハードディスクドライブ(HDD)など、メディアの障害です。メモリカード、SSD、メモリスティック、磁気メディアも問題になる可能性があります。

すべてのストレージ形式に弱点

今ではもう決まり文句ですが、データは企業の生命線です。データ分析、パーソナライズされた煩わしいマーケティング、そして顧客や市民などについてより深い洞察ができるよう工夫されたその他の「進歩」を考えると、データを保存することの重要性を否定することはできません。また、コンプライアンスの要件を満たしたり、自社のドキュメントを管理するためには、重要データはストレージに保管する必要があります。

残念ながら、これほどデータが重要であっても、無期限にデータを維持できる単一のストレージ方法はありません。長年の間に、人気テレビ番組のエピソードも永遠に失われました。アーキビストと図書館も、どうすれば確実に保存できるかに常に頭を悩ませていますが、一般企業もデータ保存の重要性をよく認識すべきです。どうすればデータを保護し、信頼できるデータアーカイブプロセスを維持できるでしょうか?ストレージの種類に関係なく、すべてに弱点が存在するので、簡単に解決できる問題ではありません。

テープデータ・バックアップ

テープ・バックアップは、グローバル企業にとって好ましいソリューションであり、オンライン分析では、他の方法よりもテラバイトあたりのコスト削減の可能性が指摘されています。1テラバイトの HDD が約50ドルで販売されており、同等のサイズのテープがわずか5ドルと、10分の1であるのは事実です。では、誰もがテープを使用するわけではないのはなぜでしょうか?単一の LTO-5(3世代遅れ – LTO-8ドライブはもっとコスト高)のテープドライブのコストは約1,000 ドルからで、安価な RAID/SAS コントローラーカードでもさらに200ドルかかります。メディアコストは LTO タイプによって異なりますが、タイプに関係なく、正しいストレージが不可欠です。電磁干渉と湿度はテープを破壊する可能性があります。最初に多額の投資を行う準備ができている場合に限って、テープは長期保管に適しています。1,000 ドル以上あれば多くのハードドライブを購入できます。

HDD

私が現時点で最も推薦したい媒体は HDD です。最低額の消費者レベルのドライブは避けたいところですが、コストを無視して高額な大企業向けのドライブを選択するのも賛成できません。私の選択は、週7 日毎日24時間のビデオ監視システムを対象としたドライブです。購入した6つの 4Tb ドライブのうち、2つは3年間の保証期間内に故障しました。私はずっと古いドライブ(例えば日立の 80Gb のもの)をまだ使用していますが、大容量のドライブが故障するのは明らかです。故障するかどうかの問題ではなく、いつ故障するかの問題です。

Backblazeは、進行中の詳細な調査 で、ハードドライブの障害が予想されることを明確に示しています。この結果はデータセンターの週7日毎日24時間の使用に基づいていますが、通常のオフィス環境でのハードドライブ障害は4年の使用後に発生する可能性が高いと一般に想定されています。HDD の寿命の間の電力サージ、振動、劣化は、HDD の一般的な問題です。こういった理由があって消費者向けドライブでは長期保証は利用できません。

データ・バックアップ用の光学メディア

CD であれ、DVD であれ、Blu-ray ディスクであれ、データバックアップに適した光学メディアを見つけるのは困難です。安価なメディアを購入するバーゲンハンターは、ほんの数回の使用でディスクが読めなくなって失望することがあります。光学式メディアは値段相応であり、最高レベルのものでも、日光、湿度、不適切なストレージ(磁気源の近くなど)、引っかきなどによって破損します。

M-Disc メディアは高価であり、寿命は1,000年と言われていますが、(当然ながら)まだ検証できていません。データが高度な金属に刻まれているため、潜在的な可能性があるようです。M-Disc バーナーの小売価格は100ドル未満なので、手頃な価格のオプションです。残念ながら、光学メディアの容量が増えると、速度が低下します。せいぜい6 倍の書き込み速度を期待してください。光学メディアの常として、ファームウェアの非互換性やメディア品質のばらつきにより、バーナーやプレーヤーに最適なメディアを見つけるのに時間がかかる場合があります。偽の光学メディアは非常に一般的です。

フラッシュベースのストレージ

SSD でもメモリスティックでも、HDD やテープと比較した場合、フラッシュベースのストレージの最大の問題は、コストと容量の不足です。さらに、電荷は時間とともに減衰し、書き込みサイクルに応じて故障の可能性が高まります。

何が最適か?

長期保存媒体のオプションとしてはメモリカードは考えられませんが、それ以外で中長期でデータを保存し整合性を確保するための最良のオプションは何でしょうか?1つの選択肢としては、データストレージ、バックアップ、検証、アーカイブ、などの要件の達成を外部委託する、つまりクラウドを使用することが考えられます。データの劣化、ビットロット、その他のプロセスに関わる問題をほかの誰かに肩代わりしてもらえばあれこれ心配しないで済みます。

どのタイプのストレージを選択することにしても、バックアップ・プロセスを明確にしておく必要があります。通常のドライブイメージ、増分バックアップのスケジュール、リアルタイムミラーリング、RAID、NAS 、外部ドライブなど、個々の企業の状況に応じて最適な方法を考えてください。

すべてのデータストレージデバイスと媒体には既知の欠陥があります。環境条件を考慮する必要があり、データが劣化することなく保持されるようにするには、正しい保管手順が必要です。最適なプラクティスは、1つのオリジナルデータソースと3 つのコピー(ストレージタイプは少なくとも2種類(クラウドとテープなど))がある3-2-1メソッドを使用することです。

破損したストレージからデータをリカバリするには高額の費用がかかりますが、安定したバックアッププロセスが整っていれば一般的にはそういった心配がなくなります。

どのようなバックアップ/保存方法を使用するとしても、データの検証は常に重要です。バックアップを検証する唯一の方法は、バックアップしたデータを復元することです。緊急時にバックアップを復元できないと、ビジネスに深刻な影響を与える可能性があります。様々なことが起こり得るので、災害復旧プロセスに標準的な予防保守タスクを組み込んでおくことは不可欠です。DNA がデータストレージ問題の解決策になる可能性が提唱されていますが、少なくともそれが実現するまでは、私たちは現在のストレージ技術によって制限されています。本当なら、早く実現してほしいと願うばかりです。