大手のレンタルサーバー会社で大規模な障害が発生し、データ消失という最悪の事態が発生したとの報道がありました。
公開された中間報告によれば、原因はセキュリティ対策のために行われたシステムの更新作業だったようです。さらに、本運用のシステムと予備システムの両方で行ったため、データの復旧が困難になったということです。
システムは冗長化されていたものの、正副両方に同じ作業を行ったことで取り返しのつかない状況になってしまったものと思われます。
そもそも、冗長化は「システムを稼働させ続ける」ための備えのことです。システムそのものを複数持つこともそうですし、ハードウェアのレベルでは電源やストレージの多重化などが行われます。ただ、2重3重の対策をとったとしても、時にそれらをやすやすとすり抜けて障害が発生することがあります。
そこで、最後の頼みの綱となるのがバックアップです。システムが完全にお釈迦になってしまった場合は、それ以外に救いの手はありません。ところが、バックアップをきっちり真面目にやろうとすると、世代管理の手間やストレージの用意など、それなりのコストが発生することになります。日々の業務に追われ、そのあたりがなおざりになってしまうのが一番恐ろしいことです。
これまで、冗長化とバックアップを漠然と捉えてきましたが、両者の違いをよく肝に銘じておこうと思います。