システム障害の「切り分け」とは!一次、二次の違いは?分かりやすく解説します!

ITによるサービスが一般的になった現代では、システム障害がつきものです。これら問題を解決するための作業が「切り分け」です。システム障害の原因には、ヒューマンエラーから、システムにある根本的な問題まで幅広くあります。そこで今回は、システム障害における「切り分け」について、一次と二次の切り分けの違いを交えながら解説します。

 

システム障害における「切り分け」とは

 

システム障害において大切なことは「障害切り分け」です。システム障害を解決するために、障害時の操作や環境を正確に把握し、障害が起こった根本的な原因を特定する必要があります。

例えば、インターネットに繋がらなくなったという障害ならば、以下のような原因を想定します。

 

・PCのネットワークドライバ(ソフトウェア)の問題

・PCへ新たにインストールしたソフトウェアの問題

・PCのLANポートの故障

・LANケーブルの断裂

・ルーターとケーブルの接続問題

・ルーターの物理的な破損

・ルーターのファームウェアの不具合

・プロバイダーへの料金支払い確認

 

などです。

ネットワークへの接続障害ひとつ取っても、環境やオペレーションに依存した原因が無数に存在します。システム障害における「切り分け」では、これら原因のどれに該当し、どのように解決へ導くかが最大の業務になります。

 

システム障害時の「一次切り分け」と「二次切り分け」の違い

 

システム障害の問題切り分けには「一次切り分け」と「二次切り分け」があります。これらはどちらも障害の原因を特定するものですが、それぞれの切り分けには重視するポイントに違いがあります。

 

一次切り分けは障害対応のはじめの一歩

 

 

一次切り分けは、障害の原因特定における最初のアクションであり、問題を正確に把握するための最も重要な役割とも言えます。

システム障害が起きた際、それがシステムに潜在的に潜む障害なのか、あるいはオペレーションミスなどのヒューマンエラーなのかを切り分ける必要があります。

この大まかな切り分けは、今後の問題解決方法にとって最も重要な判断となり、万が一原因を取り違えてしまえば、対応の手戻りが起こってしまうのです。

システム障害は、システムを利用するユーザーにとっては業務を止めてしまうほど致命的ですので、出来る限り迅速にシステムの回復へ導かなければなりません

一次切り分けに必要な情報には大きく以下の2つがあります。

 

・システム障害が起こる前に行ったオペレーションの把握

・システム障害が起こった後に行ったオペレーションの把握

 

これら情報を正確に聞き出すことが、システム障害の正確な一次切り分けに繋がります。

 

二次切り分けは専門的な障害対応

 

 

二次切り分けを行う段階では、ほとんどの場合オペレーションミスなどのヒューマンエラーは取り除かれている状態です。ですので、基本的にはソフトウェアやハードウェアの専門的な情報による問題切り分けとなります。

例えばネットワーク障害であれば、ネットワーク機器自体の不具合であるのか、あるいはファームウェア自体に不具合があるのかを切り分ける必要があります。二次切り分けは、システム障害を根本的な解決へ導くことが重要な使命なのです。

 

一次切り分けに必要なスキル

 

具体的な障害を正確にヒアリングするコミュニケーションスキル

 

 

一次切り分けに最も必要なスキルは、障害を正確にヒアリングするコミュニケーションスキルです。システム障害が起きた際に、事象をヒアリングすることは比較的容易ですが、障害が起きた際に行った前後の操作や、現状の障害範囲を詳細にヒアリングするには、ユーザーとのコミュニケーションが大切です。

システム障害を早く解決するために、ユーザーが焦っている場合も多いので、その状態から様々な事象をヒアリングしなければなりません。

冷静に且つユーザーに寄り添った口調でシステム障害の詳細をヒアリングするためには、コミュニケーション能力が不可欠なのです。

 

Geekly Media ライター

佐久森

5+