【運用管理の勘所④】「性能管理」とは?
システムマネジメントサービス部の中原です。
「運用管理の勘所」第4回目は「性能管理」について解説します。
「性能管理」とは
性能管理は狭義の性能を意味するパフォーマンスと、容量を意味するキャパシティの二つの管理に分けることができます。
パフォーマンス管理とはあらかじめ設けられた「サービスレベル」を恒常的に維持していくことを指し、キャパシティ管理は中長期における最適なシステム構成の計画・立案を行うことを指します。
パフォーマンス管理を適切に行っていないと、サービスレベルの低下や性能上のトラブルの予測や回避ができないばかりでなく、トラブル時の迅速な回復も行えません。
一方、キャパシティ管理を適切に行っていないと、設備不足などでサービスレベルを維持するだけのパフォーマンスが発揮できなくなった場合に、迅速に設備増強することができず、重大な性能上のトラブルにつながる恐れがあります。
傾向を見て先手を打つ
性能管理の目的の1つである「サービスレベルの確保・維持」のために、現状のパフォーマンスに問題がないことを確認するのはもちろんのこと、より重要なのは、継続的なデータ収集、分析によるパフォーマンスの傾向を把握することです。
システムの性能に関連する適切な管理項目と管理基準を設定し、継続的に監視し、傾向を分析することで、パフォーマンストラブルを起こす可能性のあるボトルネック項目をいち早く見つけ、問題が発生する前に先手を打って対策を講じることが可能になるからです。
また、継続したパフォーマンスデータを把握することで、中長期的なキャパシティ予測も容易になります。
業務計画を入手しキャパシティ管理に活かす
通常のパフォーマンスデータの傾向分析だけでは把握できない変動要素として、新規システム化要件や業務要件の影響があります。
こういった要件による大幅な処理量の増減は、システムのパフォーマンス、キャパシティに大きな影響を及ぼすため、日ごろから、業務計画を入手し、性能管理に活かすことは非常に重要です。
継続的かつ周期的に運営する
運用管理全般に言えることですが、継続的かつ周期的な運営が、効果をより高めることになります。
特に性能管理については、日次~月次で行われるパフォーマンス管理の短期的周期での運用と、キャパシティ計画の作成から実施~基準見直しにいたる中長期的周期での運用を継続的に実施することで、より効果が現れるものです。
また、企業活動は季節変動をともなうので、一年以上のデータ収集を行うことによって、年間変動を把握しておくことも大切です。企業ごとに市場から受ける影響は様々なので、この季節変動を、組織変更や事業変更の影響に加味して予測することにより、性能管理の精度を向上させることができるのです。
体制
性能管理(パフォーマンス管理・キャパシティ管理)の責任者・担当者など、体制を整備し各担当の役割を明確化することにより、より円滑で精度の高い性能管理を進めることができます。
- 責任者
- 性能管理における評価の全責任を負い、キャパシティ計画の承認を行います(例:システム運用部長)
- 担当者
- 性能管理を行います。レポートを元に、システム分析および評価、チューニングなどの改善や、分析・評価の結果及び今後のシステム化計画を元に、キャパシティ計画の立案を行います(例:システム運用課長)
- 作業者
- 性能管理における日常監視、パフォーマンス・データの採取とレポート作成などの業務を行います。(例:運用担当者)
パフォーマンス管理の手順
パフォーマンス管理の手順は、
- 管理項目や基準値を設定して、日々その基準が満たされていることを監視し、
- データ収集やレポート作成を行い、
- 一定期間で使用率などのトレンド分析・評価を行い、
- 性能低下またはその恐れがある場合にチューニングを行う
といった、一連の流れとなります。
管理項目、管理基準値の設定
日常的に把握する管理項目を明らかにし、設定した管理項目の値が、どのような値(または範囲)であればサービスレベル(主にレスポンス)を維持できるのかを、あらかじめ管理基準値として設定する。これがパフォーマンス管理における評価・分析を行うための判断基準となる。
管理項目として一般的に採用される項目
- リソース状況
- CPU、メモリ、ディスク装置などのレスポンス
- 業務稼動状況
- トランザクション件数など
- サービス状況
- オンラインのレスポンスタイムなど
データ収集、レポート作成
OSやデータベース・ソフトウェアなどの基幹プロダクトや各種ハードウェアが出力するシステムデータ(ログデータやモニター・トレースデータなど)を採取する。採取データはキャパシティ計画を視野に入れ、必要に応じて長期間保存する。
レポートの種類は、ある一定期間(日次・週次・月次・半期・年次など)のサイクルで作成するものと、ピーク時やシステム繁忙期を対象とした例外時レポートがある。レポートは、各管理項目が、どのレベルで推移しているかを管理基準値に基づき図式化、グラフ化したものであり、各管理項目が管理基準値を満たしているか否かが一目でわかる形式であることが望ましい。
一定期間での分析、評価
レポートの内容から、管理項目が管理基準値を満たしているか否かなど、達成状況について評価を行う。管理基準を満たしていない場合は原因分析を行い、必要な対応(パラメーター調整、ハードウェア増強など)を検討する。
また、キャパシティ計画を行う上で重要となる、システムの稼動状況の傾向(トランザクション数やディスク容量の推移など)を分析し、資源の余裕度などの把握を行う。
チューニング
評価・分析により問題となった部分おいて、短期的に解決可能なものについては、検討した改善策を実施する。
キャパシティ管理手順
キャパシティ管理は、前項(パフォーマンス管理)で得られるシステム状況のトレンドを受け、企業戦略の変化やユーザーニーズの変化などを加味し、
- キャパシティ予測
- キャパシティ計画立案
- 企業戦略 (経営) へのフィードバック
を行います。
キャパシティ予測
パフォーマンス管理における、過去一定期間(例えば過去1年間)の評価・分析結果およびその他の外部要因から、システム状況のトレンドを把握し、今後のシステム状況の予測を行い、現状システムの限界時期を予測します。
キャパシティ計画立案
キャパシティ予測をもとに、今後の中長期的なキャパシティ計画(システム増強/縮小計画)を策定します。キャパシティ計画に基づき、システム増強または縮小(変更作業)を実施した後は、性能管理において新たなシステム構成に対する管理項目・管理基準値を見直すというサイクルとなります。
企業戦略(経営)へのフィードバック
キャパシティ管理で得られる各種数値から、経営に影響の大きいものを抽出・影響分析し、できるだけ速やかに経営側に報告することが大切です。最初はどんな情報が必要かなど、経営側、運用管理側ともに模索状態になるかもしれません。
が、「事業(経営)」と「システム運用」の間で、タイムリーな情報交換を行うことにより、適切な対応がすみやかにとれるようになるはずです。従って、この取り組みは大変意義があります。
いかがでしたでしょうか。次回は「稼働管理」について紹介します。