SLAとなぜそれが重要であるかは何ですか?

サービスレベル契約(SLA)は、サービスプロバイダと期待されるサービスレベルを定義するクライアント間の正式な、書面によるコミットメントです。それは、非コンプライアンスのための測定可能なメトリック、責任、および救済を指しています。SLAは、ITサービス、マネージドサービス、クラウドコンピューティング、およびアウトソーシングのアレンジの基礎です。彼らは、漠然とした約束を具体的な義務に変換し、両方の当事者にパフォーマンスを評価するための明確な参考ポイントを与えます。SLAsが紛争がなければ、多くの場合、期待は文書化されていないためです。

実際には、SLAはコミュニケーションツールとして機能し、ビジネス成果と技術的な配信を合わせています。例えば、SaaSプロバイダは99.95%の稼働時間を保証するかもしれませんが、クライアントのビジネスはピークシーズン中にさらに高い可用性を必要とするかもしれません。SLAは、これらのニュアンスが認証されることを可能にします。SLAは、製造されたSLAが信頼を築き、摩擦を減らし、サービスが変化するニーズに変化することを確認します。業界調査によると、SLAはSLAがこれらのニュアンスを検証できる限り詳しく説明しています。SLAは、SLAが、SLAがSLAがSLAがSLAに比べると、SLAが理解しているとおりです。

サービスレベルの合意のコアコンポーネント

すべての効果的なSLAにはいくつかの重要なセクションが含まれる必要があります。 正確な構造は業界によって異なる場合がありますが、以下のコンポーネントは明快さと執行性のために不可欠です。 各セクションは、サービス関係の特定の寸法を置き、いずれかを省略すると、説明責任の曖昧さやギャップにつながることができます。

サービス内容とスコープ

SLAは、サービスがカバーされているかを明確に記述して始めなければなりません。 「ITサポート」のような漠然とした言語を避け、その代わりに、スコープクリープを防ぐ(例えば、24時間年中無休のヘルプデスク、サーバー監視、パッチ、バックアップ、リカバリ)を正確に指定します。 また、スコープクリープを防ぐには、を除外するリストもリストします。 例えば、「このSLAは生産サーバーをカバーするが、開発環境は適用されません。 スコープを定義すると、サービスプロバイダが利用可能なサービスプロバイダの制限時間やサービスプロバイダの制限時間だけを理解できるかどうかが明確に確認されます。

性能メトリックとKPI

パフォーマンスメトリックはSLAの心臓です。 彼らは測定可能なターゲットに期待を向けます。 一般的なメトリックには、次のものが含まれます。

  • 稼働時間/可用性:[ 多くの場合、パーセンテージ(例、月99.9%稼働時間)として表現されました。 重要なサービスについては、99.99%(4つの9つの9つの)を検討してくださいが、現実的であることを保証します。
  • 応答時間:[]]) プロバイダがサービスリクエストを認める時間。例えば、P1インシデントの5分以内にアクノレッジ。
  • 解散時間:]] 事件を完全に解決する時間。 これは、重症度レベルによって分解することができます。
  • [Throughput:]]データ処理能力(クラウドサービス、API、データベースの関連性)。
  • [エラーレート:]]]失敗したトランザクションの割合。 Webサービスの場合、HTTP 5xxエラーレートが考えられます。
  • 修理する時間(MTTR):[)故障後にサービスを復元するための平均時間。
  • [ 障害(MTBF):[]] の間の平均時間 ハードウェアまたはシステムのための信頼性メトリック。

各メトリックはSMART(Specific、Measurable、Achievable、Relevant、Time-bound)でなければなりません。例えば、「プロバイダーは15分以内にP1インシデントに応答し、4時間以内に解決します。」というサブジェクティブな用語を避けてください。また、測定方法論を定義するのも賢明です。カレンダー月や30日ウィンドウ上に計算されるアップタイムは?メンテナンスウィンドウは除外されますか? [Atlas] インターバルトは、最適なガイドを提供します[F] [KPI] [K] と [KPI] は、最適なガイドを選択した場合には、KPI (KPI) [K] または [K] または [KPI] は、 [K] または [K] または [KPI (K] または [K] または [K] または [K] または [K] または [KPI (K] または [K] の間隔を[K] または [K] 間隔を[K] 間隔を[K] 間隔を[[[[[[[[[[[[[[[[[[

役割と責任

誰が要求するかを明確に定義します。 プロバイダーの責任は、インフラストラクチャを維持したり、脆弱性をパッチしたり、ステータスレポートを提供し、セキュリティインシデントの管理したりすることがあります。 クライアントの責任は、多くの場合、タイムリーなアクセスを提供し、要件を定義したり、問題のプロバイダーに通知したり、データバックアップなどのクライアント・サイド・タスクを実行したりすることが含まれます(サービスに含まれていない場合)。 また、各側面の連絡先(SPOC)の1つのポイントを割り当てます。 役割があいまいで、遅延します。 例えば、クライアントが、SLAが通知するかどうかを通知する場合、クライアントは、通知するかどうかを通知します。 クライアントは、SLAが、通知または通知するかどうかを通知します。

モニタリングとレポート

パフォーマンスがどのように監視されるか、レポートの頻度を記述します。 プロバイダーは、Nagios、Datadog、またはSolarWindsなどの自動化されたツールを使用しますか? レポートは、ダッシュボードを介して毎月、毎週、またはリアルタイムでレポートされますか? フォーマット(PDF、CSV、またはWebポータル)を指定します。 また、データを監視するアクセス権を持つ人を定義します。 定期的なレポートは、パーティのアカウントを保ち、トレンドの早期検出を可能にします。 重要なサービスの場合、侵害のリアルタイムアラートを検討してください。例えば、アップタイムのドロップソースが99パーセント未満の通知を行う必要があります。

課題解決とエスカレーション

このセクションでは、インシデントを処理するためのプロセスを概説する必要があります。 重症度レベル(例えば、P1 – Critical、P2 – High、P3 –媒体、P4 – Low)と対応する応答/解像度のターゲットを定義します。 エスカレーションパスを含める: P1の問題がターゲット時間内に解決しない場合は、シニアエンジニアにエスカレーターを割り当て、その後、管理し、最終的にプロバイダのエグゼクティブチームに。 問題のリスクを把握するには、SLAの手順を実行します。 問題が明確にするには、SLAの手順を実行します。

罰と救済

SLA の執行可能なためには、ターゲットを満たすのに失敗する結果を指定します。一般的な救済策には、サービスクレジット(例えば、月間手数料の割合は、稼働時間閾値の下の各時間のために差し引かれます)、払い戻し、または終了の権利が含まれます。しかし、関係を損傷する過度に罰則を回避します。目標は、罰則ではなく、パフォーマンスを動機づけることです。SLA には、ターゲットを上回るインセンティブも含まれます。この場合、SLA または、SLA は、クライアントが要求するかどうかを要求します。[F]

見直し・修正プロセス

SLAは静的文書ではないはずです。定期的なレビューの条項–四半期または毎年–変更されたビジネスニーズや技術に基づいてメトリックを更新する。修正がどのように提案され、見直し、承認されるかを指定します。これはSLA関連性を維持し、それが廃止されるのを防ぎます。例えば、クライアントのユーザーベースが成長する場合、稼働時間要件は締める必要があります。レビュープロセスには、日付の定義と変更に関する議論のメカニズムも含まれる必要があります。

定義と用語集

定義セクションでは、全ての当事者が常に用語を解釈することを確実にします。 「ダウンタイム」、「スケジュールされたメンテナンス」、「緊急メンテナンス」、 「インシデント」、 「サービスクレジット」などを定義します。 これは、曖昧さを減らし、言語上の紛争を防止します。 たとえば、サービスがクライアントの視点から測定されていない限り、一部の合意は「ダウンタイム」を定義します。 クライアントの不正設定による障害を排除します。 明示的にしてください。

SLAをラフトするステップバイステップガイド

スクラッチからSLAを作成すると、ダウンティングを感じることができますが、構造化されたプロセスに従って、徹底性を確保します。 以下は、準備と実行の両方をカバーする、ステップバイステップのアプローチを拡大しています。

ステップ1 - ニーズと要件を評価する

クライアントのビジネス目標とサービスの重要性を理解して開始します。 利害関係者とのインタビューを実施します。 IT、オペレーション、ファイナンス、エンドユーザー。 彼らの最大の懸念は何ですか? 彼らが許容するパフォーマンスはどうですか? 例えば、eコマースサイトはピーク営業期間のほぼ100%稼働時間を必要としますが、内部HRシステムはよりダウンタイムを許容する可能性があります。 また、プロバイダの能力を評価します。 金層のメトリックを満たすためにインフラストラクチャはありますか? 文書はすべて、GDPRigの規制要件を含む必要があります。 GDPRは、GDPR(GDPR)の要件を満たす必要があります。

ステップ2 - 明確な目的を定義する

業務をサービス目的に翻訳します。例えば、「顧客ポータルが営業時間中に99.5%利用可能であることを保証」は「良い可用性を維持」よりも明確です。両方のパーティーの目標と一致する目的を書きます。クライアントの優先度がコスト節約である場合、コストを削減する金メッキメトリックを避けます。例えば、典型的なクラウドプロバイダは、99.9%の稼働時間を提供していますが、平均的なコストを消費する(=2.5%)。

ステップ3 - 測定可能なメトリックを選択

測定が簡単で、直接サービス品質を反映しているメトリックを選択します。 良好なが重要ではないという虚栄心メトリックを避けてください。 例えば、時折長い遅延を隠すと「平均応答時間」が誤解を招くことができます。 パーセンシーの使用を検討してください(例、95秒未満のパーセンシー応答時間2秒未満)。 また、測定ウィンドウで決定します。 スケジュールされたメンテナンスウィンドウが除外される可能性がありますが、除外が明確に定義されていることを確認してください。 複雑なサービスの場合、コンポジット基準は「ART」の異なるメトリックの要件を満たしているかどうかを検証します。

ステップ4 - 文書を破棄

SLA をクリアでプレーンな言語で書きます。非法的なジャーゴンを避けてください。メトリックとタイムラインの表を使用してください。以前のすべてのコアコンポーネントを含みます。文書のモジュラー - サインオフのエグゼクティブサマリー、メトリック、手順、および定義の詳細なアレンディスを保ちます。バージョン管理を使用して変更ログを使用します。テンプレートを使用して一貫性を確保するのを検討してくださいが、特定のサービスのためにそれをカスタマイズします。ドラフト中に、技術的な関係者とすべての法的角度に関与します。

ステップ5 - レビューとネゴティエート

内部チーム(法的、操作、財務)とクライアントの両方に草案を循環させます。 ターゲット、ペナルティ、および除外に関する交渉を期待してください。 歴史的データや業界ベンチマークであなたの数字を正当化するために準備してください。 目標は、達成可能でありながら挑戦的であるバランスの取れた合意です。 オペレーションチームは、メトリクスの現実に署名する必要があります。 プロバイダが実際に提供できないターゲットに同意することです。 文書はすべて変更し、それらを編集するために再調整します。

ステップ6 - ファイナライズとサイン

両当事者が合意したら、認定された代表者のサインを持っています。SLAがマスターサービス契約または契約に添付されていることを確認してください。署名されたコピーは、サポートエンジニア、アカウントマネージャー、およびレポートチームを含む、必要なすべての人にアクセス可能に保ちます。速度のためのデジタル署名を検討してください。また、サービスデリバリーチームは、合意されたメトリックを1日から満たすために、必要な監視と自動化を持っていることを確認してください。

ステップ7 - 実装とモニター

署名した後、SLAを操作します。 監視ツールを設定して、合意されたメトリックを追跡します。各KPIに対するリアルタイムのコンプライアンスを示すダッシュボードを設定します。 エスカレーション手順と重度の定義に関するトレーニングサポートチーム。 すぐに報告を開始 - 実際のパフォーマンスが不足している場合は、次のレビューの前にプロセスをルート原因を特定し、調整します。 最初の数か月間、SLAinterが動作するようにクライアントと頻繁にチェックインを保持し、SLAinterspretationsが動作するようにします。

ステップ8 - 定期的にレビューと調整

SLAを生きた文書として扱います。定期的にレビュー会議をスケジュールします。四半期または半年ごとに - パフォーマンスデータ、新興ニーズ、および提案された変化について議論します。これらの会議を使用して、成功とアドレスの傾向を祝います。メトリックが一貫してターゲットを上回る場合は、それを締めるか、新しいメトリックを追加することを検討してください。逆に、ターゲットが一貫して見逃され、根本的な原因分析がそれが非現実的である場合は、より達成可能なレベルに調整します。すべての修正は、正式に修正され、新しいバージョンとSLAに再発行されます。

避けるべき一般的な落札

SLAを起草するときに経験のあるチームでも間違いを犯します。これらを調べてください。

  • 広々にあいまいな言語:[ 単語「最善の努力」や「合理的な」といった単語は、意見を解く。 常に定量化します。 「回答を促す」ではなく、「30分以内に応答する」と言います。
  • :を無視する。 カバーされていないものをリストに失敗すると、ループホールが作成されます。 スケジュールされたメンテナンスウィンドウ、プロバイダーのコントロールを超えたサードパーティの発生、または神の行為など、すべての除外を明示的にリストします。
  • []非現実的ターゲット:[]) 侵食された信頼に会えないメトリックを設定。 歴史的データや業界標準のベースターゲット。 それを配信するインフラストラクチャを持っている場合を除き、99.999%の稼働時間を約束しないでください。
  • 測定プランなし:]測定できないメトリックが無用です。データが収集・検証する方法を定義します。例えば、「3つの地理領域にあるプロバイダーの合成監視プローブを使用して、稼働時間が計算されます。」
  • クライアントの責任を無視する:[] クライアントの行動はパフォーマンスに影響を及ぼします。 タイムリーなフィードバックのような義務を含み、アクセスを提供し、クライアント側の依存関係を満たします。 クライアントが行動しなかった場合は、プロバイダーは罰せるべきではありません。
  • [ 統計的SLA:]] は、ビジネスニーズが変化します。レビュープロセスがなければ、SLAは無関係になります。 必須の四半期レビュー条項が含まれています。
  • 是正の欠如:[]] 場合、施行は困難です。 クレジット、しきい値、および支払条件については特異的です。 例えば、「暦月における99.9%の稼働時間未満の0.1%ごとに、プロバイダーは月間料金の2%をクレジットします。」
  • []ビジネス優先度に合わせることを促す:[[]メトリックは、測定が簡単なだけでなく、クライアントに何かを反映すべきである。 クライアントが、稼働時間を超える速度を上げると、体重の解像度は可用性よりも高い。
  • 文書のオーバーコンパイル:[ あまりにも多くのメトリックや過度に法的の偽物は、両方のパーティーを混乱させることができます。 それでも正確である間、できるだけシンプルにしてください。

SLAメンテナンスに最適なプラクティス

SLAは生きた文書です。 それを時間とともに有効に保つためには、次の慣行に従ってください。

定期的なレビュー

四半期または半年にわたる会合をスケジュールしてSLAのパフォーマンスを見直します。 応答時間が改善されますか? 一定のサービスが一貫して対象を欠落していますか? 変更を提案するためにデータを使用してください。 業務上の優先順位がシフトした場合は、それに応じてメトリックを調整します。 文書はすべて正式に修正します。 メトリックだけでなく、満足度調査やビジネスへの影響分析を含むバランスの取れたスコアカードアプローチを使用することを検討してください。

透明なコミュニケーション

コミュニケーションチャネルを開くことは不可欠です。パフォーマンスレポートを積極的に共有するだけでなく、問題が発生したときだけではありません。違反が重要である場合は、クライアントを早期に通知し、緩和計画を説明します。透明性は信頼性を築き、紛争中に対立を削減します。両当事者が最近の事件と今後の変化について議論できる週次または月次的なパフォーマンスレビューコールを検討してください。正直な対話は、多くの場合、侵害の申し立てから小さな偏差を防ぎます。

ドキュメント変更

メトリック、除外、プロセス変更が毎回、SLA を更新し、新しいバージョンを発行します。日付と説明の変更ログを保持します。これは、契約月後に参照する際に混乱を防ぐことができます。バージョン番号を使用して、ファイルを明確に名前を変更します(例、SLA v2.1.pdf)。両方のパーティーがアクセスできる共有リポジトリにすべてのバージョンを保存します。どのバージョンがどのバージョンにどのバージョンがどの期間にも適用されるかは明らかですので、効果的な日付を含める。

継続的な改善

SLAデータを使用してサービスの改善を推進します。再発の問題が侵害を引き起こした場合、根本原因分析および予防策に投資してください。SLAを診断ツールとして扱うだけでなく、スティック。多くの組織は、ITILプラクティスを使用して、SLAを継続的にサービス改善(CSI)と整列させます。例えば、MTTRが高ければ、一般的な修正を自動化するか、知識管理を改善することを検討してください。これの詳細については、SLAITIL 4をSLALT[FLT][FLT][FLT]]CLF][FLT]]CLF]を参照してください。[FLTF] [F] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA] [SLA

レバレッジオートメーション

自動監視とレポートツールは、手動の努力とヒューマンエラーを削減します。 多くのITSMプラットフォーム(ServiceNow、Jira Service Managementなど)は、リアルタイムでSLAダッシュボードを生成できます。 メトリックが閾値に近づいた場合にアラートを設定。 自動化は、遅延なくエスカレーションルールを強化するのに役立ちます。 例えば、P1インシデントが15分以内に承認されていない場合、自動メールまたはページは、次のサポートティアにエスカレーションすることができます。 マシン学習は、潜在的な傾向を予測することができます アクティブ 。

業務への影響のあるSLAをアライグ

すべてのサービスは同じビジネスの影響を持っています。 階層化されたSLA:ゴールド(クリティカルシステム、高可用性、高速応答)、シルバー(重要ではなく非クリティカル)、ブロンズ(ベスト・フレーク)を考慮してください。 これにより、クライアントは予算とリスク許容値に一致するサービスのレベルを選択することができます。 SLAは、どのサービスコンポーネントにどのティアが適用されるかを明確に定義する必要があります。 ハイブリッド環境では、単一のSLAは、各メトリックごとに異なる複数の層をカバーすることができます。

鉄道全株式

プロバイダとクライアントチームは、SLAのコンテンツとインプリケーションを理解しなければならない。サポートスタッフ、アカウントマネージャー、およびクライアントの代表者のためのトレーニングセッションを実施します。 誰もがインシデントのログアウトの仕方、重症の定義の意味、およびエスカレーション方法を知っていることを確認してください。 よく根ざしたSLAは、従う可能性が高いです。 一般的なタスクのためのクイックリファレンスガイドまたはチートシートを提供します。

コンテンツ

効果的なサービスレベル契約は、法的な形態性よりもあります。それは、期待を揃え、パフォーマンスを駆動し、パートナーシップを強化する戦略的なツールです。スコープ、メトリック、責任、および救済を慎重に定義することにより、プロバイダーとクライアントは、コストの誤差を回避し、信頼の基盤を築くことができます。定期的なメンテナンスとオープンなコミュニケーションは、SLAがビジネスニーズが進化する関連性を確保します。あなたがシーズンされたサービスマネージャーであるか、プロセスに新しいか、手順と成功の手順に従って、SLAは、SLAが進行中のリソースを計画するかどうかを確かめる[SLA]は、SLAが正しい方法で確認することができます。