そうか、そうか

~とあるSIerの、哀と涙の軌跡~

VMware Cloud on AWS ~ SLAが知りたい! 編 ~

徐々に熱くなってきてますね。

夏は本当に苦手です。

 

一昨年に、お仕事で7~8月に北海道へ行きました。

同じ日本とは思えないぐらい、真夏なの湿度が低くて過ごしやすかったです。

 

そして、北海道って本当に、どこのお店でご飯食べておいしいですね。

 

私は、もともとラーメンが大好きなのですが、

北海道といえばやはり味噌ラーメン!

 

基本的に札幌でのお仕事ばかりでしたが、10軒ぐらいは行きました。

 

また北海道行きたいなぁ、あ、仕事以外で・・・

 

 

さて、今回はVMware Cloud on AWS(以降VMC)の紹介シリーズとして、

SLA(Service Level Agreement)について、ご紹介しようと思います。

※今回は文章ばっかりです。ごめんなさい。

どの程度なの?VMCの可用性って。

VMCは、VMwareが提供する「サービス」です。

よって、そのSLAVMwareから公表されています。

f:id:gokusan:20210110151306p:plain

 

この可用性は、以下のような計算式で算出されているそうです。

 

可用性=([請求月の合計分数–利用できない合計分数]  ÷ 請求月の合計分数)× 100

 

「分単位」で決められているんですね。

 

試しに、1か月間で考えると、

24(時間) × 60 × 30(日) = 43,200 分

 

このうち、99.9%であれば、

43,200 × 0.999 = 43,156.8 分 が、VMCとして保証された稼働時間になります。

 

さて、ここで気になるのが…

 

この「利用できない合計分数」という部位です。

VMCにおける「利用できない」とはどういう定義なのでしょうか?

 

Unavailability and SLA Events
A service component will be considered “Unavailable”, subject to the Service Level Agreement Limitations set forth below, if VMware’s monitoring tools determine that one of the following events(each, an “SLA Event”) has occurred.
The total minutes that the service component is Unavailable for a particular SLA Event is measured from the time that the SLA Event has occurred, as validated by VMware, until the time that the SLA Event is resolved such that the service component is no longer Unavailable.
If two or more SLA Events occur simultaneously, the SLA Event with the longest duration will be used to determine the total minutes Unavailable.

訳)

使用不可およびSLAイベント
VMwareの監視ツールが次のいずれかのイベント(それぞれ「SLAイベント」)が発生したと判断した場合、サービスコンポーネントは、以下に示すサービスレベル契約の制限に従って「利用不可」と見なされます。
特定のSLAイベントでサービスコンポーネントが使用不可になる合計分数は、VMwareによって検証されたSLAイベントが発生してから、SLAイベントが解決され、サービスコンポーネントが使用不可でなくなるまで測定されます
2つ以上のSLAイベントが同時に発生した場合、最も長い期間のSLAイベントを使用して、使用不可の合計分数が決定されます。

 

ふむふむ。

どうやら、利用できない状況、というのはSLAイベント、とよばれるあらかじめ決まった定義があるようです。

 

じゃぁ、SLAイベントってどんなのがあるの?

以下が、SLAイベントに該当するようです。

 

SDDCインフラストラクチャ:
a)クラスターで実行されているすべての仮想マシン(「VM」)は、4分間連続して接続されていません。
b)どのVMも4分間連続してストレージにアクセスできません。
c)どのVMも4分間連続して起動できません。


SDDC 管理:
a)vCenterサーバーに4分間連続してアクセスできなくなります。
b)NSXManagerに4分間連続してアクセスできなくなります。


VMware Site Recovery Manager:
a)VMware Cloud onAWSで実行されているVMwareSite Recovery Managerサーバーに、4分間連続してアクセスできなくなります。
b)VMware Cloud onAWSで実行されているVMwarevSphere Replication管理サーバーに、4分間連続してアクセスできなくなります。

 

 

仮想マシンが使用できなくなるなど、どれもクリティカルなものばかりですね。

この定義に当てはまった場合、「利用不可の時間(分)」と見なされるようです。

 

ん?可用性の保証を下回ったらどうなるの?

SLAクレジット という形で、利用料がユーザーに還元されます。

 

ただ、万一の時に、SLAクレジットを受け取るためには、いくつかの条件を満たしておかなければいけません。

SLAを下回ったからといって、無条件に受け取れるというわけじゃぁないのです。

 

To be eligible to receive any SLA Credits for an SLA Event, you must meet the following requirements:
• For non-stretched clusters without VMware Elastic vSAN™ for VMware Cloud™ on AWS(“VMware Elastic vSAN”), you must have a minimum configuration for all VM storage policy Numbers of Failures To Tolerate (FTT) = 1 when the cluster has 2 to 5 hosts, and a minimum configuration of FTT = 2 when the cluster has 6 to 16 hosts.


• For non-stretched clusters with VMware Elastic vSAN, you must have a minimum configuration for all VM storage policy Numbers of Failures To Tolerate (FTT) = 1 when the cluster has 3 or more hosts


• For stretched clusters (with or without VMware Elastic vSAN), spanning across more than one availability zone, you must have a minimum configuration for all VM storage policy Site Disaster Tolerance (PFTT) = Dual Site Mirroring and Secondary level of failures to tolerate (SFTT) = 1


• The storage capacity for the cluster retains slack space of 25% available (as described in the VMware vSAN™ storage guide


• There must be sufficient capacity on the cluster to support starting a VM.

訳)

SLAイベントのSLAクレジットを受け取る資格を得るには、次の要件を満たしている必要があります。
VMware Elastic vSAN™ for VMware Cloud™ on AWS(「VMware Elastic vSAN」)を使用していない非ストレッチクラスタの場合、クラスタのホスト数が2~5の時は、すべてのVMストレージポリシーのNumbers of Failures To Tolerate(FTT)=1、クラスタのホスト数が6~16の時は、FTT=2 が最小構成になっている必要があります。


•VMwareElastic vSANを使用する非ストレッチクラスターの場合、クラスターに3つ以上のホストがある場合、すべてのVMストレージポリシーの最小構成が必要です。許容できる障害の数(FTT)= 1


•複数のアベイラビリティーゾーンにまたがるストレッチクラスター(VMware Elastic vSANの有無にかかわらず)の場合、すべてのVMストレージポリシーの最小構成が必要です。サイトディザスタトレランス(PFTT)=デュアルサイトミラーリングおよび許容する障害のセカンダリレベル(SFTT)= 1


クラスターのストレージ容量は、25%のスラックスペースを保持します(VMwarevSAN™ストレージガイドで説明されています)。


VMの起動をサポートするには、クラスターに十分な容量が必要です。

 

長いですねw(一部翻訳おかしかったらすみません)

 

これは、VMwareによって管理されているVMC環境において、『ユーザーが定義・設定・変更』できる部位についての要件がほとんどです。

 

引用:

https://www.vmware.com/content/dam/digitalmarketing/vmware/en/pdf/support/vmw-cloud-aws-service-level-agreement.pdf

 

このうち、『ストレージポリシー』の部位については、次回お話しようかと思います。

 

 

ざっくりとした説明ですが、VMCのSLAについてご紹介しました。

ではでは。