デスクトップ仮想化の最適化

概要

要件

このライブダッシュボードには、当社の仮想化コネクタの一つ以上をインストールする必要があります。

問題

仮想デスクトップは、複雑な技術スタックによってサポートされており、独自のパフォーマンスおよび可用性メトリクスが非常に多くあります。さらに、物理デスクトップの監視に使用される従来のメトリクスも、仮想デスクトップの文脈で異なる解釈が必要かもしれません。

さらに悪いことに、組織は通常、地理的に離れた専門チームによって管理される異なる技術スタックを持つ複数の仮想デスクトップ環境を持っています。

これらの状況は、いくつかの問題を引き起こします：

データ過多 - メトリクスの数が多すぎて、データ過多を感じ、
- ユーザー体験に影響を与えるメトリクスを特定しにくくします。
- 仮想デスクトップの文脈でよく知られているメトリクスを解釈するのが難しく、
- トラブルシューティングの旅をどこから始めるかを理解しにくくし、
- 事前にパフォーマンスの問題を防止することが難しくなります。
コミュニケーション - デスクトップ仮想化の本質的な複雑さのため、すべての関係者間で問題、影響、およびトレンドに関するコミュニケーションが難しい。
ローカライゼーション - 異なる技術スタックを持つ複数のデスクトップ仮想化環境があり、複数の地理的に離れた場所から接続するユーザーがいるため、問題のローカライズと適切な専門チームとの連携が困難です。
影響評価 - すべての仮想デスクトップとそれらがどのように組織されているかの高レベルの概要がないと、問題の影響の評価が難しい。
導入と利用 – 仮想デスクトップはデータセンターからサービスとして提供されます。どんなサービスにも高低の需要期があります。これは、パフォーマンスと可用性がユーザーの行動に大きく依存することを意味します。ログオンストームのような使用パターンのいくつかを見つけたり、相関させたりするのが難しいです。

解決策

このライブダッシュボードは、環境や技術スタックに関係なく、すべての仮想デスクトップの状態、健康状態、パフォーマンスの統一された概要を提供します。このダッシュボードは、主要なパフォーマンス指標に基づいており、ユーザーがトレンドを把握し、問題をローカライズし、その影響を評価する能力を提供します。ツールチップを使用して、ダッシュボードは組織がパフォーマンスおよび可用性の指標を解釈し、次のステップを提案するのを支援します。最後に、このダッシュボードは、仮想デスクトップのデジタルエクスペリエンス管理におけるさまざまな関係者間のコミュニケーションを効率化することを目的としています。

ユーザーエクスペリエンス概要

仮想デスクトップのパフォーマンスは、ユーザーエクスペリエンスにおいて最も重要な要素です。従来のパフォーマンスカウンターでは、正確な状況を常に描写できるとは限りません。複数のユーザーが同じハードウェアリソースを共有しているため、パフォーマンスメトリクスが負荷の増加を示しても、ユーザー自身は遅れを感じないことがよくありますし、その逆もまた然りです。

このLibraryダッシュボードのユーザーエクスペリエンスタブは、仮想デスクトップのパフォーマンスをユーザーがどのように認識しているかを示すいくつかのメトリクスに焦点を当てています。この認識されたパフォーマンスは、ログオンにかかる時間、仮想デスクトップとユーザーのローカルデバイス間のネットワーク遅延、最後にセッションの応答性を説明する3つの個別のメトリクスに分解されています。

ユーザーエクスペリエンス要約

ユーザーエクスペリエンスタブの最初のセクションは、この概要のイントロで言及された3つのメトリクスに基づいたユーザーの総数とそのエクスペリエンスの要約を提供します。メトリクスごとに、平均値と最大値が表示されます。ツールチップは、これらの値をどのように解釈するか、および潜在的な次のステップを説明します。

ログオンパフォーマンスの内訳

ログオンプロセスは非常にリソースを消費し、インフラストラクチャの混雑の最初の指標の一つです。ただし、たとえば、グループポリシーの構成の変更は、パフォーマンスの大幅な低下を引き起こす可能性もあります。

ダッシュボードは、どこでいつ遅延が発生したか、そして何人のユーザーが影響を受けたかに関するインサイトを提供します。

セッションネットワーク遅延の内訳

ユーザーは、リモーティングプロトコルを使用して仮想デスクトップに接続します。このプロトコルはネットワーク遅延に敏感です。高遅延状態では、ユーザーは仮想デスクトップが遅く感じたり、アプリケーションがぼやけて見えたり歪んで見えたりする可能性があります。追加のトラブルシューティングでは、これらの遅延がネットワークによって引き起こされているのか、仮想化インフラ自体によるものなのかを判断することが重要です。

ダッシュボードは、ネットワーク遅延がどこでいつ発生したか、およびそれによって何人のユーザーが影響を受けたかについてのインサイトを提供します。

セッション応答性の内訳

仮想デスクトップは、アプリケーションがユーザーの入力に応答しなくなると、エンドユーザーには「遅く」感じられ始めます。この認識された遅さは、ネットワーク遅延または仮想マシンが忙しすぎて入力に応答できないことが原因である可能性があり。

セッションの応答性は、常にセッションのネットワーク遅延と比較する必要があります。もしセッションの応答性が高く、遅延が低い場合、それはほぼ間違いなく仮想化インフラストラクチャが忙しすぎているということです。もし応答性が高く、ネットワーク遅延も高い場合、遅さはネットワークが原因である可能性が非常に高いです。

システムの健康状態

システムの健康状態ページは、主な健康指標であるCPU、メモリ、およびストレージに焦点を当てています。仮想マシンでは伝統的なパフォーマンスカウンターは全体像を示しません。なぜなら、彼らは複数のデバイスやユーザー間でハードウェアリソースを共有しているからです。例えば、高いCPU使用率は自動的に悪いパフォーマンスを意味するわけではありません。仮想化インフラストラクチャのコストを見ると、ユーザーエクスペリエンスにおける経験を最小限に抑えながら資源利用を最大化することが望まれます。

概要

システムの健康状態ページの概要には、ユーザー数および仮想マシンの数が表示されます。仮想環境では、ユーザーまたはデバイスが多すぎることが、悪いパフォーマンスの主な原因の一つです。時々、パフォーマンス問題の解決策は単にスケーリングすることにあるため、ユーザー数とパフォーマンス指標を関連付けることは重要です。

CPU/GPU使用率

デバイスのCPUキューの長さは、そのデバイスのプロセッサがすべてのタスクをタイムリーに処理できるかどうかを示します。特に、デスクトップ仮想化の文脈では、複数のユーザーが同じデバイスを共有し、複数のデバイスが同じ物理的なハードウェアリソースを共有しているため、デバイスが過負荷に見えるかどうかをCPU使用率だけでは判断できません。また、仮想化インフラストラクチャのコストを最適化するために、CPU使用率が高く維持されるように設計されています。

コストとパフォーマンスのバランスは、CPUキューの長さを見て監視するのが最適です。すべての仮想マシンの平均CPUキューの長さが2を超えると、基盤となるインフラストラクチャが苦しみ始めたことを検出できます。

GPUは、3Dアクセラレーションに依存するアプリケーションが増えている現代のデスクトップではより重要になっています。残念ながら、多くの仮想デスクトップにはGPUがないか、非力なGPUしかありません。そのような場合、CPUがその役割を担い、CPUにかかる負荷が増加する結果となります。

メモリ使用率

仮想デスクトップインフラストラクチャにおいて、メモリはシステムパフォーマンスに若干異なった影響を与えます。物理デスクトップでは、メモリが多ければ多いほど良いというのが経験則です。仮想デスクトップは、その物理ホストマシンのメモリを共有します。仮想マシンに過剰なメモリを割り当てると、ホストメモリが迅速に消耗し、その結果、物理ホストあたりのユーザー密度が低下します。メモリを少なく割り当てると、ページングやストレージシステムに対する過剰な負荷を引き起こします。

メモリの量はバランスを取るべきです。平均使用可能メモリグラフとメモリスワップレートグラフが適切なバランスを見つけるのに役立ちます。

ストレージ負荷

仮想マシンの仮想ハードドライブは通常、リモートストレージシステムに格納されます。これらのリモートストレージシステムは、仮想デスクトップのワークロードの特性に対応するように設計されていないことがよくあります。このミスマッチと、すべての読み取りと書き込みがストレージネットワーク接続を通過する必要があるために、追加の遅延が生じます。物理デスクトップではこの問題は発生しません。その影響は、SSDからHDDに戻るほど大きいものになり得ます。また、多くのデータセンター技術において、サーバークラスのストレージは通常、ローカルにインストールされたSSDドライブよりもはるかに高価です。

技術スタックの複雑さのため、ストレージがユーザーエクスペリエンスに及ぼす影響は予測が困難です。ディスクキューの長さは、仮想マシンがストレージボトルネックを経験しているかどうかを示します。ディスクの読み取り/書き込み遅延は、どの方向にボトルネックが発生しているかを理解するのに役立ちます。

現在の状態

現在の状態は、仮想デスクトップ環境の現在の使用状況の概要を提供します。ユーザーが何かが通常と違うかどうかを素早く確認できるようにします。たとえば、予想よりも少ないホストがオンラインである、または予想よりも多くのユーザーがいるかもしれません。

ページフィルター

KPIウィジェットと一緒に使用すると、ユーザーは特定のデバイスまたはユーザーを素早く特定して、さらなる調査を行うことができます。

デスクトッププール名

デスクトッププールは、同じ特性（たとえば、技術仕様、インストールされたアプリケーション、および同じターゲットユーザーグループ）を持つ仮想デバイスのグループを表します。時には、デスクトッププールは、専属のサポートスタッフグループを持つ、たとえば、それがミッションクリティカルと見なされる場合などに対する管理境界を表すことさえあります。

デスクトッププールでフィルタリングできることで、組織はどのデスクトッププールが迅速な注意を必要としているかを特定できます。

デスクトッププールタイプ

私たちは主に3つのデスクトッププールタイプを認識しています：プール、個人、および共有。文脈によっては、組織がこれらに対して異なる（混乱を招く）用語を使用することがあります。各タイプについてのいくつかのよく知られた代替用語が以下に示されています：

プールVDI
- 非永続VDI
- シングルセッションVDI
個人VDI
- 永続VDI
- シングルセッションVDI
共有VDI
- サーバーベースコンピューティング
- セッションベースコンピューティング
- ターミナルサーバー
- マルチセッションVDI

注意: これらの用語が完全には一致しないことに注意してください。例えば、いくつかの製品では非永続の個人VDIを定義することが可能ですが、実際にはこれが行われることは稀です。

ハイパーバイザー名

ハイパーバイザープロパティには、仮想デスクトップをサポートするために使用されるハードウェア仮想化製品の名前が含まれています。これらはしばしば混乱を招きますが、違いを理解することが重要です。ほとんどの組織では、デスクトップとハードウェア仮想化ベンダーは異なります。組織は、たとえば、VMware vCenterインフラストラクチャの上にCitrix Virtual Apps and Desktops製品を動かすことがあります。その場合、ハイパーバイザー名プロパティは「vCenter」となります。

このフィールドを使用すると、複数のハードウェア仮想化インフラストラクチャを持つ組織がユーザーエクスペリエンスを比較できます。 (例: オンプレミスのVMware vCenter対クラウドベースのAzure Hyper-V)