MicroStrategy ONE
MicroStrategy 2021 Update 4 以降では、Hadoop Gateway はサポートされなくなりました。
よくある質問
次の表は、ワーキング ノードの数、各ノードの RAM および仮想コア数、および各ワーカー ノードに割り当てられる実行子の数に応じて、推奨設定を計算するために役立ちます。
YARN クライアント モードの推奨パフォーマンス パラメーター | |||||
---|---|---|---|---|---|
ID |
項目 |
パラメーター |
式 |
値 |
説明 |
C1 |
ノード数 |
|
|
2 |
ハードウェアで利用可能な数 |
C2 |
ノードごとの RAM (GB) |
|
|
380 |
ハードウェアで利用可能な数 |
C3 |
ノードごとの VCore 数 |
|
|
40 |
ハードウェアで利用可能な数 |
C4 |
合計 Vcore 数 |
|
C1 × C3 |
80 |
|
S1 |
割り当てられる実行子 |
|
S1 = S2 × C1 |
48 |
|
シーズン2 |
ノードごとの実行子 |
spark.executor.cores |
|
6 |
各ワーカー ノードに割り当てられる実行子の数 |
S3 |
実行子ごとの最大メモリ (GB) |
|
S3 = C2 / S2 |
63 |
|
H1 |
オーバーヘッド (GB) |
|
H1 = S3 × 0.07 |
4 |
OS により使用されるオーバーヘッド メモリ。 デフォルトは0.07 × spark.executor.メモリ |
H2 |
実行子の数 |
spark.executor.instance |
H2 = S1 - 1 |
47 |
クラスターに作成される実行子の総数。 1 つのノードは、AM 用の実行子を占有するる必要があります |
H3 |
実行子ごとのメモリ (GB) |
spark.executor.memory |
H3 = S3 - H1 |
59 |
実行子を多すぎるメモリで実行すると、多くの場合に長いガベージ コレクション遅延が発生します。 単一の実行子については、だいたい 64GB が適切な上限です。 |
H4 |
実行子ごとのコア数 |
|
H4 = (C3 / S2) - 1 |
6 |
コアの 1 つはシステム プロセス用に残します。 |
はい、MicroStrategy Hadoop Gateway はサービスがアイドル状態の間にクラスターのリソースの解放をサポートしています。この動作を可能にするには、MicroStrategy Hadoop Gateway の実行子とコアを動的に割り当てるよう構成する必要があります。MicroStrategy Hadoop Gateway 構成ファイルを変更する<MicroStrategy Hadoop Gateway のインストール パス> /conf/hgos-spark.properties、動的割り当てセクションのコメントを解除します。
はい、MicroStrategy Hadoop GatewayはLive Connect Cubeをサポートしています。MicroStrategy 10.9.有効化するために特別な構成は必要ありません。
MicroStrategy Hadoop Gateway の最小必要条件は、ディスク容量が 256 MB、メモリ容量が 2 GB です。
MicroStrategy Hadoop Gateway は、NameNode や DataNode で追加プロセスを開始しません。MicroStrategy Hadoop Gateway は単に Spark へジョブを送信します。
DataNodeのメモリ使用量は、顧客が属性ファイルに設定した数値によって決まります。 spark.executor.メモリ設定ファイルで指定します (デフォルトでは 1 GB です)。これに対して、NameNode のメモリ使用量は大きな影響を受けません。
MicroStrategy Hadoop Gatewayが起動すると、いくつかのJARファイルがHDFSにアップロードされ、 hdfs://HDFSNameNode:8020/user/${user_name_start_hgos}/.sparkStaging。デフォルトでは、スパークステージング MicroStrategy Hadoop Gateway サービスがシャットダウンされると自動的に削除されます。
JAR ファイルの合計サイズが 256 MB を超えることはありません。
いいえ、MicroStrategy Hadoop Gateway は Kerberos プリンシパル チケットを自動的に更新しません。実行して更新する必要がありますキニットコマンドを実行するか、スケジュールに従ってチケットを更新する cron ジョブを作成します。
テンプレートkinit_cron.sh :
function setup_kerberos() {
echo "klist:"
klist
echo "KRB5CCNAME env:"
export KRB5CCNAME="$HGOS_HOME/conf/krb5cc_hgos"
echo $KRB5CCNAME
echo "kinit"
kinit -kt $keytab_path $principal_name -l 1d5h -r 2d -f
echo "klist"
klist
}
setup_kerberos
cron ジョブをスケジュールするには、次のコマンドを実行します。
root@HOST # crontab -l 0 */2 * * * <path to file>/kinit_cron.sh
はい、MicroStrategy Hadoop Gateway は Apache Sentry による HDFS ACL をサポートしており、特別な構成は必要ありません。MicroStrategy Hadoop Gateway が Apache Sentry とともにどのように動作するかについては、以下のビデオをご覧ください。
いいえ。MicroStrategy Hadoop Gateway は Spark 1.6 上に構築されており、Spark 1.6 環境にのみ展開できます。弊社は、Spark 2 上の MicroStrategy Hadoop Gateway をリリースするため作業中です。
関連トピック
MicroStrategy Hadoop Gateway の概要
MicroStrategy Hadoop Gateway の配置方法
MicroStrategy Hadoop Gateway を開始する方法