MicroStrategy ONE
時系列予測
効果的な予測の質問のヒント
-
具体的に: 「How will our sales perform? (今後の売上はどうなりますか?)」といった大雑把な質問ではなく、具体的な期間や指標について質問してください。たとえば、「What's the projected sales for the next quarter? (次の四半期の予測売上高は?)」などです。
-
自然言語を使用: [自動] は喋り言葉を理解します。同僚に質問するように、自然なやり方で質問を組み立ててください。
-
関連するアトリビュートを含める: [自動] が文脈を理解できるように、質問に必要なアトリビュートとメトリックを含めてください。
-
オートコンプリート機能を活用する: [自動] を使用して最適な予測を行うには、オートコンプリートの候補からメトリックとアトリビュートを選択することを推奨します。これにより、高精度の予測を [自動] が正確に理解できるようになります。
-
曖昧さを避ける: 質問は明確かつ一義的なものにしましょう。複雑で入り組んだクエリは不正確な回答につながる可能性があります。
-
その間Strategy自動を使用して、低いレベルのデータに対して高いレベルの時間ユニットを予測できるようにします (毎月のアトリビュートに基づいて来年のコスト予測など)。重要な考慮事項があります。
-
100 個の予測ポイントに対する制限: 下位レベルのデータに対して上位レベルの時間単位の予測を要求する場合、100 ポイントの予測限界に注意してください。たとえば、ダッシュボード データが毎日レベルであるときに、来年の予測を要求した場合、予測には 100 ポイントの制限を超えて、1 年分の毎日のデータ ポイントが含まれます。
-
互換性のないレベルに対する予測の失敗: 上位レベルのデータに対して下位レベルのデータの予測を依頼すると、予測が失敗します。たとえば、ダッシュボード データが毎月レベルの場合、次の週または翌日の値の予測を要求された場合、データ レベルの不一致により実現できません。
予測分析機能の使用時のベスト プラクティス
-
正確な予測のために十分なデータ量を確保
より正確な予測結果を得るには、データ量を十分に確保することが重要です。本番環境ではStrategyデータの季節性を自動的に検出します。最適な予測結果を得るには、予測しようとするデータに少なくとも 2 シーズン分の過去データを用意しておくことを推奨します。
-
高品質な継続時間ベースのデータを予測に使用
その間Strategy重複データの削除や欠落しているメトリック データの埋め込みなど、予測の前に簡単なデータ処理を実行します。予測は、継続的な高品質な時間ベースのデータで実行することを推奨します。欠落したメトリック データが多すぎると、予測結果が危うくなる可能性があります。アトリビュートに NULL や NaN (Not-a-Number) 値が含まれる場合、予測に失敗したり、最適な結果が得られない可能性があるので注意が必要です。
予測線グラフ解釈の最適化
予測線グラフのビジュアリゼーションを最大限に活用しましょう。
-
マウス カーソルを置いてインサイトを表示: 予測線グラフでデータ ポイントにマウス カーソルを置くと、ツールチップが表示されます。これらのツールチップでは、予測値、上限値、下限値に関する詳細な情報を参照できます。
-
情報アイコン: 情報アイコンにマウス カーソルを置くと、基礎となるモデルとそのパラメーターに関する情報が表示されます。
-
わかりやすくするために展開する: より詳細な情報を表示したり、データ ポイント全体を表示する必要がある場合は、ビジュアリゼーションを展開します。これにより、グラフが読みやすくなります。
トラブルシューティング
-
アトリビュートおよびメトリック要件正確な予測のためには、質問に必ず 1 つのアトリビュートと 1 つのメトリックを使用して、それぞれ X 軸および Y 軸に配置します。この要件を満たしていないクエリは最適な予測をもたらさない可能性があります。
-
アトリビュートで分割従業員ごとに12 か月先の売上を予測する場合など、複数のエレメントの予測を表すアトリビュートによる区切りを含める場合、アトリビュート内のエレメント (この場合は従業員) の数を限定して、複数のエレメントの可読性を高めます。分析結果を表示できます
-
アトリビュート フォームを考慮する: 予測に使用するアトリビュートは、date、datetime、integer データ型を持つフォームを少なくとも 1 つ含む必要があります。タイムスタンプ データはサポートされていません。
-
タイムゾーン ベースのアトリビュート: タイムゾーン ベースのスマート アトリビュートによる予測は現在サポートされていません。
-
連結とグループ化: 連結またはグループ化されたアトリビュート エレメントに対する予測は現時点ではできません。
-
詳細レベル: 予測は、日次レベル未満のデータ (1 時間、1 分、1 秒間隔など) では利用できません。
-
整数ベースの予測クエリで整数ベースの時刻表現を使用する場合 (2021 年 1 月には 202101 など) に注意してください。Strategyは、これらの時刻表現を日付/時刻形式に自動的に変換しないため、202113 や 202114 などの予期しない結果を導きます。
-
最大予測ポイント: 予測可能な将来のデータ ポイントは最大 100 ポイントです。この制約により、効率的で正確な予測が保証されます。
-
ハインドキャスティングと調整: 現在、既存のデータに対するハインドキャスティングはサポートされていません。さらに、現在のリリースでは、アルゴリズムのハイパーパラメーターは [自動] でのみ調整できます。たとえば、[自動] に特定の信頼レベルで予測させることで信頼区間を調整できますが、ダッシュボード作成インターフェイスではまだ使用できません。
よくある質問
現在のリリースでは、どのような時系列予測手法が使われているのでしょうか。
現在のリリースで使用されている時系列予測手法は、指数平滑化と呼ばれるものです。この手法は、OTexts サイトで説明されているさまざまな非減衰モデルをサポートしています。技術的な詳細は、Python モジュール statsmodels (statsmodels.tsa.exponential_smoothing.ets.ETSModel - statsmodels 0.14.0) を参照してください。
予測に使われるデフォルトのハイパーパラメーターは何ですか。
ユーザーが指定しない場合、以下のデフォルトのハイパーパラメーターが使用されます。
-
h 値: 5 データ ポイント前に
-
季節モデル: 加法 ([自動] で調整可能)
-
傾向モデル: 加法 ([自動] で調整可能)
-
季節性の長さ: 自動 ([自動] で調整可能)
-
信頼区間: 95% ([自動] で調整可能)
季節モデルおよび傾向モデルの値は、[自動] で [なし]、[乗法]、[加法] に設定できます。乗法傾向モデルで次の 3 か月の売上を予測できます。
予測のためにハイパーパラメーターを調整できますか。
はい、[自動] からハイパーパラメーターを予測用に調整できます。これらのハイパーパラメーターは、ダッシュボード作成の [書式] パネルでは表示されませんが、[自動] を使用して微調整できます。
予測を成功させるには、どのようなアトリビュートやメトリックが必要でしょうか。
データの予測を成功させるには、以下が必要です。
-
Date または datetime 型の単一アトリビュート、該当する単一のメトリック (推奨)
-
Integer 型の単一アトリビュートと、該当するメトリック (時系列予測のために date/datetime アトリビュートが利用できない場合)
欠損データは予測で処理されますか。
はい、欠損データがデータ全体の 90% 以下であれば、アルゴリズムは欠損データを自動的に補完できます。
どのような時間ベースのアトリビュート予測レベルがサポートされていますか。
時間ベースのアトリビュート予測は、日次、週次、月次、四半期、年次データ レベルでサポートされています。
整数予測の仕組みは?
整数予測では、アルゴリズムはシーケンス内の次の整数を生成します。時間を表すのに整数 (202101、202102 など) が使用されている場合、それは日付/時刻形式に変換されず、予測は連続する整数を将来ポイントとして追加します。
