Strategy One
ヒントとベスト プラクティス
傾向分析の使用時のベスト プラクティス
-
正確な傾向分析のために十分なデータ量を確保
より正確な傾向分析結果を得るには、データ量を十分に確保することが重要です。傾向分析を行うには、少なくとも 3 つのデータ ポイントが必要です。
-
継続的で高品質の時間ベースのデータを傾向分析に使用
その間Strategyは、傾向分析の前に、欠落しているメトリック データの塗りつぶしなどの簡易なデータ処理を実行します。傾向分析は、継続的な高品質な時間ベースのデータで実施することを推奨します。欠落したメトリック データが多すぎると、傾向分析結果が危うくなる可能性があります。アトリビュートに NULL や NaN (Not-a-Number) 値が含まれる場合、傾向分析に失敗したり、最適な結果が得られない可能性があるので注意が必要です。アルゴリズムは、欠落しているメトリック値を補完するものの、不正確な傾向分析になる可能性があります。
-
統計的有意性
時系列線形傾向分析を行う際には、観測傾向の統計的有意性を考慮することが不可欠です。統計的有意性は、観察傾向が実際の基礎的なパターンによるものか、単にデータのランダムな変動の結果によるものかを客観的に測定する指標です。ツールチップを使用して、R、R 二乗、p 値などの重要なメトックにアクセスします。
傾向分析線グラフ解釈の最適化
傾向分析線グラフのビジュアルを最大限に活用しましょう。
-
情報アイコン: 情報アイコンにマウス カーソルを置くと、基礎となるモデルとそのパラメーターの統計プロパティに関する情報が表示されます。
-
わかりやすくするために展開する: より詳細な情報を表示したり、データ ポイント全体を表示する必要がある場合は、ビジュアリゼーションを展開するか、[コンテナーに合わせる] を [なし] に設定します。これにより、グラフが読みやすくなります。
傾向分析に関するよくある質問
現在のリリースでは、どのような時系列傾向分析手法が使われているのでしょうか。
最新のリリースで使用されている時系列傾向分析手法は、線形回帰と呼ばれるものです。この手法は OTexts Web サイトに記載されています。技術的な詳細は、Python モジュール statsmodels (時系列分析 tsa - statsmodels 0.14.0) を参照してください。
傾向分析を成功させるには、どのようなアトリビュートやメトリックが必要でしょうか。
データの傾向のプロットを成功させるには、以下のいずれかが必要です。
-
Date または datetime 型の単一のアトリビュート + 該当する単一のメトリック (推奨)
-
Int 型の単一アトリビュート + 該当するメトリック (時系列傾向分析で date/datetime アトリビュートを利用できない場合)
欠損データは傾向分析で処理されますか。
はい、アルゴリズムは、対応する時系列データがあれば、メトリックの欠損値を自動的に補完できます。これは計算のためにのみ行われるため、結果のビジュアリゼーションでは欠落データが表示されます。このアルゴリズムでは、方向によって近傍の値を使用する前方補完と後方補完を使用します。主な方法は前方グラブで、前の近傍値を取ります。最初の値が欠落している場合、値を予測するために後方補完が実行されます。
どのような時間ベースのアトリビュート傾向分析レベルがサポートされていますか。
時間ベースのアトリビュート傾向分析は、Date、DateTime、または整数ベースの時間アトリビュートでサポートされています。アトリビュートが上記のいずれかのデータ型である限り、アルゴリズムはすべての時間レベルをサポートします。
