Strategy ONE
时间序列预测
有效预测问题的技巧
-
具体一点不要问“我们的销售表现如何?”之类的宽泛的问题,而要询问具体的时间范围或指标。例如,“下一季度的预计销售额是多少?”。
-
使用自然语言自动理解对话语言。以自然的方式提出问题,就像在询问同事一样。
-
包括相关属性在您的问题中包含必要的属性和指标,以确保 Auto 理解上下文。
-
利用自动完成功能为了使用自动功能进行最佳预测,建议从自动完成建议中选择指标和属性。这确保 Auto 能够准确理解并进行准确的预测。
-
避免歧义保持你的问题清晰、明确。复杂或费解的查询可能会导致不准确的答复。
-
尽管Strategy使用自动功能可以根据较低级别的数据预测较高级别的时间单位(例如,根据每月属性预测明年的成本),有以下几个关键注意事项:
-
100 个预测点的限制当请求针对较低级别数据的较高级别时间单位的预测时,请注意 100 点的预测限制。例如,如果您的仪表板数据是每日级别的,并且您请求对下一年的预测,则预测将包含 1 年的每日数据点,超过 100 点的限制。
-
不兼容水平的预测失败要求根据较高级别的数据进行较低级别的数据的预测会导致预测失败。例如,如果您的仪表板数据是月度级别的,而您要求预测下周或第二天的值,则由于数据级别差异,这是不可行的。
使用预测分析功能的最佳实践
-
确保足够的数据量以实现准确预测
为了获得更准确的预测结果,确保数据量足够大非常重要。在幕后,Strategy自动检测数据的季节性。为了获得最佳预测结果,我们建议您要预测的数据至少应包含两个完整季节的历史数据。
-
使用高质量连续时间数据进行预测
尽管Strategy在预测之前进行轻量级的数据处理,例如消除重复的数据和填充一些缺失的指标数据,建议对连续的、高质量的、基于时间的数据进行预测。如果缺少大量指标数据,预测结果可能会受到影响。值得注意的是,如果属性包含 NULL 或 NaN(非数字)值,预测可能会失败或产生次优结果。
优化预测折线图解释
充分利用您的预测折线图可视化!
-
悬停获取见解将光标悬停在预测折线图上的数据点上以显示工具提示。这些工具提示提供有关预测值以及上限和下限的详细信息。
-
信息图标将鼠标悬停在信息图标上即可查看有关底层模型及其参数的信息。
-
扩大清晰度如果您需要更详细的信息和显示整个数据点集的能力,请扩展可视化。这增强了图表的可读性。
疑难解答
-
属性和指标要求为了做出准确的预测,请确保在问题中使用一个属性和一个指标分别放置在 X 轴和 Y 轴上。不满足此要求的查询可能无法产生最佳预测。
-
按属性细分当您按属性细分以表示多个元素的预测时(例如,当您预测每个员工未来 12 个月的销售收入时),请确保属性中的元素(在本例中为员工)数量有限,以增强分析结果的可读性。
-
考虑属性形式用于预测的属性应至少具有一种日期、日期时间或整数类型的形式。不支持时间戳数据。
-
基于时区的属性目前不支持使用基于时区的智能属性进行预测。
-
合并和分组目前无法根据合并或分组的实体元素进行预测。
-
粒度级别无法对少于每日级别数据(例如每小时、分钟或秒间隔)进行预测。
-
基于整数的预测在查询中使用基于整数的时间表示形式时要小心(例如 202101 表示 2021 年 1 月)。Strategy不会自动将这些时间表示转换为日期/时间格式,从而导致意外结果,例如 202113 或 202114。
-
最大预报点数您最多可以预测 100 个未来数据点。此限制有助于确保效率和准确的预测。
-
后报和调整目前,不支持根据现有数据进行后验预测。此外,在当前版本中,调整算法超参数只能通过自动完成。例如,您可以通过要求 Auto 以特定的置信度进行预测来调整置信区间,但这在仪表板创作界面中尚不可用。
常见问题解答
当前版本使用什么时间序列预测方法?
我们当前版本中使用的时间序列预测方法称为指数平滑法。该方法支持在文本地点。您可以参考 statsmodel Python 模块( statsmodels.tsa.exponential_smoothing.ets.ETSModel - statsmodels 0.14.0)了解更多技术细节。
用于预测的默认超参数是什么?
如果用户未指定,则使用以下默认超参数:
-
h 值未来五个数据点
-
季节模型添加剂(可通过自动调节)
-
趋势模型添加剂(可通过自动调节)
-
季节性长度自动(可通过自动调整)
-
置信区间 95%(可通过自动调整)
季节和趋势模型的值可以通过自动设置为无、乘法或加法。您可以使用乘法趋势模型预测未来三个月的销售额。
可以调整超参数进行预测吗?
是的,您可以通过自动调整预测的超参数。虽然这些超参数未在仪表板创作中的“格式”面板中显示,但您可以使用自动功能对其进行微调。
成功的预测需要哪些类型的属性和指标?
为了成功预测数据,您需要:
-
日期或日期时间类型的单个属性,加上单个感兴趣的指标(推荐)
-
整数类型的单个属性,加上感兴趣的指标(当日期/日期时间属性不适用于时间序列预测时)
预测中是否处理缺失数据?
是的,如果缺失数据小于或等于整体数据的 90%,算法可以自动填充缺失数据。
支持哪些基于时间的属性预测级别?
以下级别的数据支持基于时间的属性预测:每日、每周、每月、每季度和每年。
整数预测如何工作?
对于整数预测,算法会生成序列中的下一个整数。如果使用整数表示时间(例如 202101、202102),则不会将其转换为日期/时间格式,并且预测会添加连续的整数作为未来点。
