Strategy ONE

使用 PAConsumerConfig.yaml 文件配置 Platform Analytics

Platform Analytics 将遥测存储(以前称为 Platform Analytics Consumer)和身份遥测生产者(以前称为 Usher Metadata Producer)的所有配置参数存储在 PAConsumerConfig.yaml 文件。有关 Platform Analytics 体系结构参考的详细信息,请参阅 Platform Analytics 体系结构和服务

每个版本都会使用新配置参数或 Telemetry Server 主题更新 YAML 文件结构。升级后会保留所有可修改的值,因此不会丢失任何自定义参数。但是,升级后,所有新添加的字段都将设置为默认值。

YAML 文件位于使用 Strategy Installation Wizard 安装了 Platform Analytics 的计算机上。

默认路径为:

  • Linux: /opt/MicroStrategy/PlatformAnalytics/Conf
  • Windows: C:\Program Files (x86)\MicroStrategy\Platform Analytics\conf

如何解读 YAML 文件

在 YAML 文件中,缩进用于表示嵌套值。例如:

复制
parentConfig:
  numberOfConsumers: 1
  pollTimeoutMillisec: 1000
  kafkaProperties:
    bootstrap.servers: "10.27.17.167:9092"

YAML 使用 key: value 符号。冒号后需要使用一个空格。

要了解有关 YAML 功能的更多信息,请参阅在 Y 分钟内掌握 YAML

PAConsumerConfig.yaml 规范

选择 PAConsumerConfig 文件由以下部分组成:

  • paParentConfig:遥测服务器 (Kafka) 和遥测管理器 (Zookeeper) 的通用配置 TopicsGroups
  • paEtlConfig:配置遥测存储(平台分析消费者)以执行数据处理。
  • usherServerConfig:用于连接到 Identity Server 数据库以收集 Identity 元数据信息的连接配置参数。
  • paTopicsGroupList:遥测服务器列表 TopicsGroups 及其配置。

每个 topicsGroup 继承自 defaultConfigparentConfig。每个 topicsGroup 还可以覆盖其继承的特定设置。

paParentConfig 设置

选择 paParentConfig 设置是遥测服务器(Kafka)和遥测管理器(Zookeeper)的通用配置 TopicsGroups。例如:

复制
---
paParentConfig:
  consumerGroupSuffix: ~
  overrideKafkaOffsets: true
  kafkaTopicNumberOfReplicas: 1
  kafkaTopicsDoNotCreateList:
  zooKeeperConnection: 127.0.0.1:2181
  ignoreUsherTopics: false
  kafkaConsumerProperties:
    bootstrap.servers: 127.0.0.1:9092

以下是为 paParentConfigtopicsGroup 配置,以及 defaultConfig 每个设置的值。

名称 默认 描述
consumerGroupSuffix ~ (空值)

此字段用于在生产环境中测试或恢复数据。附于 topicsGroup name 构成了实际的消费者组 ID(也称为 group.id)。

此字段的关键用途是更改属性以生成新的消费者组 ID。生成新的消费者组 ID 会导致重新处理 Telemetry Server 主题中剩余的所有记录。

例如,为了重新填充 Platform Analytics Warehouse (PA WH),您可以在使用 PA 自定义安装程序重新初始化 PA WH 后将此属性修改为唯一字符串。这个唯一字符串应该是以前在相同环境中未使用过的字符串。推荐策略是在其中包含时间戳。

例如

重新处理不正确的日志_johndoe_1330111282018

overrideKafkaOffsets true

如果 true,使用数据库中的主题分区偏移值在启动时设置给定消费者组的 Kafka 偏移量。

如果 false,使用存储在 Kafka 中的偏移值。

建议将配置保持为默认值。

kafkaTopicNumberOfReplicas 1 或遥测服务器数量

这是为所有 Telemetry Server 主题配置的副本系数。它是在安装 Platform Analytics 期间设置的,具体取决于安装的是 Telemetry Server 群集还是单个节点。

此值应与群集的 Telemetry Server 节点数相匹配,以便利用 Kafka 的容错能力。

kafkaTopicsDoNotCreateList 空字符串 主题列表如下 topicsGroupList 遥测存储(平台分析消费者)在启动时不会创建它。不应修改此字段。
zooKeeperConnection 127.0.0.1:2181 或预先配置的 Zookeeper 集群仲裁

逗号分隔的 Telemetry Manager (Zookeeper) 群集配置。

例如:FQDN1:PORT1, FQDN2:PORT2, FQDN3:PORT3

默认端口为 2181,在 Platform Analytics 安装期间设置。

ignoreUsherTopics false

此值在安装 Platform Analytics 期间设置,具体取决于是否已安装 Identity Server。

false 是否已安装并配置 Identity Server;

true 如果未安装 Identity Server。

bootstrap.servers 127.0.0.1:9092 或预先配置的 Kafka 代理仲裁

逗号分隔的 Telemetry Server (Kafka) 群集配置(例如 FQDN1:PORT1,FQDN2:PORT2,FQDN3:PORT3)。

默认端口为 9092,在安装 Platform Analytics 期间设置。

paEtlConfig 设置

复制
paEtlConfig:
    redisConnection:
        redisServer: 127.0.0.1
        redisPort: 6379
        redisPassword: ~
    dailyETLConfiguration:
        scheduleHour: 5
        scheduleMin: 2
    viewCutoffRangeInDays: 14
    currentFactDataKeepDays: 180
    beaconDedup: true
    locationDedup: true 
    whDbType: postgresql
    warehouseDbConnection:
        whHost: 127.0.0.1
        whUser: root
        whPasswd: r9oJP5d6
        whPort: 3306
        whDb: platform_analytics_wh
    pgWarehouseDbConnection:
        pgWhHost: localhost
        pgWhUser: mstr_pa
        pgWhPasswd: Ugjx+93ROzBsA2gwBOWT5Qlu6hbfg5frTBmLmg==,970sBwUbi4EowB/4
        pgWhPort: 5432
        pgWhDb: platform_analytics_wh
        pgWhSSLcert: ~
        pgWhSSLkey: ~
        pgWhSSLrootcert: ~
        pgWhSSLmode: ~
    geoLocationTopic: Mstr.PlatformAnalytics.Geolocation
    kafkaHealthCheckTopic: mstr-pa-health-check
    usherProducerKeys:
        - SourceProvisionBadgePhone
        - SourceProvisionOrganization
        - SourceEnvironmentVariables
        - SourceOrganization
        - SourceOrganizationBadge
        - SourceBadgeAdminRole
        - SourceBadge
        - SourceGateway
        - SourceGatewayHierarchyAndDef
        - SourceBeacon
        - SourceDevice
    googleAPIConfig:
        googleApiKey: ~
        googleApiClientId: ~ 
        businessQuota: 100000
        freeQuota: 2500
        sleepTimeQuery: 5
    usherLookupTopic: Mstr.PlatformAnalytics.UsherLookup

以下是定义的设置 paEtlConfig,以及 defaultConfig 每个设置的值。

名称 默认 描述
redisServer 127.0.0.1

Telemetry Cache(Redis 服务器)的完全限定域名 (FQDN) 或 IP 地址。

为获得最佳性能,请使用本地 Telemetry Cache 实例。

redisPort 6379

Telemetry Cache(Redis 服务器)的端口。

默认值为 6379,在安装期间设置。

redisPassword 空字符串

如果启用了密码验证,则为连接到 Telemetry Cache(Redis 服务器)的密码。

默认情况下,系统不会启用密码身份验证。

scheduleHour 5

平台分析每日 ETL 启动的指定时间。默认值 5 表示 UTC 时间 05:00。

scheduleMin 2 Platform Analytics 每日 ETL 运行的计划时间的分钟数。默认值 2 代表比预定时间晚了 2 分钟。
viewCutoffRangeInDays 14

重新发布期间 Platform Analytics 多维数据集中的视图表将在内存中保留数据的天数。

例如,默认值 14 天表示视图表和 Platform Analytics 多维数据集将以滚动方式包含之前 14 天的数据。Platform Analytics 项目架构返回的数据永远不受限制。

有关详情,请参阅修改 Platform Analytics 多维数据集内存中返回的数据量

currentFactDataKeepDays 180

平台分析存储库中当前事实表将保存数据的天数。

对于PostgreSQL仓库,我们为一些数据量可能非常大的事实表创建历史表。例如access_transactions、fact_sql_stats。历史表的名称以前缀“historical_”开头。

例如,180 天的默认值意味着当前事实表将包含过去 180 天的数据。所有其他数据将存储在历史事实表中。

beaconDedup true

用于确定 MicroStrategy Badge 信标跟踪数据的重复数据删除功能是否已启用的标志。

如果 true,如果满足所有条件,Telemetry Store ETL 将删除任何重复的信标操作:

相同用户登录

与相同信标交互

180秒内

启用此标志有助于保留最小有效数据点以供分析,而无需收集过多数据。

locationDedup true

用于确定 MicroStrategy Badge 位置跟踪数据的重复数据删除功能是否已启用的标志。

如果 true,如果满足所有条件,Telemetry Store ETL 将删除任何重复的位置跟踪操作:

相同用户登录

在 60 秒内

启用此标志有助于保留最小有效数据点以供分析,而无需收集过多数据。

whDbType

PostgreSQL

用作平台分析存储库的默认数据库类型。从 MicroStrategy 2020 开始,默认数据库是“postgresql”,但它也可以支持数据库类型“mysql”。

whHost 通过安装预先配置 其中的 Telemetry Store 将存储用于报告的数据的 Platform Analytics 存储库的完全限定域名 (FQDN) 或 IP 地址。
whUser 通过安装预先配置 用于连接到其中的 Telemetry Store 将存储用于报告的数据的 Platform Analytics 存储库的用户名,其中的 Telemetry Store 将存储用于报告的数据。
whPasswd 通过安装预先配置 用于连接到其中的 Telemetry Store 将存储用于报告的数据的 Platform Analytics 存储库的用户密码。
whPort 3306

要连接的 MySQL 数据库服务器的端口。

Platform Analytics 存储库(MySQL Server 数据库)的端口。

默认值为 3306,在安装时设置。

whDb platform_analytics_wh

Platform Analytics 仓库的数据库。

此项不应更改。

pgWhHost

localhost

用于平台分析存储库的 PostgreSQL 数据库的完全限定域名 (FQDN) 或 IP。由于我们将在安装 Platform Analytics 的计算机上安装 PostgreSQL 服务器,因此默认值为“localhost”

pgWhUser

主键

用于连接到平台分析存储库的 PostgreSQL 数据库用户名,遥测存储将在其中存储报告数据。

pgWhPasswd

通过安装预先配置

用于连接到平台分析存储库的用户的 PostgreSQL 数据库密码,遥测存储将在其中存储报告数据。此密码在安装过程中加密。您可以从文件“Default_Accounts.txt”中找到未加密的密码,该文件位于(Windows:C:\Program Files (x86)\Common Files\MicroStrategy\ 或 Linux:./install/Repository/)

pgWhPort

5432

要连接的 PostgreSQL 数据库服务器的端口。

平台分析存储库(PostgreSQL 服务器数据库)的端口。

默认值为 5432,在安装时设置。

pgWhDb

platform_analytics_wh

Platform Analytics 仓库的数据库。

此项不应更改。

pgWhSSLcert 空字符串 供将来支持 SSL 身份验证时使用。
pgWhSSLkey 空字符串 供将来支持 SSL 身份验证时使用。
pgWhSSLrootcert 空字符串 供将来支持 SSL 身份验证时使用。
pgWhSSLmode 空字符串 供将来支持 SSL 身份验证时使用。
geoLocationTopic Mstr.PlatformAnalytics.Geolocation

Telemetry Server (Kafka) 主题,用于 MicroStrategy Badge 移动应用的位置数据地理编码处理。

此项不应更改。

kafkaHealthCheckTopic mstr-pa-health-check

用于运行状况检查的 Telemetry Server (Kafka) 主题。

此项不应更改。

usherProducerKeys

SourceProvisionBadgePhone

SourceProvisionOrganization

SourceEnvironmentVariables

SourceOrganization

SourceOrganizationBadge

SourceBadgeAdminRole

SourceBadge

SourceGateway

SourceGatewayHierarchyAndDef

SourceBeacon

SourceDevice

此项不应更改。
logging True 用于确定是否已启用 Google 地理编码 API 使用情况日志记录的标志。
alerting True 用于确定是否已启用 Google 地理编码 API 使用情况日志记录的标志。
googleApiKey 空字符串

允许使用业务配额进行 Google 地理编码 API 调用的业务关键字。

googleApiClientId 空字符串 允许使用业务配额进行 Google 地理编码 API 调用的业务关键字。
businessQuota 100000 无需任何开发人员或业务关键字即可进行 Google 地理编码 API 调用的每日配额。
callLimit 1000 仅供内部使用。
sleepTimeQuery 5

为位置数据处理而多次调用 Google 地理编码 API 之间暂停的秒数。

此项不应更改。

usherLookupTopic Mstr.PlatformAnalytics.UsherLookup

用于 Usher 服务器元数据信息遥测的 Kafka 主题。

此项不应更改。

usherServerConfig 设置

复制
usherServerConfig:
  usherServerDbConnection:
    usherServerMysqlAesKeyPath:
    usherServerUrl:
    usherServerUser:
    usherServerPassword:

以下是定义的设置 usherServerConfig,以及 defaultConfig 每个设置的值。

名称 默认 描述
usherServerMysqlAesKeyPath 通过安装预先配置 用于解密密码的 AES 密钥文件路径
usherServerUrl 通过安装预先配置 用于连接到 Usher Server 元信息数据库的 JDBC 连接 URL
usherServerUser 通过安装预先配置 用于连接到 Usher Server 元信息数据库的用户名
usherServerPassword 通过安装预先配置 用于连接到 Usher Server 元信息数据库的密码

paTopicsGroupList 设置

以下设置仅在 topicsGroup 水平,而不是 ParentConfig

复制
paTopicsGroupList:
  -
    name: UsherInboxMessage
    numberOfConsumers: 1
    usherFlag: true
    topics:
      - Mstr.IdentityServer.ActionLog
  -
    name: UsherInboxResponse
    numberOfConsumers: 1
    usherFlag: true
    topics:
      - Mstr.IdentityServer.ActionLog
  -
    name: Geolocation
    numberOfConsumers: 1
    usherFlag: true
    topics:
      - Mstr.PlatformAnalytics.Geolocation
  -
    name: UsherLog
    numberOfConsumers: 2
    usherFlag: true
    topics:
      - Mstr.IdentityServer.ActionLog
      - Mstr.IdentityServer.LocationLog

以下是定义的设置 paTopicsGroupList.

名称 描述
name 名称 topicsGroup。必须是唯一的 topicsGroup 名字。
numberOfConsumers 分配给该消费者进程的数量 topicsGroup 组建消费者组时
usherFlag true 如果这个 topicGroup 与 Usher 有关。
topics 消费者在 Kafka 中的主题列表 topicsGroup 订阅。