Strategy ONE

通过抓取维基百科页面的公共数据来导入数据

如果您是从Workstation到达的,请参阅 工作站文档创作帮助

您可通过从 Wikipedia 页面提取数据或抓取 Wikipedia 页面来导入数据。系统会导入数据作为 HTML 表。您可使用 Web 抓取确定页面的更改。

提供您要导入的 Wikipedia 页面的 URL。如果您未确定特定的 Wikipedia 页面,或者希望研究主题,可以在 Wikipedia 搜索主题,并从结果选择页面中的 HTML 表来进行导入。

  1. 创建一个空白仪表板或打开一个现有的仪表板。
  2. 选择添加数据 > 新数据,将数据导入新的数据集。

    在数据集面板中,点击 更多的 在数据集名称旁并选择编辑数据集来将数据添加至数据集。预览对话框打开。单击添加新表

    这时“数据源”对话框将打开。

  1. 单击公共数据。这时将打开“公共数据”对话框。
  2. 搜索数据中输入搜索文本可搜索 Wikipedia 数据。

    进入或者天气预报搜索包含州列表或天气预报信息的 HTML 表列表。

    输入 URL 搜索数据从相应的维基百科页面导入数据。

  3. 单击搜索。相应 Wikipedia 页面中的 HTML 表将在列表中出现。
  4. 悬停在列中的链接上可预览对应的表。
  5. 单击列中的链接可在浏览器中查看对应的表。
  6. 选中对应您要导入的表的复选框。
  7. 选中列标题中的复选框可选择所有表进行导入。

  1. 如果要添加新数据集,并希望预览、修改和指定导入选项,请单击准备数据
  2. 如果要编辑现有数据集,单击添加

  3. 如果要添加新数据集,单击完成
  4. 如果要编辑现有数据集,单击更新数据集

    数据将导入新数据集中或更新现有数据集。

相关主题

导入数据

从文件导入数据的最佳实践方法

创建仪表板