Strategy ONE
通过抓取维基百科页面的公共数据来导入数据
如果您是从Workstation到达的,请参阅 工作站文档创作帮助。
您可通过从 Wikipedia 页面提取数据或抓取 Wikipedia 页面来导入数据。系统会导入数据作为 HTML 表。您可使用 Web 抓取确定页面的更改。
提供您要导入的 Wikipedia 页面的 URL。如果您未确定特定的 Wikipedia 页面,或者希望研究主题,可以在 Wikipedia 搜索主题,并从结果选择页面中的 HTML 表来进行导入。
- 创建一个空白仪表板或打开一个现有的仪表板。
-
选择添加数据
> 新数据,将数据导入新的数据集。或
在数据集面板中,点击 更多的
在数据集名称旁并选择编辑数据集来将数据添加至数据集。预览对话框打开。单击添加新表。这时“数据源”对话框将打开。
- 单击公共数据。这时将打开“公共数据”对话框。
-
在搜索数据中输入搜索文本可搜索 Wikipedia 数据。
进入州或者天气预报搜索包含州列表或天气预报信息的 HTML 表列表。
或
输入 URL 搜索数据从相应的维基百科页面导入数据。
- 单击搜索。相应 Wikipedia 页面中的 HTML 表将在列表中出现。
- 悬停在源列中的链接上可预览对应的表。
- 单击源列中的链接可在浏览器中查看对应的表。
- 选中对应您要导入的表的复选框。
或
选中列标题中的复选框可选择所有表进行导入。
- 如果要添加新数据集,并希望预览、修改和指定导入选项,请单击准备数据。
- 如果要添加新数据集,单击完成。
或
如果要编辑现有数据集,单击添加。
或
如果要编辑现有数据集,单击更新数据集。
数据将导入新数据集中或更新现有数据集。
