简介
StreamSet Data Collector(以下简称为StreamSet, 官网) 是一个轻量级,功能强大的设计和执行引擎,使用其可以完成路由和处理数据流中的数据。其采用管道任务的概念组织和定义一个个要完成的数据流处理任务,管道由表示管道的起源、目标以及您要执行的任何其他处理组成。
StreamSet在数据到达源时处理数据,并在不需要时静默等待。您可以查看有关数据的实时统计信息,在数据通过管道时检查数据,或仔细查看数据快照。
操作界面
| 区/图标 | 名称 | 描述 |
|---|---|---|
| 1 | 管道画布 | Canvas用于配置,预览或监视管道。 |
| 2 | 属性面板/预览面板/监视器面板 | 配置管道时,“属性”面板将显示管道或选定阶段的属性。您可以调整面板的大小,最小化和最大化。预览数据时,“预览”面板显示进入和退出所选阶段或阶段组的数据。它还可以显示舞台属性和预览配置。监视正在运行的管道时,“监视器”面板会显示实时指标和统计信息。 |
| 主页图标 | 显示包含管道列表及其状态的主页,允许您执行管道维护并导航到各个管道。 | |
| 包管理器图标 | 包管理器图标 显示程序包管理器,允许您安装安装其他组件库。 | |
| 通知图标 | 显示通知。 | |
| 管理图标 | 提供对StreamSet配置属性,目录和日志的访问。还允许您重启、关闭StreamSet。 | |
| 用户图标 | 显示活动用户和分配给用户的角色。还允许您注销StreamSet。 | |
| 帮助图标 | 根据面板中的信息提供上下文相关帮助。允许您配置显示设置并指定是使用本地还是托管版本的帮助。 | |
| 链接到管道列表 | 链接到主页上的管道列表。用于查看可用管道列表,执行管道维护,如启动或共享管道,以及导航到各个管道。 | |
| 更多图标 | 为管道提供其他操作。 |
预览功能(类似调试输出)
1.数据预览概述
您可以预览数据以帮助构建或微调管道。您还可以在开发时使用数据预览。 您可以将数据预览与完整或不完整的管道和片段一起使用。您可以从多个选项中进行选择,以提供预览的源数据。预览数据时,源数据将通过管道或片段,允许您查看数据在每个组件的传递和更改方式。您可以编辑阶段属性并再次运行预览,以查看更改如何影响数据。您还可以编辑预览数据以测试和调整管道逻辑。 您可以一次预览一个组件的数据,也可以预览一组组件的数据。您还可以在列表或表视图中查看数据,并刷新预览数据。
2.数据预览可用性
您可以预览完整和不完整的管道。数据预览可用时,“数据预览”图标将变为活动状态。 您可以在以下条件下预览数据:
- 管道中的所有组件都是连接的
- 定义了所有必需的属性
提示:舞台配置无需准确或完整即可预览数据。连接所有阶段后,可以通过输入所需属性的任何有效值来启用数据预览。
3.数据预览的源数据
可以使用以下类型的数据进行数据预览:
- 来自源组件的数据。
- 来自测试源的数据 - 使用来自管道属性中配置的测试源的数据。
- 从一个数据快照 -从同一管道或其s他管道使用快照数据。仅适用于管道。
4.写入目的地
作为开发工具,默认情况下,数据预览不会将数据写入目标。 如果您愿意,可以配置预览以将数据写入目标。我们建议不要将预览数据写入生产目的地。
5.笔记
预览数据时请记住以下注意事项:
- 日期,日期时间和时间数据 - 数据预览使用浏览器区域设置的默认格式显示日期,日期时间和时间数据。例如,如果浏览器使用en_US语言环境,则预览使用以下格式显示日期:MMM d,yh:mm:ss a。
- Oracle CDC客户端管道 - 在预览使用Oracle CDC客户端源的管道时,数据预览可能会在连接到源系统之前超时。发生这种情况时,请尝试将超时增加到120,000毫秒以允许原始时间连接。
- 整个文件数据格式 - 预览处理整个文件数据的管道时,数据预览仅显示一条记录。
6.Data Collector UI - 预览模式
可以使用StreamSet查看数据如何通过管道传递。
下图显示了预览模式下的StreamSet: