[大数据]有界数据和无界数据在大数据领域，有界数据和无界数据是两种重要的数据分类，主要根据数据的生成方式、时间维度和处理

在大数据领域，有界数据和无界数据是两种重要的数据分类，主要根据数据的生成方式、时间维度和处理需求进行区分：

1. 有界数据（Bounded Data）

定义：
有界数据是有限、完整且静态的数据集合，其数据规模在生成时已确定，不会随时间增长。这类数据通常具有明确的起点和终点，且数据总量在处理前是已知的。
特点：
- 有限性：数据量固定，不会新增或扩展（例如一个 CSV 文件、数据库表、日志文件归档）。
- 一次性处理：适合批量处理（批处理），处理完成后任务终止。
- 离线分析：常用于历史数据分析、报表生成等场景。
例子：
- 过去一年的销售记录；
- 某次实验的完整数据集；
- 数据库中的用户信息表。
处理技术：
Hadoop MapReduce、Spark Batch(spark框架中的批处理)、传统数据库查询等。

定义：
无界数据是无限,持续生成且动态的数据流streaming，没有明确的终点。这类数据通常以事件（Event）的形式实时产生，理论上可以无限延伸。
特点：
- 无限性：数据持续生成，总量未知（例如传感器数据、社交媒体动态、交易流）。
- 实时性：需要流式处理（流处理），持续消费并处理数据。
- 时间敏感：通常需要低延迟处理（如实时监控、告警）。
例子：
- 股票市场的实时交易数据；
- IoT 设备的传感器数据流；
- 用户点击流（Clickstream）或视频直播弹幕。
处理技术：
Apache Kafka（消息队列）、Apache Flink、Spark Streaming、Kafka Streams 等。