#31 流式计算引擎、数字广告术语和指标、零信任身份、时序问题

2024-02-19 112 阅读3分钟

流式计算引擎

流式计算引擎是一种用于处理和分析实时数据流的计算模型和软件框架。它能够对来自不同数据源的数据进行实时采集、处理和分析，从而快速获取有价值的信息和洞察力。流式计算引擎广泛应用于金融、物联网、社交媒体、实时监控等领域。

流式计算引擎的核心特点包括：实时性、高吞吐量、分布式计算、易于扩展、容错性。

目前市面上常见的流式计算引擎包括：Apache Storm, Apache Kafka, Apache Flink, Apache Spark Streaming, Amazon Kinesis, Google Cloud Dataflow。

典型的应用示例：

实时股票交易数据分析：流式计算引擎可以实时处理股票市场的交易数据，为投资者提供即时的市场动态和交易信号。
实时用户行为分析：流式计算引擎可以分析用户的点击、浏览和购买行为，用于个性化推荐、广告投放和用户体验优化。

数字广告术语和指标

Impression: 展示量
Click: 点击量
Click-Through Rate (CTR): 点击率
Conversion Rate: 转化率
Cost Per Mille (CPM): 每千次展示成本
Cost Per Click (CPC): 每次点击成本
Cost Per Action (CPA): 每次行动成本
Return On Ad Spend (ROAS): 广告支出回报率

零信任身份

零信任身份（Zero Trust Identity）是一种安全概念，它强调在访问控制过程中，不应自动信任任何内部或外部网络，而应始终验证每个尝试访问系统的用户和设备的身份。这种概念基于“永不信任，总是验证”的原则，无论访问请求来自网络内部还是外部。

零信任身份的关键组成部分包括：

最小权限原则：用户和设备只能获得完成特定任务所必需的最小权限
持续验证：系统应该不断验证用户和设备的身份及其权限，而不仅仅是在初始登录时
多因素认证：使用多个独立的认证因素来提高安全性
基于上下文的访问控制：访问决策应基于多种因素，如用户的位置、设备的安全性、访问时间等
全面的日志记录和监控：所有访问行为都应被记录和分析，以便及时发现异常行为

时序问题

时序问题在开发中是一个比较复杂且常见的问题，主要涉及到系统或者组件之间的时间同步、事件排序、任务调度等方面，有以下几种类型：

时钟同步问题：在分布式系统中，各个节点的时间可能不一致，导致系统行为异常。接近这个问题通常需要使用 NTP 或 PTP 等协议来同步节点时间
事件顺序问题：在消息队列、事件溯源等场景中，保持事件顺序是非常重要的。网络延迟等因素导致事件顺序发生变化，需要采取全局有序或局部有序的方案
任务调度问题：在实时系统、操作系统等场景中，任务调度是核心问题。需要合理分配系统资源，保证任务按时序执行

参考链接