kafka初探

132 阅读1分钟

1、什么是kafka

  • Apache Kafka 是一个开源的分布式流处理平台,支持开发实时、事件驱动的应用程序
  • LinkedIn 于 2011 年开发了 Kafka 作为自己使用的高吞吐量消息中间件,然后将 Kafka 开源并捐赠给 Apache 软件基金会 2、基本概念

image.png

image.png

image.png 3、主要特性(设计目标)

  • Kafka是一种分布式的,基于发布/订阅的消息系统
  • 为生产者和消费者都提供了简单的API
  • 高吞吐量
    • 顺序读写
    • 消费者指定偏移量
    • 消费后不删除消息
  • 横向扩容 4、在项目中的应用
  • 数据管理
    • 存储数据库库表结构等元数据变动
  • ETL
    • 离线/实时数据处理,存储采集的源端数据
  • 日志