蚂蚁集团开源的TingIS系统,针对云原生环境中的事故发现场景,提供了一套完整的解决方案。
核心挑战
极端噪声: 大量无关日志淹没有效信号
高吞吐量: 每秒处理海量日志条目
语义复杂性: 不同业务线日志格式和风险定义各异
技术思路
TingIS通过以下方式从噪声中提取真实风险:
- 语义理解:对日志进行语义分析,区分"描述性日志"和"风险信号"
- 模式识别:识别已知风险模式 + 异常偏离模式
- 实时性:流式处理,保证风险发现的时效性
适用场景
- 微服务架构的故障预警
- 金融级高可用系统的风险监控
- 多业务线并行运营的日志中心
论文:TingIS: Real-time Risk Event Discovery from Noisy Customer Incidents at Enterprise Scale (arXiv:2604.21889)