首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
故障
订阅
孙金飞
更多收藏集
微信扫码分享
微信
新浪微博
QQ
8篇文章 · 0订阅
美团扫码付的前端可用性保障实践
2017年,美团金融前端遇到了很多通用性问题,特别是在保障前端可用性的过程中,我们团队也踩了不少“坑”,在梳理完这些问题以后,我们还专门做了第31期线下沙龙给大家进行了分享。不管是在面试过程中与候选人讨论,还是在团队内的和我们前端小伙伴讨论,都能发现很多同学有一个共同点,对所做…
“黑匣子”工程 - 用户端监控保障体系建设
作者:张鑫,资深工程师,点餐团队成员。本文同步发布于知乎专栏:张鑫技术男。业务背景美团点评的业务发展历程是一个不断深入挖掘行业价值的过程。从用户评价,到团购,到外卖,到预订,再到点餐,越是后期的业务越需要向系统底层打通,对商家运营的介入程度越来越深。对商家运营的介入程度加深之后…
研发体系这点事
几年前在读研究生的时候,自己负责着实验室的项目,就一直在思索如何建立一套简单又高效的研发管理体系,能够在保证项目高质量顺利进行的同时还能够提升团队成员的技术 level。后来在自己在校的几次小的创业中,也做过一些尝试。直到毕业后进入前东家,在几个项目的参与过程中,算是见到了大公司的研发管理是如何进行的。直至加入目前的公司,将研发管理系统梳理一遍,且学且抄且实践,对这一套东西算是有了一定的实践感悟。
这是有赞的故障管理经验
线上故障是指提供给客户使用的IT服务全部或部分不可用,包括服务性能的降低,如:服务延迟导致用户体验变差。 在创业前期,为了抢占市场先机,产品新功能的发布速度追求往往优先于其质量,埋下了很多技术债务,部分技术债务的爆发会引起线上故障,造成客户的体验下降或经济损失。 故障管理的目标…
iOS App 稳定性指标及监测
一个iOS App的稳定性,主要决定于整体的系统架构设计,同时也不可忽略编程的细节,正所谓“千里之堤,溃于蚁穴”,一旦考虑不周,看似无关紧要的代码片段可能会带来整体软件系统的崩溃。尤其因为苹果限制了热更新机制,App本身的稳定性及容错性就显的更加重要,之前可以通过发布热补丁的方…
从无到有<前端异常监控系统>落地
有一天一个测试同事的一个移动端页面白屏了,看样子是页面哪里报错了。 我自己打开页面并没有报错,最后发现报错只存在于他的手机,移动端项目又是在微信环境下,调试起来会比较麻烦,最后用他手机调试才发现问题: 是他账户下面有个对话的消息数据有问题导致页面报错了。 一般遇到这种情况只有用…
故障驱动的微服务架构设计
看了本文中介绍的各种技术和架构模式,让我忽然对之前的这个案例有了一个新的认识,就是“快速失败”不应该依赖于传统的比如timeout这种超时机制来进行,也许使用本文中介绍到的技术(比如:Circuit Breakers)要更加地可靠和受控。
全链路监控(一):方案概述
监控是为复杂的分布式系统服务的,它收集跨不同的应用,不同的服务器的系统行为信息,可通过采样收集所需的性能指标,帮助分析性能问题,并在指标超过正常值时报警。 全链路监控又名分布式监控系统,全链路追踪。 目前市面的全链路系统基本都是参考Google的Dapper(大规模分布式系统的…