电子商务的爆炸性增长在去年已经放缓。但企业对提供良好的数字用户体验的需求继续增长。那些不依赖在线客户购买的公司仍然会因为不良的在线体验而遭受收入的打击。市场条件提高了应用性能监控(APM)工具的重要性,以确保与公司的每一次数字互动都是积极的。
APM工具的设计、特点和功能各不相同。大多数是为IT运营设计的,但另一方面,Retrace是为开发者设计和建造的,由开发者负责。为什么这一点很重要?
一个真正的APM "解决方案 "需要做的不仅仅是提醒IT运营人员注意问题。Retrace是一个全生命周期的APM解决方案,从开发和QA到生产都可以使用。通过在生命周期的早期修复性能问题和错误,Retrace帮助你避免影响用户的应用问题。
但是,像所有的软件解决方案一样,Retrace的一些功能没有被使用,或者被客户和潜在的用户误解。为了帮助每个人从Retrace中获得最大利益,我们推出了关于利用Retrace宝贵功能的 "强力用户 "系列。
Retrace的主要目标之一是为开发人员提供他们所需的所有信息,以创建应用程序,使其为用户提供应有的工作和性能。Retrace的用户可以通过使用以下核心功能轻松追踪错误或查看性能问题 错误和日志管理, 应用性能监控(APM)和 主机/服务器监控.
使用这些核心功能将在很大程度上确保应用程序能够正常工作。然而,我们最大的Retrace高级用户每天都在使用一些 "专业提示",这些提示超越了Retrace的上述核心功能。
当我们说 "专业提示 "时,我们指的是我们的Retrace工程团队如何在内部使用Retrace......这些提示也一定会帮助你的应用程序表现出色。
1.日志查询监控器
我们工程团队内部使用最多的监控器之一是日志查询监控器。这些是你根据查询匹配、字段/过滤器匹配或两者的组合而创建的主动监控。例如,如果你想知道生产环境中的支付过程何时失败,你可以创建一个监控器,与发生该类型问题时出现的日志语句相匹配。这就是你可以配置查询的方式。
要看其他关于如何配置日志查询监视器的例子,请查看 "日志查询监视器最佳实践"。
一旦创建了这些监视器,你就可以在满足配置的标准时设置警报,允许你在用户可能报告问题之前知道这个问题。由于这些日志查询监视器可以作为资源监视器(一个独立的监视器,不需要与服务器或应用程序绑定)来创建,当涉及到主动监测你的环境时,这些监视器是非常通用和强大的。
2.日志标签
错误和日志管理工具可以收集数以百万计的日志语句。使用这种工具的最棘手和最艰巨的部分之一是在巨大的日志中进行筛选。如上所述,日志查询监控器在主动捕捉和提醒你的问题方面非常出色。但是,在停电期间收集的所有无用数据的噪音中进行搜索,是非常有挑战性的。
一个简单的解决方案是为你的日志语句添加标签(#) 。以下是如何标记日志语句。
一旦被标记,日志语句就会被编入索引。你可以通过所包含的标签或点击输出中突出显示的任何地方,快速而轻松地过滤和搜索日志语句。
Retrace Trials是我们工程团队的一个常见用例。当新用户创建Retrace试验时,我们在配置新的客户数据库时,在内部日志中实施标签。
通过在我们的日志中对相关的配置事件使用 "provision "标签,我们可以搜索#provision,以快速和容易地看到我们需要的信息,以排除问题。在这里,Retrace是一个很大的节省,使你能够看到配置错误和所有正确的背景,同时过滤掉其他的东西。
标签对于跟踪一个跨越许多边界的事务也是非常有用的,例如多个应用程序和服务器。例如,许多事务从一个网络应用开始,但通过队列传递给某种后台工作者。在一个流程中涉及的多个应用中记录同一子系统/主题的标签,大大简化了调试工作。
为了进一步改善搜索和过滤,我们经常在日志信息中包含多个标签,通常包括一个子系统/主体的标签,一个操作的标签,以及一个状态的标签(例如,#api #validatekey #failure)。通过遵循这个惯例,我们可以开辟一系列的选项来快速识别我们所关心的日志语句。我们可以通过 "#api #failure "获得所有失败的API操作的广义视图,查看所有 "#validatekey "操作,或者通过搜索所有这三种操作来隔离这个单一事件。
结论
查看Retrace文档以了解更多细节或回答你可能有的其他问题。请留意我们下一篇关于Retrace中核心APM功能的专业用户技巧和窍门的文章。更好的是,今天就开始你自己的Retrace试用吧!
- 关于作者
- 最新文章