让我们面对现实吧。尽管部署了各种监控工具,但停机和错误仍然是业务问题的主要根源。
综合监控可以成为解决方案吗?
监控是现代数字业务非常重要且必要的一部分。
您不能仅仅因为您的业务成本太高而依赖偶然发现的错误或等待不满意客户的电话。
我希望我可以公布详细信息(但我有合同义务这样做),但我想解释一下为什么一家公司的市场地位从第二位下降到第二十位左右,只是因为客户投诉不断堆积。近距离看到了它。让我告诉你,这是一个 B2B 业务。如果您认为优秀的客户服务团队(或客户“成功”团队,无论您想如何称呼它)可以拯救他们,那么您就错了。系统中不断随机发生的意外错误太多了。即使修复完成后。
为什么监控还不够?
此类业务问题的答案就是监控。是的,每个人都知道这一点,作为一家公司,您可能有一些监控系统。
但实际应用程序面临的挑战是 ping 和 API 正常运行时间不仅仅只是应用程序的表面。现代应用程序建立在交易、渠道、登录和多个第三方服务的基础上,所有这些都必须协同工作,而不是单独完美地工作。
使用传统的监控系统,您可以确定您的电子邮件和支付服务器正常工作,但是您如何确定您的支付服务器能够通过您的电子邮件服务器发送交易电子邮件呢?
综合监控,您好👋!
如果您在客户之前遇到问题并努力到达难以捉摸的应许之地,那么您需要综合监控。尽管它的名字听起来很神秘(事实上,你自己编写代码非常困难),但综合监控是一个非常容易解释的想法。
这涉及以脚本的形式模拟应用程序用户。然后我们将探索一些预定义的页面流程以确保一切正常工作。请注意,对于应用程序而言,没有真正的区别。该请求就像来自真实用户一样,并要求您按与用户完全相同的方式按下按钮或填写页面上的表单。
通过设置一系列这样的测试并定期运行它们,您始终可以回答以下重要问题:
- 系统正在运行吗?
- 所有关键子系统都正常运行吗?
- 客户可以登录吗?
- 您的客户能否在正确的地方找到他们所期望的东西?
- 最近的代码更改是否破坏了您的部分客户体验?
- 客户可以过滤结果或下载报告吗?
- 客户可以付款吗?
- 客户可以在应用程序内联系您的支持团队吗?
该列表各不相同,但一旦您设置了综合监控,您就可以始终对您的系统拥有 100% 的信心。很难过度推销综合监控,但一旦你启动并运行它,你就会想知道如果没有它你会如何相处。
有哪些最好的综合监控工具?
现在您已准备好实际(或“合成”)您的应用程序,我们将向您介绍一些可用于部署并立即开始受益的最佳工具。

切克利
Checkly声称是最先进的监控和测试解决方案,并获得了很大的关注,特别是在 JavaScript 社区,拥有 Vercel 和 Humio 等客户。您可以监控站点的事务流并在真实的浏览器中查看 API 端点。单个仪表板随时向您显示您需要了解的有关应用程序准确性和性能的所有信息。
我真正喜欢的是,Checkly 将极其简单的设置和易用性与开发人员喜爱的强大工具结合在一起。 Checkly 使用 Chrome Puppeteer 框架来准确模拟与 Chrome 浏览器的交互。要创建检查,您可以深入研究代码或使用Puppeteer Recorder,这是 Checkly 的开源 Chrome 扩展,在 Github 上拥有大约 7000 颗星。
Checkly 提供了强大的 REST API,允许您使用 Terraform 等来编排和自动化检查。您还可以为 Opsgenie、Pagerduty 或 Slack 设置精细警报。总的来说,我认为这是现代 DevOps 团队最有趣的解决方案。
您可以从免费计划开始,其中包括从世界各地的数据中心位置进行 1 分钟检查的时间间隔。

网络监视器
Dotcom-Monitor 的全面监控解决方案可监控 API(REST、SOAP、套接字)、网页(实际浏览器)、Web 应用程序(包括多步骤事务)和 Internet 基础设施(FTP、VoIP 等)。
Dotcom-Monitor 的综合监控工具完全外部且完全托管,可让您专注于数据,而不是耗时的设置和安装。此外,我们屡获殊荣的支持团队可以帮助您设置和管理复杂的企业级监控任务(24/7)。

塞玛文本
Sematext Synthetics是一款综合监控工具,具有强大且易于使用的功能。这使您可以从世界各地的多个位置监控网站和应用程序的可用性。
Sematext 报告错误率、页面速度和加载时间以及其他关键业务指标的统计数据。您还可以使用它来与竞争对手进行基准比较,并确定需要优化的领域以提高网站的性能。
您还可以创建公共或私有状态页面,其中包含受监控服务的可用性和性能信息,并发布有关事件和计划维护的信息。这些状态页面驻留在自定义域中,并且可以包含视觉元素。

您可以开始免费使用 Sematext 并在制定计划之前测试所有功能。准备好后,从三个计划中进行选择。
高度灵活的即用即付计划使您能够很好地控制成本。 29 美元/月的计划为您提供 40 个 HTTP 监视器、5 个浏览器监视器和 30 天的数据保留。 Pro 计划为您提供 100 个 HTTP 监视器和 15 个浏览器监视器,价格为 99 美元。
上升趋势
Uptrends是一项美观且功能丰富的综合监控服务,值得一试。预先给人留下深刻印象的功能包括故障快照(准确查看浏览器中出现问题的位置)、带宽限制(查看您的网站/应用程序在不良网络条件下的性能)等。有。
Microsoft 和 Vimeo 等公司正在利用上涨趋势,因此您可以放心。
Uptime.com
Uptime是一款企业 Web 监控软件,包括综合监控。
带有字段建议的独特内置编辑器创建了一种无代码的事务检查方法。该编辑器包括自动完成功能,可以识别特定元素,而无需查找它们。
Uptime 的事务检查是一种快速、简单的方法,可以获取有关您的网站上哪些内容不起作用以及原因的重要信息。我们强烈建议您尝试一下。
提高正常运行时间
Better Uptime是一项现代监控服务,结合了全面监控、事件管理和状态页面。

设置需要 3 分钟。然后,每当您的网站出现故障时,您都会收到电话、电子邮件或 Slack 警报。主要特点是:
- 无限制的来电提醒
- HTTP(s)、Ping、SSL 和 TLD 过期日期、Cron 作业检查
- 轻松随叫随到的安排
- 事件截图和错误日志
- 与 Slack、Teams、Heraku、AWS 和 100 多个其他集成
警报机器人
AlertBot是综合监控的另一个不错的选择。 AlertBot 以其提供易于使用的高级功能而自豪,直接向您的收件箱提供有用的运行状况报告,并在您的网站出现问题时向您发出警报。
它与其他产品的真正区别在于它对多步骤合成监视器的主动管理(我们称之为“主动 ScriptAssist”)。站点经常变化,因此此功能可确保您的合成脚本始终有效。它还提供了一个易于使用的网络记录器来帮助您创建脚本。
品达姆
对于普通企业来说,其需求相当简单明了。通常,您仅监控一个应用程序、几个端点和一些关键的客户体验。
大多数顶级产品对于这样的用例来说都有些过头了,所以 Pingdom 显然是我最喜欢的一般监控和综合监控。
正如您所看到的,在 Pingdom 中创建综合监控测试非常容易,您一定会享受到清晰而专注的体验。如果您尚未开始监控,我们鼓励您尝试 Pingdom 提供的整个堆栈。我们确信您会喜欢它!
阿皮卡
Apica是一款来自值得信赖的公司的强大的综合监控产品。公司全面的监控服务包括正常运行时间监控、竞争对手监控、全球监控(模拟任何地区的用户)等等。
Apica 提供的主要优势之一是为对隐私敏感或受监管要求约束的公司进行本地部署。
网站全年 365 天、每天 24 小时开放
与 Pingdom 一样,Site24x7 最出名的是用于监控应用程序正常运行时间的简单 ping 服务,但我很高兴看到其全面的监控服务。
该服务与 Selenium 测试用例兼容,因此如果您已经使用 Selenium 进行浏览器测试,那么这是一个优势。
可编程 Webhook 和通知系统给我留下了深刻的印象,它与 Microsoft Teams、Slack、Stride、HipChat、Zapier 等具有即插即用兼容性。
应用动态
AppDynamics 现归思科所有,是一个家喻户晓的网站和 API 监控服务品牌,拥有基于浏览器的综合监控服务的重要子集。
该产品是标准的,但有一些功能对我来说很突出。
首先,重新测试错误。一旦检测到错误,AppDyanmics 就会重新测试以确保它不是漏报。只有这样才会发送通知。
第二个是私人合成代理。它允许您在基础设施中部署自定义合成代理,以解决边缘情况并避免延迟问题。这绝对值得一看。
捕获点
Catchpoint是一项非常全面的综合监控服务,拥有 700 多个全球测试位置(比我在研究本文时发现的任何其他位置都多)。
试图覆盖整个监控范围,通过检查20多种监控器并找出故障的真正原因。
例如,文件上传失败是否是因为 FTP 服务器、客户的 ISP 或您的 ISP 没有响应?是否是通用协议、浏览器类型、最后一英里连接等原因导致的?最好为您提供真实的图片。
新遗物
此列表中的最后一个是New Relic 。这是另一个值得检查的出色综合监控服务。
它具有您期望从强大的综合监控服务中获得的所有功能,但截至撰写本文时,它在全球仅拥有 18 个位置。因此,如果全球可用性是您最关心的问题,那么这可能不是最佳选择。
但是,如果您已经使用 New Relic 的其他产品,尤其是Insights ,那么这是一个很好的组合。
结论
综合监控相当于真实监控。这包括实时记录错误并像鹰一样监视它们。与前者一样,真正的监控可以发挥重要作用。模拟无法完全代表繁忙的实时系统的湍流。
尤其是在寻找理想的优化位置时,真正的监控是唯一的选择。然而,正如已经指出的那样,Real Monitoring 确实赶上了它的客户。这是一种处理错误的反应性方式(在我看来,这比公司实践的默认方式(忽略错误)要先进得多)。




![2021 年如何设置 Raspberry Pi Web 服务器 [指南]](https://i0.wp.com/pcmanabu.com/wp-content/uploads/2019/10/web-server-02-309x198.png?w=1200&resize=1200,0&ssl=1)

