昨晚 谷歌全球宕机 终于还是栽了!
让外界颇感意外的是,阿里对外仅答复“修好了”,并未公布阿里系应用全线“崩溃”的原因。另外,仅仅1天后,3月21日,部署在阿里云上的铁路12306部分服务又一次发生故障。当用户搜索车票时系统显示“很抱歉,查询失败,您可以稍后点击下面按钮重试”。 由此可见,在越来越依赖“云计算”的今天,目前主流的云服务厂商依然不能确保万无一失。然而,在万物上云的今天,云服务一旦出现问题,所将造成的损失也将更加巨大。 如何避免云服务/云平台故障给自身业务带来损失? 毫无疑问,云服务在未来将成为电力一样的新型基础设施。然而,正如人类至今也没做到绝对避免停电一样,云服务在漫长的运行过程中发生故障亦在所难免,我们所要做的就是避免停电损失扩大化。 对于大部分业务来说,云平台的故障造成的损失并不致命。因此,我们可以通过多重保障,以避免云平台故障造成的损失扩大化,从而让损失可控。例如: 核心数据定期异地备份,尤其需要保证备份的可用性。 保留少量自有服务器或其它云平台主机,一旦发生故障,及时发布公告告知用户。 组织运维人员配合云平台恢复服务,核心运维保持随时在线。 及时对损失做出评估。 当然,在消费等服务之外,包括智慧医疗、智能交通等服务也将成为未来的主流应用场景之一。在这些领域,即使细微延迟都可能导致“人命关天”。对此,应该在边缘侧部署相对应的分析与计算能力,通过云边协同,保障场景的连续性、稳定性。 随着科技的不断发展,未来或将有越来越多的故障发生。为此,鸡蛋不能装在一个篮子里,请提前做好Plan B。 延伸阅读:
(编辑:源码门户网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |