AWS中国因光缆被切出故障近12小时大面积瘫痪
| 发布时间: 2019-06-03 09:20:46 | 1849 次浏览
从凌晨2点到下午1点48分,亚马逊的云服务提供商AWS China经历了长达11小时48分钟。
作为AWS China的员工,方远华被手机惊醒了清晨。
一家创业公司的客户抱怨他们的APP无法连接到服务器。
事情比远见更严重。
挂断电话后,方远发现公司微信群的大小已经被炸了。
根据AWS China的官方声明,因为有几根电缆被切断了在隔夜道路建设过程中,可用区域无法与互联网连接,导致AWS中国业务大规模失效。
另一家云制造商由于失败而被切断光缆。 AWS中国拥有近12个小时的大面积。
包括方圆在内的员工也非常尴尬。如何在整个北京地区进行多次电缆切割影响这么多服务?
但是,这次事故的影响一直在不断发酵,包括VIPKID,流利,三星App Store等用户都有受到不同程度的影响。
亚马逊中国官方网站www.amazon.cn的页面也崩溃了。
因为恰逢6月18日的推广活动,流利的助理张凤华正在忙着推广他自己的促销信息。
在这里,张凤刚向学生介绍了课程计划。在微信上,学生告诉他APP的定制课程根本没有打开。
很快,张峰收到公司的紧急通知,因为该公司的云计算服务提供商AWS失败了。
接下来,张峰的工作重点必须成为安抚学生的一种方式。
直到下午1点,张峰终于开始发送群发短信,告知学生APP服务已经逐渐恢复。
类似的尴尬同时在VIPKID的每个父组中执行。 n
一些客户对微信发表评论:这是自我创业以来修复故障的最长时间。 AWS处理此事件的时间效率太低。我表示很失望。
为了确保服务不会中断并且数据不会丢失,一般业务系统和数据有多个备份。
在云计算中,为了确保数据中心业务系统的可用性,数据中心基础设施还将采用类似的冗余备份来提高系统可用性。
一些内部人士认为,由于未完成网络冗余设计,AWS电缆被切断并导致大面积服务近12小时。
网络冗余主要通过重复设置网络链路和网络设备冗余措施。
网络链接冗余意味着为了确保服务的正常运行,除了配置主线外,还要同时部署第二行和第三行。
主线和备用线分开很远,因此一旦主线发生故障,还有其他线路可确保网络的可用性。
例如,当访问互联网时,同时使用不同的电信运营商线路,彼此备份而不会相互影响,但在这种情况下,成本也会增加。 \\ n
据悉,AWS北京地区使用新光网络的数据中心。记者多次致电欢欢新网络客服电话,他们无法连接。
。
根据Halo New Network的官方网站,该公司在北京酒仙桥,太和桥,光环新谷,东直门,房山和亦庄设有6个数据中心,每个总出口带宽达100G,多运营商通信链路。
。
最初是一个计算机房,每个运营商链接都应该有自己的连接。
但是,机房也可能在施工期间首先将操作员汇总到主线,然后在某个节点之后将它们分开。
但冗余是昂贵的,并非场景的所有方面都是多余的。
对于云供应商而言,网络线路正在租用运营商,而且它们都是钱。
以上业内人士指出。
电缆被切断,服务瘫痪的情况并不少见。
2015年,由于当地市政建设和施工方粉碎了光缆,支付宝电脑网页和手机客户端无法登录,网络异常。
后来,支付宝改为冗余设计。
在2018年9月的云栖会议上,蚂蚁金融服务公布了三个中心和五个中心的金融级高可用性计划,并在现场展示了切断的网络电缆。经过26秒的灾难恢复切换,业务恢复了。
2018年7月,由于广州腾讯云中两家主要运营商之间的两家运营商网络链路同时中断,腾讯云广州地区的部分用户遇到资源访问失败和控制台登录异常。
2019年3月,腾讯的各种服务没有出现服务器响应问题。
随后,腾讯云宣布,由于上海南汇网络光纤意外中断,该地区许多互联网公司的业务受到不同程度的影响。
由于备份腾讯云立即启动了交通智能调度系统,上海的公共网络流量通过腾讯云的内部T级骨干网引导到腾讯云广州的电信出口,然后直接连接到浙江电信。电信骨干网。
光纤故障从发现到恢复只有两分钟,所有进程都是自动化的,网络在不到150秒的时间内快速恢复。
但是,即使有冗余也是如此备份,对业务没有任何影响。备用链接通常较慢,每个人都在路上,它自然拥挤,经验很慢。
云服务提供商告诉记者。
此前,UCloud创始人兼首席执行官季玉华表示,云计算公司有四大谎言,即云计算首先服务于内部客户然后外部顾客;云计算可以保证100安全;云计算消耗了大量资金;云计算是
无利可图。
虽然云计算比本地R更安全,但它不能是100.
即使微软,亚马逊,谷歌,阿里,腾讯也会有问题。
因此,用户更愿意使用多个云服务,而多云策略是未来的重要方向。
他指出。
一些制造商还呼吁保护光纤电缆和管道等基础设施,以跟上云计算和数据中心日益增长的重要性。破坏成本现在太低了。