See You Again

弃用阿里云

首先要从事故说起:

从2018年6月25号下午 14:40 左右,网站突然无法访问,SSH 也登陆不了。而我什么都没做!我等了十几分钟,以为阿里云早就监控到了,正在紧急解决呢。

但是20分钟过去了,依然没有恢复,我有点不淡定了,打电话找人工投诉;小姐姐客服说确实 curl 超时了,让我检查服务是否正常,我说我什么都没做,肯定是阿里云的问题,我通过阿里云的web终端登录到服务器上,发现所有的服务都正常运行,我断定是阿里云在网络或者防火墙方面做了调整。然后小姐姐说给我发一个教程让我诊断一下链路,然后提交一个工单给他们。

15:00 左右,根据教程跟踪网络链路,然后把工单录入到阿里云的系统。此时我发现,从美国阿里云出口出去的下一个美国路由丢包率是 100%:感觉是错怪阿里云了:sob:
mtr

提交工单后,十几分钟了还是没人处理,我又打电话催促,一个小哥哥说帮我安排技术处理。

15:18 页面上说收到了问题,让我等待处理
15:31 页面上说稍等交有专员处理
15:37 页面上终于给了一个解决方案:

您好,最近出现部分国内地区访问香港及海外服务器链接不上情况,但是使用海外服务器访问正常。这是运营商问题影响,目前该问题已经反馈运营商处理,并且进行督促。但是具体恢复时间暂时无法确定。
若是您的业务受到影响并且比较着急恢复,您可以考虑更换服务器或迁移服务。
迁移服务器可以参考以下回复步骤进行操作:

大概意思就是运营商网络问题难处理,你急的话先迁移到其他机房吧。我看了迁移步骤,想着如果能从美国西部迁移到美国东部或者其他地方也可以,尝试按照他的教程搞了一下,发现这个迁移不是个小工程,还要再买对应区域的服务器。

我又打电话过去,说你们能不能帮我迁移,或者你们有其他网络线路吗,机房层面不能搞定吗,非要等着不确定的运营商?得到的答复是还是要自己搞。

到这里,我心里已经暗自下了一个决定,退服!反正都要迁移,不如直接迁移到别的云平台。具体迁移到了哪里暂时保密。

从以上案例我推断:

新平台服务怎么样,等我后续的试用小结。我最近加了监控,只要服务不可用,马上就可以知道:sunglasses:

2018-06-26 喜欢

Copyright © 2015-2018 转载请注明出处

回到顶部 ↑