首页 >网络

携程瘫痪12小时因员工毛病操作

2019-05-15 00:01:18 | 来源: 网络

5月28日11时起,携程官及APP无法使用,直至当天23时29分,才全面恢复正常。经携程技术排查,确认此次事件是由于员工毛病操作,删除了生产服务器上的执行代码导致。

在携程宕机之前,5月份以来,已有易、支付宝钱包等络服务出现短暂的没法正常使用的现象。其中,5月11日晚上8时许,易突然出现大面积服务瘫痪问题,易、云音乐、易信、有道云笔记等多款移动运用均无法正常刷新,易名下的游戏也全线瘫痪,用户长时间无法刷新和登录。但第二天清晨2点就已经恢复。5月27日17时左右,支付宝钱包出现故障。支付宝1小时后就找到故障原因,是杭州萧山一处光缆被挖断。

而携程此次宕机,从发现到全面修复超过了12个小时。互联企业宕机,修复时间如此长的情况,比较少见。

为何恢复时间那末长?携程从技术角度对新京报解释道,携程后台是一个由SOA(面向服务)架构组成的庞大服务器集群,一个页面背后由上千个应用子系统和上千个Web Service组成,每个运用子系统和每个Web Service之间存在着相互调用的依赖关系。事件发生后,携程除需要恢复生产服务器上的执行代码,还需要确保应用子系统和Web Service的功能正常,和两者间的调用关系正常履行。这类验证性的操作需要反复地、持续性地调试。

为杜绝此类事件的再次产生,携程表示,已经在系统上做了改进,规范并杜绝技术人员毛病删除生产服务器上代码的操作。携程再次保证,数据和数据库并未遭到此次事件的影响,用户定单数据也完整无损。

除了消费者,携程自身遭到的影响也非常惨重。以携程今年季度财报的数据计算,净营收23亿元,28日携程相当于每小时损失106.5万元的生意。以12小时计算,携程大约少了1278万元的业务收入。

■ 分析

互联脆弱 企业该做甚么?

不到一个月的时间里,主流互联企业中,就有易、支付宝、携程的服务器或系统先后倒下。对于互联赖以生存的络、装备、技术可能变脆弱的情况,企业应当怎么做?

安天首席架构师肖新光告诉,注意备份、备灾非常重要。通常来说,大的互联企业都会有比较成熟的备份机制和应急预案等,通常可以做到小故障不影响用户体验(乃至让用户感知不到),局部故障可以快速恢复等等。

对数据,热备份和冷备份都已经是较为成熟的技术。通俗而言,热备份是至少两台设备同时进行相同的数据操作,如果一个设备出现故障,可以快速切换到备用设备。冷备份是指,每隔一段时间进行一次数据复制,来确保一旦出现故障,少可以恢复到接近当前的某个时刻,但恢复需要更多时间。

技术与方法等是相对比较成熟的,但同时也要看企业对全部系统的设计是否得当、投入是不是足够、管理是否有效。目前企业的相干投入更多对应的是一些自然事故,如服务器损坏、线路中断、包括机房遭遇水灾、火灾等,但对于歹意攻击、内部犯罪等防范的能力和防范投入往往还有一定欠缺。

对于重特大事故和事件(如长时间策划的蓄意入侵攻击,特别是内部的攻击),从开始的一片混乱到有效处理,可能需要更长的时间。多数企业缺少对坏状况的演练。同时,如果立足于防范极限情况,也需要付出更多的平常本钱。

(原标题:携程瘫痪12小时因员工毛病操作)

月经推迟经量少原因
月经量异常吃什么药
月经量异常是什么问题

猜你喜欢