迎战双12:玖云平台保障通信系统稳定运行

  对抗双十二:九云平台确保通信系统稳定运行

  【技术新闻】12月14日消息,双11已经接近尾声,天猫销售额为1682亿元,据国家邮政局监测数据显示,电子商务企业全天共生成快递订单8.5亿张,快递行业迎来了今年最繁忙的时刻。九云平台承载着一批快递物流客户的通讯业务,随着双11年底迎来交通高峰,双十二随之而来。为了保证通信系统各方面的健康稳定运行,让客户享受更好的通话体验,九云团队必须时刻保持警惕。时刻保持警惕---全面保障通信系统的健康稳定运行在二十一期间,九云电话通话量将是常态的近十倍,峰值通信系统一秒钟处理50万并发线路,瞬间海量数据I / O,如此大量的并发流量请求,检索和呼叫处理等,很容易导致系统工作量的增加,形成自我保护的关闭或崩溃,从而使通信系统瘫痪。九云团队除了可以使系统在群发并发的情况下正常工作外,还可以避免由于挂断异常通话质量的不足而中断通话,手机无法进入等情况,确保用户拥有一个良好的通话体验。这就要求九云队必须在资源调配和调度的各个环节,进行严格的压力测试,另外,还要密切关注系统的各个层面,避免出现任何可能的问题。为了确保通信系统在整个双11和双12阶段的健康稳定运行,九云团队必须始终保持警惕,关注系统,主要从以下几个方面入手:1,应用层系统监控是否检查AS服务器运行正常。记录是否有警告或异常输出,处理过程是否有缓慢延迟等。如果单位时间内出现的交战日志的百分比增加,则系统中可能存在潜在的异常风险。此时,操作维护必须首次人工分析,从交战日志中找出问题,如果存在死亡危险,请立即手动修复,主系统待机系统根据版本升级或回滚等操作。 2,系统业务层面主动电话业务连接速率正常,通话时间正常,接通响应时间正常,如拨号音振铃时间比平时长,用户体验会明显下降,这个运势网络流量的三维分析,服务器CPU,内存使用情况,流程效率等多维度分析,监控图表等手段缩小了故障范围。如果设备性能异常,则将异常设备从集群中移除,并启用备件更换过程。更换完成后,群集参与服务。 3,资源层系统监控狠抓E1占用,是否有急剧的空闲或不足,服务器CPU,内存,磁盘IO,网络设备性能和带宽利用率等资源是否充足,目前资源安排有按照最高流量进行评估和配置,如高于评估量的情况,将在10分钟内暂时扩大,以确保操作系统能够提供不间断的服务。除此之外,通讯系统的各个方面都受到密切关注。此外,九云平台还制定了一系列内部运维服务保证计划。例如,要求系统关闭网络时间不超过10分钟,平台异常必须在30分钟内开始计划,进行系统的灾难性切换测试等,以确保系统能够平稳顺利地通过“双11”,“双12”。步履薄冰 - 仅为客户带来更好的通话体验双十一,双十一九云平台每年都是一个巨大的考验,很多问题都会暴露在这个高强度,高压力下,经过多次测试,九云团队已经积累了丰富经验,现在九云平台已经非常成熟可靠,而在物流,金融,房地产,互联网O2O等行业得到了很高的认可和评价。接下来的双十二,九云平台将迎来另一个交通高峰,九云队将不遗余力地继续为客户提供更好的服务。作者简介:王超伟,九云平台运维工程师,负责九云平台的运维。本文正是以其操作维护工程师的角度,对九云平台的可靠性,稳定性进行说明。关于九云平台九云平台是大众推出的最新通信平台。通过提供通信功能的接口,企业可以通过访问多行代码来实现通信功能。在此之前,大众汽车专注于语音技术的研究和开发。多年来,大众汽车为证券,基金,银行,保险,物流,房地产,电子商务,教育培训,科技等众多企业提供了业务语音服务。目前,数以万计。认识到互联网对传统通信产业的影响,大众汽车将在2015年推出九云平台项目,希望将这一技术整合起来,将客户带入“互联网+”浪潮。语音稳定性和通话质量直接关系到用户的业务推广和产品用户体验,受益于公共通信的九云平台已经处于语音技术研发经验领域,语音产品的技术实力有绝对优势。