4月27日,第十七届中国电子信息年会暨2023年度中国电子学会技术奖励大会召开。由清华大学阿里云、南开大学、北京必示科技完成的“大规模在线服务智能运维核心技术及产业化”荣获科技进步一等奖。

阿里云携手清华大学等荣获中国电子学会科技进步一等奖  第1张

阿里云携手清华大学等荣获中国电子学会科技进步一等奖  第2张

组委会给予该项目的颁奖词为:“项目在指标异常检测、日志异常检测、事件关联分析、故障定位处置领域实现多项创新, 实现了智能运维技术的重大突破。项目成果已在金融,电信等多个关键领域得到应用,取得了广泛的社会和经济效应。”

阿里巴巴研究员、阿里云政企事业部专有云总经理刘国华作为代表接受表彰。据他介绍,阿里云自2017年开始与清华大学和南开大学在“大规模在线服务智能运维技术”方面开展产学研合作,并取得重大突破。此次,该项目主要实现了“基于生成模型的指标异常检测”、“基于语言模型的日志异常检测”、“基于关系挖掘的事件关联分析”、“基于因果推理的故障定位处置”四个维度的技术创新。

阿里云携手清华大学等荣获中国电子学会科技进步一等奖  第3张

目前,该合作的技术成果已应用于阿里云云计算软硬件管理系统“天基”之中,并通过飞天企业版应用于众多关乎国计民生的领域,保障各大型机构的基础设施平稳运行。

阿里云飞天企业版(Apsara Stack)是基于阿里云飞天云计算操作系统,为政企客户专属构建的资源和云管完全独立的企业级云平台。飞天企业版与阿里云公共云同根同源,采用同一套技术架构,为客户提供一致体验。通过本地部署,提供专有的计算、存储、网络等资源满足政企客户资产自持、安全合规、自主运维运营需求,其弹性、灵活的云平台能力同时满足客户资源高效利用、产品快速部署的需求。自2014年发布后,飞天企业版已服务超过1000家大型政企客户。

“天基”系统通过应用“业务指标异常检测/数据库故障发现”和“基于服务联动体系的云平台AIOps研究”技术成果,保障了公共云以及飞天企业版的安全高效运行,实现阿里云基础设施的交付效率提升两倍以上、物理机集群全自动化运维。目前该系统维系着近百万台服务器规模的云平台监控、管理和自动化运维调度工作,实现运维综合效率提升50%以上,人力成本节约将近一倍的效果。

未来,清华大学、南开大学与阿里云将进一步围绕智能运维技术展开合作,针对阿里云公共云及飞天企业版,深入推进故障预测、灰度故障发现、运维大模型等技术研究,丰富技术应用场景,提升技术成果的现实效益。