数字化运维|数字化时代运维必杀技—智能运维标准及评估简介从2020年8月开始,智能运维国标工作组克服疫情和距离带来的不便,通过多次形式多样的研讨会累计投入1400多人天。最终,在2021年9月,《信息技术服务 智能运维 通用要求》团体标准(T/CESA 1172-2021)正式发布,且《信息技术服务智能运维 第1部分:通用要求》国家标准(计划号:20214124-T-469)也于2023年1月通过SC40主任委员办公会议,并按照规定的程序进行报批。
为发挥标准在智能运维领域的支撑引领作用,打造符合市场驱动、技术所需的标准应用推广体系,是标准化生态全面融通的重要环节,也是标准化工作成果转化为实践应用的关键阶段。2022年7月,全国信息技术标准化技术委员会信息技术服务分会正式发布了《信息技术服务 智能运维 通用要求》团体标准的符合性评估试点工作的通知。ITSS分会希望通过智能运维标准的应用推广,有助于被评估方构建先进的智能运维框架基础,把握行业发展趋势,并在此基础上参照标准条款要求以知促行,稳步落实,持续提升运维服务能力。
标准引言部分,指出本标准是“基于行业发展及组织实践,提出智能运维的能力框架,描述智能运维的特征,明确智能运维所需要的组织治理、智能运维场景实现和能力域的通用要求,通过场景分析、场景构建乐鱼、场景交付和效果评估的过程,实现运维场景所预定的目标,为智能运维的能力建设提供指导。”
智能运维的能力框架形成了“以场景实现为中心,以能力构建为导向,以组织治理为引领”的三驾马车,如图1所示。
• 场景是智能运维需求的起点,也是最终效果体现所在,通过智能特征宣示了与以往传统运维场景的区别。“以场景实现为中心”旨在表明智能运维应以运维为中心,而不应脱离运维在技术上闭门造车;
• 能力力是支撑场景实现的底座,犹如一棵参天大树,枝繁叶茂的场景,一定需要同样发达扎实的根基。“以能力域构建为支撑”说明底座能力的重要性,底座能力的构建既是场景实现过程中的经验沉淀,也可通过合理规划为未来更多场景实现做好支撑储备;
• 组织是智能运维道路上的持续力量,智能运维不是零星场景的昙花一现,也不是技术平台的简单堆砌,智能运维是全新的运维方式数据和算法驱动的智能运维将更有效地打破原有职能团队间的“竖井”,需要依靠“以组织治理为引领”实现组织的融合创新,应对各种错综复杂的环境。
如果说智能运维团体标准的正式发布是“以行促知”的阶段性成果,那么基于标准开展贯标及评估,就是“以知促行”的过程。本标准评估是面向智能运维组织级的能力,其涵盖面广和检查项多,包括组织治理、场景实现和3大能力域的17个能力项,以及254项具体检查要求。评估师不仅需要理解三驾马车之间的关系,对于3大能力域还需要一定的专业能力。接下来,我们将该标准评估的核心要点给大家做一番梳理,以便大家能对照标准开展自评或成为评估师开展第三方评估。
本标准组织治理部分是从组织战略、管理方针、组织架构、组织文化及相关方需求和期望等五个维度对被评估方的组织级能力进行审查,帮助被评估方从组织层面进行智能运维相关工作的统筹规划,协调资源,统一建设,指导结合自身的场景因地制宜做好科学的规划和实施。我们将标准条款要求进一步解读为评估核心关注点如表1所示。
本标准场景实现部分是从场景分析、场景构建、场景交付和效果评估四个主要过程展开对被评估方的组织级能力进行审查,重点评估组织在实现一个或多个智能运维场景的工程化水平与持续改进能力。
ITIL流程给出了主要的运维场景,智能运维场景是ITIL流程智能化的过程,大家对场景认知上的差异,会使得切片的维度不太一样。智能运维场景建设可以借鉴,但很难复制。究其原因,是因为大家看到的智能运维场景,只是冰山一角的表象。想要真正建设一个智能运维场景,需要做好大量基础性工作,比如企业架构设计、开发日志规范、运维数据治理、服务流程改进、专业队伍建设。这也就是为什么大家都觉得智能运维很好,是未来的方向,但都觉得智能运维场景难以落地、效果欠佳。“智能运维场景实现”是一个需要持续迭代调优的过程。只有不断循环这些过程,才能持续提高运维智能化程度。它既要关注智能的过程,还要关注运维的结果。我们将标准条款要求进一步解读为评估核心关注点如表2所示。
本标准能力域部分是从数据管理、分析决策、自动控制3大能力域17个能力项对应到人员、技术、过程、资源、数据、算法和知识7个要素的具体要求对被评估方的组织级能力进行审查,评估组织能力项的建设情况,通过这些能力项在各类个性化智能运维场景建设中进行有效性验证。3大能力域17个能力项具体描述内容如下。
• 数据管理能力域是对运维数据进行全生命周期管理和应用的能力组合,提供高质量、全覆盖、互联融合且满足时效性要求的运维数据。数据管理能力域可分为数据建模、元数据管理、数据采集、数据加工、数据存储、质量管理、数据服务及数据安全八大能力项。
• 分析决策能力域是使模型自主对运维场景做出预测、判断、行动的能力组合,针对特定的业务目标,通过筛选、整合、加工相关运维数据,综合运用规则和算法模型。分析决策能力域可分为数据探索、特征提炼、分析决策、可视化及安全可控五大能力项。
• 能力是沉淀到技术平台,也要能被泛化应用的,能力往往需要通过场景来验证。传统运维靠组织人员的多少和个人能力解决运维目标,智能运维更要靠技术平台的能力以及组织用好平台的能力,技术平台的能力又靠人的需求辨识、采购、运维研发,因此,构建一个有效的智能运维场景,离不开底层能力的建设和支撑。一个完整的场景建设分析过程,应该基于数据管理、分析决策、自动控制能力域充分评估,以确定待建设的能力项和待提升的能力要素。在这个过程中,场景是抓手,没有场景的建设方案是不可行的;能力是底座,构建能力项要特别关注其组合性和可复用性。只有同时兼顾“自上而下的场景驱动”和“自下而上的能力支撑”,才能真正把智能运维场景建设好。
智能运维标准作为ITSS标准体系的一员,其评估流程遵循《信息技术服务智能运维标准符合性评估实施细则(试行)》的相关要求。整体评估流程如图2所示。
第三步:评估机构负责受理申请和组织评估。若被评估组织通过评估,ITSS分会将进一步进行评审,评审通过后,便可颁发相应的证书;若被评估组织未通过评估,则需完成相应整改,并在整改完成后由评估机构重新组织评估。
《2021-2022中国智能运维实践年度报告(第二期)》指出,我国在智能运维发展过程中,AIOps刚开始出现时会高估1-2年带来的变化,到了一定程度之后会出现疲态,进入战略相持阶段,这也是我国智能运维领域所处的阶段。但对比全球和国内AIOps技术成熟度曲线可以看出,国内智能运维技术成熟度相较于全球处于靠前位置,会更快地到达成熟和实质生产阶段,从整体趋势来看,中国AIOps平台可能会在2到5年内达到最终成熟的实质生产阶段。
随着更多的组织与企业的加入智能运维标准评估的应用与推广工作,势必为金融、电力、运营商、互联网等诸多行业智能运维的能力建设提供了相应的指导,促进了企业间运维领域的专业流与相互借鉴,拓展了创新思路。与此同时,标准在应用落地与评估过程中,经历了量的积累,能逐步形成包括应用场景库、智能运维能力项集等的成果。这些成果库通过标准评估的方式,举一反三的应用推广,标准价值将在更广泛更深远的领域得到传递与完善,最终实现价值的持续挖掘、持续积累、持续提升。
Copyright © 2016-2025 leyu·乐鱼(中国)体育官方网站 版权所有粤ICP备16021038号-2 Xml网站地图 HTML地图 txt地图