首页 关于天云 天云 AI CORE AI智能运维 AI金融科技 AI智慧粮安 AI城市消费 天云动态 联系我们
洞察数据之美,重塑IT运维

04.13 / 2022

“ AI助力数据中心智能化和数字化转型”

01—数据中心运维的“离散雏形”陷进

随着信息技术的发展,数据中心运维的理念也在从人工运维、被动运维、主动运维、服务导向、业务价值导向进行演进,但运维体系建设过程中往往存在以建设任务为导向边建设边改造,运维体系建设缺乏长远规划、头痛医头脚痛医脚,造成数据中心运维管理实质处于离散雏形阶段,在运维工具繁杂的情形下,既无法做到运维能力从应用到基础设施的上下穿透,也无法做到运营效果在客户内部的横向延伸,对运维的效果、运维运营化及业务价值导向的发展形成严重制约,在数字化经济全面发展之时,在应用和基础设施愈加松耦合之际,离散陷阱导致的问题将日趋严重。

02—三大核心,建设智能运维体系

数字化—利用运维数据破界

数据是运维工作的源泉和基石,因此运维要做好,首当其冲的是将运维数据治理好,而数据治理需要确定数据范围,制定数据规范,规划数据来源,建立数据调和和异常机制等,进而形成运维数据全覆盖、运维数据变化全掌控、运维数据服务全链条的效果,以此实现对分散的IT运维工具进行数据(即专业能力)的融合,融合的重点在于数据查看、智能策略、变更流程、执行和可视化的数据供给和联动。

智能化—利用AI能力赋能

通过运维大数据库中构建的资产图谱、知识图谱、事件图谱等海量数据,即可基于算法工程平台依次对单指标、多指标、立体化指标进行深层次数据挖掘和分析,实现基线分析、智能告警、趋势预测、关联影响分析、故障溯源等场景,促进运维工作的自动化和智能化,大幅提升运维的质量和效率,甚至可以达到运维数据业务化,推进业务创新,提升用户体验,展现运维成效等。

场景化—构建运维应用体系

运维体系包括人员、工具、制度、规范、流程等要素,每个行业、每个客户会因为监管要求和管理思路的差异,随着时间及理念等因素的变化,具体客户的场景也会随之发生变化,因此根据客户自身场景需要,构建一个开放的、平滑扩展的、甚至可以自主研发扩展的运维应用体系至关重要。

03—重塑智能运维-云层智能运维平台

平台定位

云层智能运维平台将实现对全局资产及运行数据的自动采集及大数据存储,并通过资产管理、运维管理、监控管理三个技术中台模块,结合关联关系图谱分析和算法分析数据中台模块,为数据中心运维管理提供自动化、智能化、可配置的运维场景应用,切实提升数据中心在质量保障、风险评估、效率提升和容量管理方面的能力。

产品架构

平台架构分为业务中台、数据算法中台、管理中台和上层应用场景四个方面。

1. 业务管理中台:将运维工作降维抽象为原子化对象、原子化状态及原子化操作和原子化事件,基于四个原子的组合构成所有的运维场景,业务中台是连接客户现有系统的关键部分,主要实现两个目标,一是实现运维数据的实时采集存储,二是基于客户现有系统的对接,并向上层应用APP场景提供一致的北向API(屏蔽底层API差异)。客户现有系统可包括资产类管理系统、监控类系统(基础设施监控、日志监控、应用监控)、操作类系统(虚拟化或云管、备份系统、安全扫描、设备远程管控系统等)。

2. 数据算法中台:实现运维大数据的存储、治理、学习和训练,在故障共现分析、关联影响分析、故障自愈、容量规划、趋势分析、智能问答场景提供智能化功能。数据范围包括结构化和非结构化数据,涵盖资产属性、资产图谱、性能数据、日志数据、风险检测数据、安全威胁数据、事件数据等。

3. 运维应用管理:为智能运维平台提供统一组织管理、统一用户角色管理、统一流程管理、以及运维APP的上传、发布及授权管理(管理颗粒度细化到每个角色的APP可见范围、APP中页面可见范围、操作按钮可见范围)

4. 上层应用场景:依赖业务中台、数据中台和管理中台的北向API,打造轻量级、可插拔的应用场景APP。APP面向所有的运维场景,可以根据客户需求进行进行分解及组合等灵活处理,提升产品对客户环境的广泛适配性。