大规模电力企业数据网覆盖企业各级单位及生产营业节点,其上承载大量管理信息业务。近年来通过开展优化整合工作,实现数据通信骨干网向省级及以下数据网络的技术标准延伸和网络架构延伸,全网技术体制标准统一、网络结构清晰。改造之前主要存在以下三种运维模式:省、地市、县一体化模式;地市县公司一体化模式;省、地市、县独立运维模式。但随着网络的改造,这三种运维管理模式已经不适应新的网络管理需求。 企业数据网边界延伸至地市后,主要从网络架构、网络规模和覆盖范围、路由控制三个方面说明网络变化,进而分析运维管理所面临的新挑战、新风险。(1)网络架构上。省内网络扁平化。省级机构不再作为本省业务的汇聚点,省级机构本部作为一个地市级节点,与其他地市节点一起直接通过骨干网与总部对接。网络结构的变化,使得原有“总部-省”两级网络运维体系出现了不适应。(2)网络规模和覆盖范围上。网络规模和覆盖范围的变化,使得总部很难全面、高效的对网络运行进行深入管理。由于骨干域[5]边界扩大至地市,骨干域设备数量增加了数倍,运行管理的深度很难保持原有质量。(3)路由控制上。由于总部至省级机构的边界已经不存在,已无法沿用原有在省、地市边界部署路由控制手段以限制故障影响范围的模式,而必须采用通过两级路由反射器(RR)进行集中路由控制的手段,即路由控制模式从分布式走向集中式典型数据网络运维模式。
典型数据网络运维模式
▲▲▲▲▲
(一)中国电信
中国电信采用总部、省公司、地市公司三级运维管理体系。按照管理与操作分离的原则,进一步划分为专业管理条线和运维操作条线。
在全网运维专业管理的条线上,包括职能管理与业务管理两个方面,其中:职能管理部门的三个级别机构包括集团公司、省公司及地市公司(本地网),职能管理部门掌握人财物的资源管理权限;业务管理部门的三个级别机构包括集团公司运维部、省公司运维部及地市公司网络部,三个级别的运维部门属于相应层级机构的管理部门,负责本层级运维工作的统筹协调与考核管理,以及面向下级运维部门的标准规范制定,指导意见下发、运维资源配置以及考核评价的管理职能。中国电信网络运维管理体系如下图所示。
在全网运维运维操作的条线上,总体上采用两级监控集中,属地维护操作的模式,其中:集团公司运维部下设集团NOC中心,负责全国骨干网传输、交换、数据、移动等通信专业的集中监控、配置、调度、资源管理等;省公司运维部下设省NOC中心,负责本省各通信专业的集中监控、配置、调度、资源管理等;地市公司网络部下设网络监控维护中心/团队,主要负责属地通信网络的维护工作,除保留部分末梢线路的监测与测试外,其余网络监控职责全部上收。中国电信面向各级NOC/监控维护中心采用矩阵式模式:上级NOC中心对下级NOC中心开展业务层面的纵向调度并提供专业支持,并对下级NOC具备考核打分权,并通过网管工单系统记录各环节执行情况作为重要的考核依据;同时,各级NOC接受本级网络部的职能管理,包括中心领导任免、成本费用预算管理、中心考核管理等。
(二)某能源央企
该企业的数据网络基于MPLS VPN网络架构,所有机构的PE均统一为一个AS域内,且根据机构的地理区域集中情况及传输资源配套情况,进行了片区网络的划分;AS VPN划分逻辑根据组织机构进行划分,建有一级纵向VPN、一级共享VPN、二级纵向VPN。该企业的MPLS VPN网络在企业所有层级机构的IP地址段、RD/RT、路由协议、VPN划分、接入链路类型及带宽均设置标准化要求。
1.运维体系结构
该企业MPLS VPN网络的运维体系,划分为网络管理及网络操作两个条线。网络管理条线涉及的机构包括总公司ITC;网络操作条线中涉及的机构包括集团网管中心、各片区网管中心以及各业务单位的网管专岗。具体运维体系层次图见下图所示。
2.网络运维流程
该企业集团的MPLS VPN网络运维体系的组建以总公司、二级单位等行政管理归属为基本单元,采用运维管理集中,运维操作分散等模式:总公司ITC负责统一的运维管理;集团网管中心、片区网管中心和业务单位网管专岗分别按照所属层级进行具体的维护工作。
集团网管中心、片区网管中心和业务单位维护专岗分工协作、相互配合,共同做好MPLS VPN网络运行与保障工作。MPLS VPN网络的运行维护界面划分如下图所示。
(三)运维需求和趋势分析
公司已经开始关注对电力通信系统运维体系的集中化管理探索,并在部分省公司开展了“省地一体化运维”试点工作,以期进一步提升网络运维管理水平与运维资源的配置效率。在公司数据通信网开展运维体系的优化探索,除上述驱动因素外,也符合公司电力通信系统运维体系改造的整体方向和业界发展的一般趋势。
基于上述两个典型案例的分析,各单位在数据通信网运维管理体系模式的选择上,并不存在标准模型,一般都会以集中化、标准化为前提,根据自身的能力条件、业务需求,在企业整体管理框架内选择合适的路径。对于电力企业而言,在运维管理体系建设上,需要电力通信体系框架相适配,与企业发展战略相衔接,还要考虑当前企业数据网运维体系的整体特征和资源限制。
▲▲▲▲▲
运维管理模式研究
数据网延伸将网络的边界扩展至地市公司,在运维管理上,比之前的数据网骨干网、省内数据网等,无论从维护范围、维护难度、维护风险等方面来讲,都提出了更高的要求。为实现全网的正常运转和成效的整体发挥,需要基于数据网全网运维管理的特征和业务承载的总体要求,对现有运维模式进行审视梳理,结合业界在网络运维管理方面的成熟经验和理念,实现运维调度指挥有力、网络资源管理清晰、运维操作专业规范、运维协同有序可控。
传统的网络运维模式从网络架构、网络规模和覆盖范围、路由控制三个方面都无法满足新的网络管理需求。网络结构的变化,使得原有“总部-省”两级网络运维体系出现了不适应。骨干域设备数量增加了数倍,运行管理的深度很难保持原有质量。由于总部至省级机构的边界已经不存在,已无法沿用原有在省、地市边界部署路由控制手段以限制故障影响范围的模式。
(一)模式一
数据通信骨干网(核心层、汇聚层、骨干层)所有设备由总部统一进行监控、配置并组织应急处置,各省级机构承担属地维护职责。
管理模式为:数据通信骨干网设备及网络的路由策略制定、规范制定以及涉及全网范围的项目投资和网络优化权限全部上收至总部层面,网络设备运行监视、配置管理、调度协调、资源分配、故障处理均由总部负责,省级机构负责本地接入网设备维护并配合总部开展设备基础环境维护等现场工作。
具体分工为:总部直接负责数据通信骨干网所有设备的运行维护,各省级机构负责数据网接入网(地市、县级网络)设备的运行维护。
(二)模式二
所有骨干域内,以原有的省级机构部署的总部PE设备为界,总部PE及以上设备由总部负责进行监控、配置并组织应急处置,各省级机构承担属地维护职责;省公司与总部对接PE设备及省内PE设备由省级机构负责运维。
管理模式为:保留原有数据网骨干网与省级及以下数据网的运维界面不变。业务VPN的配置管理、调度协调、资源分配、故障处理则根据业务等级分别由总部和省级机构负责。
具体分工为:总部负责公司数据网骨干网的核心层所有设备的运行维护,各省级机构负责辖区内数据网骨干网(除省级机构核心机房及汇聚点的骨干网汇聚层PE设备)及数据网接入网(地市、县级网络)所有设备的运行维护。
(三)模式三
数据通信骨干网所有设备(除总部办公区PE设备外)均按照属地进行拆分,本地省级机构负责网络监控、运行维护和应急处置。总部负责省际业务的监控和协调处置。
管理模式为:数据通信骨干网设备及网络的路由策略制定、规范制定以及涉及全网范围的项目投资和网络优化权限全部上收至总部层面,网络设备运行监视、配置管理、调度协调、资源分配、故障处理则由属地省级机构负责。
具体分工为:总部直接负责数据通信骨干网的总部核心节点设备的运行维护,各省级机构直接负责辖区内数据通信骨干网所辖范围内及数据网接入网(地市、县级网络)设备的运行维护。
(四)对比分析
模式一:强调总部在骨干域的全网监控和集中管理,以及省级机构在地市接入网络的集中监控和集中管理,可以实现由总部一家运维单位实现总部到地市层面的一级业务端到端部署维护能力。总部运维单位全面掌握骨干区域的网络资源情况和运行状态信息,因此在业务的资源配置效率、方案制定准确度和业务部署排障过程中,均具备高度的方案统一性和操作准确性。
模式二:业务需求环境方面,适合全网一级业务系统总体数量不大,省内二级业务占比大、复杂性高或调整量大的情况;维护能力环境方面,由于在整体体系架构和各层级运维定位基本不变,对各级维护能力的需求变化不大,比较适合各省维护体制和管理模式差异较大的情况;网络管理系统环境方面,总部具备统一网管对骨干域内的所有设备进行网元监控、告警分析的网管系统能力,省级机构需具备统一网管对省内地市域的所有设备进行网元监控、告警分析的网管系统能力。
模式三:业务需求环境方面,对于一级业务与二级业务的操作配置上区别不大;维护能力环境方面,对各级维护能力的需求变化不大;网络管理系统环境方面,总部需具备统一网管对骨干域内的所有设备进行网元监控、告警分析;省级机构需具备统一网管对省内地市域的所有设备进行网元监控、告警分析的网管系统能力。
(五)运维管理模式推荐方案
综合上述分析结论,在各省二级业务应用比重大、省内业务需求复杂,各省运维管理逻辑存在差异、网管工具尚待完善、人员配置和能力存在瓶颈的情况下,模式二对现有体制冲击小,业务影响风险低,同时又兼顾了数据通信网的适度集中的运维管理特点,具有较高的现实可行性。
但是,模式二虽然能够部分保留原有的运维界面,但对于延伸后的骨干区域,很难实现运维界面的界定及运维流程管理,延伸后在骨干域内需同时考虑地市之间跨域访问也要考虑跨省之间的访问情况,但在同一个域内的设备上将会有总部与省级机构同时管理的情况出现,对于权限与责任的划分很难通过技术手段实现,对于这种多业务承载,网络规模超大型的网络存在一定的风险。
因此,研究建议以模式二作为临时过渡模式,最终以模式一指导开展数据网的运维工作,后续着重关注人员能力的培养、网管工具的完善、制度规范的健全、以及运维经验的积累,最终实现数据网的运维模式。
结语
▲▲▲▲▲
针对电力企业数据网广域网骨干域到地市的情况,本文结合当前运维存在的问题和风险点,借鉴典型企业运维管理模式,提出了三种不同的运维模式。短期阶段建议模式二,后续随着网管建设完成、人员能力具备的情况下逐步向集中式管理的模式一过渡。