服务等级协议是什么

发布时间:阅读数:3


服务等级协议(SLA)最根本的形式是协议双方签订的一个合约或协议,这个合约规范了双方的商务关系或部分商务关系。一般来说,SLA是服务提供者与用户之间协商并签订的一个具有法律约束力的合同,合同规定了在服务提供过程中双方所承担的商务条款。

服务等级协议(SLA)最根本的形式是协议双方(服务提供者和用户)签订的一个合约或协议,这个合约规范了双方的商务关系或部分商务关系。一般来说,SLA 是服务提供者与用户之间协商并签订的一个具有法律约束力的合同,合同规定了在服务提供过程中双方所承担的商务条款。

服务等级协议是什么

协议概念

服务等级协议(SLA)最根本的形式是协议双方(服务提供者和用户)签订的一个合约或协议,这个合约规范了双方的商务关系或部分商务关系。一般来说,SLA 是服务提供者与用户之间协商并签订的一个具有法律约束力的合同,合同规定了在服务提供过程中双方所承担的商务条款。

电信管理论坛(TMF)的 SLA 管理手册中将 SLA 定义为“(一个)协议双方协商签订的正式协议,有时也称作业务等级保证。它是存在于服务提供者和用户之间的一个合约(或部分合约),在服务品质、优先权和责任义务等方面达成协议。”在实际应用中,SLA 合同内容可能包括以下几方面:

协议目的———说明签订此 SLA 的原因。

协议双方———说明协议双方以及他们相应的角色。

有效期———说明协议的生效时间和失效时间。

服务范围———规定协议中服务提供者提供的服务范围。

限定条件———规定在服务提供过程中的必要的步骤。

服务等级目标———即用户和服务提供者达成共识的服务等级,通常包括一系列服务等级指标,如可用性、性能、可靠性等。

服务等级指标(SLI)———测试服务等级的各种基本指标,通常是经过量化了的。

处罚条款———当服务提供者没有达到承诺的 SLA 等级时应采取的相应措施,通常是以罚金或折扣的形式来体现的。

可选的服务———服务提供者通常需要提供一些可选的服务项目,作为出现异常情况的备选项。

例外情况———规定 SLA 不包括的内容,如由于自然灾害等导致的网络中断不属于服务提供者的责任。

经营———规定运行和测试 SLA 目标的方法和步骤。

在实现时,可以考虑将整个系统分为三个角色,即管理者、服务提供者和用户。如图

所示,管理者依据所签订的 SLA 条款,对合同、用户和服务提供者进行管理和监督,测试 SLA 的实现情况;服务提供者在 SLA 中说明服务类别,按照 SLA 规定的条款向用户提供服务,并可以跟踪 SLA 的实现情况;用户可以登录服务平台查询 SLA 相关内容,向服务提供者反馈对其服务的满意度。

分类

普通 SLA 模型

几乎所有的 SLAs 的实现都是以 TMF 的 SLA 管理手册为基础的,不同的 SLA 实现模型有不同的侧重,有的以用户为中心,侧重于用户所关注的问题,有的侧重于对网络的监控。国际上比较典型的以用户为中心的 SLA 模型是 Amdocs 的 SLA 蓝图(Amdocs Service Level Agreement Blueprint),以网络为中心的 SLA 模型是 Micromuse 的 Netcool 套件(Micromuse’s Netcool Suite)和 Orchestream 的 Resolve 产品套件(Orchestream’s Resolve Product Suite)。

Amdocs 是全球电信市场上具有统治地位的一员,它的数据库包括了全球 150 多个顶级电信服务提供者的信息。Am-docs 的 SLA 蓝图的典型特点就是以用户为中心,关注用户所关心的问题,满足他们的需求,降低他们的费用,增加创收机会等。它的总体结构图如图

所示。这个蓝图的重点不是较低层的服务开发和运营进程以及网络进程,而是用户关注进程。对应于这个蓝图,Amdocs 开发了相应的软件系统来帮助用户更便捷地创建和管理自己的 SLAs。例如,在产品创建环境中,用户可以选择适合自己的模板来创建 SLA 合同,还可以选择和设置合适的性能指标;在合同管理界面中,用户可以设置合同的有效期、选择更新时间和费用计划等细节;在合同遵守核查系统中,用户可以实时地监控 SLAs 的运作情况,并可以在终端显示各项关键性能指标的运行状态图。

Micromuse 的 Netcool 和与之集成的 Orchestream 的 Resolve 都是侧重于网络监控和服务保证的 SLA 模型。Netcool 系统的体系结构图如图

所示,它主要包括如下几部分:Netcool 对象服务器、探针、监听器、事件列表及事件列表控制台、显示器、入口。其中,探针和监听器从各种不同的网络上采集时间信息,送给 Netcool 对象服务器进行处理,将需要处理或发出警报的事件信息通过事件列表的形式显示在用户终端,显示器是操作支持服务(Operations SupportService,OSS)人员使用的一系列用户界面,可以在终端显示当前各项指标的状态信息,入口是用于将其他产品与 Netcool 套件集成的接口。Orchestream 的 Resolve 产品套件提供网络和业务性能管理,它可以通过入口与 Netcool 集成。当基于 SLAs 业务等级的阈值超出定义值时通知 Netcool 进行处理。 Resolve 采集的网络信息比 Netcool 更全面,因此,实际应用的方案是 MicromuseNetcoolOSS Gateway Module for Resolve,即 Netcool 和 Resolve 的集成。

分析上述两种 SLA 模型的侧重点可知,它们分别侧重于用户和网络性能,但在 SLA 的具体实现中,这两者都很重要,应合并在一起提供更全面的 SLA 管理。另外,无论在面向用户还是面向网络的模型中,有效的业务传送都是一个非常重要的方面,在 SLA 实现中也应重视。因此,需要一种综合 SLA(ISLA)模型。

综合 SLA(ISLA)模型

由上一部分的描述可知,真正实用的 SLA 模型不仅要考虑用户的需求,还要考虑网络性能、服务传送等多种因素。综合 SLA(ISLA)模型就是基于这种考虑,描述了运营支持系统(OSS)中各个不同的元件和子系统是如何相互连接来保证 SLA 的服务传送的。这种 ISLA 模型采用了分步计算环境来支持多种大型用户团体,它能使各种大范围的商务过程实现自动操作,并确保各个等级中的参与方能协同工作。我们将这种协作环境称为 ISLA 框架。图

即为 ISLA 框架图。

ISLA 框架将工作流的自动控制和社团管理技术引入 OSS 环境,产生了许多核心性能,这些性能分布在面向功能的逻辑域上。这个框架的三个构件及其简单介绍如下:

(1)动态工作流技术和概念

它包括动态工作流的自动控制和动态工作流社区。动态工作流指动态地管理不断变化的工作流的能力,即实时管理。实现动态工作流的自动控制主要是基于已定义的 SLA 条款,智能地传送和跟踪工作流。动态工作流社区包括以下参与方:客户、服务提供者、内部组织、第三方供应方、应用、系统、接口、记录。 ISLA 框架将工作流自动控制与员工管理相结合来建立动态工作流社区,以便在与工作流相关的任务中进行协同工作。

(2)性能

它包括工作流接入方式、商务智能化、合作方式、自动控制、综合集成等。工作流的接入方式为统一接入,这个概念指任何一个工作流的所有参与方都能以方便友好的方式安全地接入到 ISLA 框架环境中。商务智能化指 ISLA 框架环境为社区成员提供高级的商务智能化,可采用的形式有实时或周期性的工作流监视、关键性能指标的测试、监视器、报告等。合作方式指 ISLA 框架环境能够支持许多不同的实体和参与方以串行、并行或两者结合的方式协同工作。自动控制指某些工作流参与方之间的任务,尤其是任务的交接,应该可以自动地被系统初始化、管理、传送和实现,而不需要人工干涉。综合集成指 ISLA 框架环境能够将参与方、应用、处理、接口等因素无缝地集成在同一个管理环境中。这种综合有组织、处理、数据转换、协同工作四个级别,第四个级别将前三个级别综合为单个的工作流表示。这四个级别贯穿于下述多个逻辑域中。

(3)逻辑域

它包括表示域、信息域、合同域、工作流域、数据域、员工域和供应链域。表示域是由 ISLA 门户激活的,它负责提供实现工作流任务所需的统一接入、社区管理、安全、通信以及人机接口的表示(或 GUIs)。信息域是由商务智能模块激活的,它负责存储、提供、管理表示域所需的信息。合同域是 ISLA 框架的大脑,它需要搜集不同系统的语义描述,组织成对产品和服务的统一理解信息,其中包含具体的与 SLA 条款相关的信息。它通过与数据域集成从技术层面和语义层面与其他 OSS 相连。工作流域是 ISLA 模型的核心部分,它由高级工作流自动控制系统激活,负责工作流的管理、建模、编辑、报告以及任务级的管理响应。数据域由综合服务器激活,负责管理 ISLA 框架不同的 OSS 和其他电子接口间的电子数据的转换。员工域负责管理工作流的人力贡献。供应链域负责管理资产、存货等,它需要依靠一个外部 OSS 实现其功能。在 ISLA 框架中各部分的具体实现中,可以采用 DHTML,XML 和 Java 等动态软件技术开发系统,硬件的实现需要有多个服务器来支持,如应用服务器、HTTP 服务器、数据库服务器等。

实现框架

几乎所有的 SLA 的实现都是以 TMF 的 SLA 管理手册为基础的,不同的 SLA 实现模型有不同的侧重。有的面向客户,侧重于客户所关注的问题;有的侧重于对网络的监控。国际上比较典型的以客户为中心的 SLA 模型是 Amdocs 公司的 SLA 蓝图,以网络为中心的 SLA 模型是 Micromuse 公司的 Netcool 套件和 Orchestream 公司的 Resolve 产品套件。分析上述两种 SLA 模型的侧重点可知,它们分别侧重于客户和网络性能,但在 SLA 的具体实现中,这两者都很重要,应合并在一起提供更全面的 SLA 管理。另外,无论在面向客户还是面向网络的模型中,有效的业务流程都是一个非常重要的方面,在 SLA 实现中也应重视。因此,需要一种综合 SLA 模型。这种综合 SLA 模型采用分布计算技术、工作流技术、商业智能和门户技术而形成的,图

即为综合 SLA 实现框架。该实现框架分为以下五个主要部分:

集成

对于集成来说,由于集成的是各自独立的 OSS 子系统,而各个信息系统是解决特定的领域问题,因此导致所采用的软件体系结构、实现语言、对外提供的集成点(集成点是指外部系统通过它能够进入应用系统从而能够访问数据和调用功能)及交互协议各不相同,这就导致了分布应用集成的复杂性。依据集成点的不同,通常将集成层次从低层到高层分为传输机制、数据集成、接口集成、过程集成。传输机制层是分布应用集成的基本层次,它提供在两个或多个集成点间连接和移动数据的传输渠道。分布应用集成可以利用建立在协议层上的两个系统共同定义的协议来交换数据或利用更复杂的传输机制,如消息队列等,传输机制层的前提是在传输层上连接多个系统,其方法包括 IP、FTP 及特定的通信中间件(如 Message Queue,EventMiddleware)。数据集成层是建立在传输机制层上,超越了只是简单地在两点间传输数据。数据传输和转化只是数据集成层的基本功能,要成功实现两个子系统间的数据集成,还必须解决应用系统访问、应用句法和应用语义三方面的问题。数据集成层的目标是解决上述三个主要问题,采用的技术可以归纳为数据集成适配器、数据转换框架、数据改变服务及数据集成规则四个方面。接口集成层主要是针对业务逻辑层而来的,允许应用系统间的业务逻辑共享。从另一个角度来看,分布应用系统更多地采用组件结构,因此这一层也称为组件集成层,接口集成的核心是使用分布组件封装应用系统的业务逻辑,通过远程方法调用业务逻辑。 EJB、CORBA 和 COM+是支持接口集成的三种技术。过程集成层是集成的较高层次,它实现面向过程的集成。过程集成的对象不是物理实体而是过程实体,它集成的是由活动驱动的业务过程,BPM 是过程集成管理工具。关于使用 CORBA、消息中间件等进行 OSS 子系统的集成的具体实例和框图由于篇幅有限,这里就不叙述。

工作流管理

工作流管理的核心是工作流管理器,工作流管理器从工作流建模工具中导入过程模型并对其进行解释和处理,生成计算机可管理和执行工作流执行模型,并通过工作流管理工具实现对工作流的管理和维护。建模工具为客户提供一种对实际业务过程进行分析、建模、描述并记录的手段,生成业务过程的能被工作流动态解释、计算机处理的形式化描述。工作流管理器由一个或多个工作流机组成。工作流机是一个为工作流实例的执行提供运行环境的软件服务,它是业务管理流程的任务调度器,也是网络资源的分配器。工作流机的七个主要功能是:

解释过程定义,创建工作流模型;

控制工作流实例的生成、激活、挂起、终止等;

分配角色,控制活动实例间的转换,包括串行和并行的操作、解释工作流相关数据等;

维护工作流控制数据和工作流相关数据,在应用和客户间传递工作流相关数据;

生成任务项并填写有关客户的任务表,由任务管理器统一管理与客户交互通知;

提供一个激活外部应用程序和访问工作流相关数据的界面;

提供管理员控制、管理和监督的功能和界面。

协同管理

系统间的集成是基础,其更高的层次是在集成的基础上实现协同管理,协同管理包含必要的功能来协同多个系统实现协同的问题解决和提供整体的服务。协同功能控制各个集成系统的执行,管理各个集成系统间的数据流;监控功能订阅各个集成系统产生的事件和信息,并产生更高层次的事件和信息;QoS 包括成本、性能、安全、可靠性、可扩展性等信息,工作流系统已扩展为一个协同模型,其具有良好的协同性能。网格技术及 SOA 技术是与分布应用集成协同管理密切相关的两个不同的研究方向。网格技术的目标是协同多种资源解决复杂的科学问题,而 SOA 作为一种新的集成模型,在协同方面更注重协同服务组合。

商业智能

商业智能通常被理解为将企业中现有的数据转化为知识,帮助企业做出明智的业务经营决策的工具,商业智能的建立步骤为:

识别和确定数据源;

进行数据集成和存储管理;

数据分析和建模。

为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。因此,从技术层面上讲,商业智能是数据仓库、OLAP 和数据挖掘等技术的综合运用。

统一接入的门户技术

统一接入的门户给服务提供者和服务使用者提供一个统一表示呈现,它提供的功能有用户验证和配置、图形化工作流编辑器、工作流执行和资源信息的查看。用户验证是门户技术的基本功能,用户配置功能管理配置环境、用户验证创建、修改和查看;图形化工作流编辑器能通过图形工具或基于 XML 编辑器描述工作流,首先定义活动和它的输入/输出数据,用户通过使用工作流描述活动的交换作用,用户能通过定义活动和输入/输出数据用工作流编辑器编译活动;在编辑完活动和数据后,进行工作流的执行,用图形化方式显示执行工作流的状态,显示活动的执行、输入/输出数据传送的状态、工作流变量的值,运行着活动的输出/错误;资源信息的查看功能让用户发现资源信息诸如 CPU、文件和网络状况等。