跨平台批量调度的实现及其与业务连续性的关系研究?技术应用栏目编辑。梁春丽E-mail:lianglizi505@l63com中国银监会信息中心张金棋一一随着我国金融服务行业的蓬勃发展,银行规模不断扩大,数据集中程度不断提高,数据中心承载了更大的运行维护压力,后台批量处理的可靠性将直接影响数据中心的业务连续性管理水平。目前,数据中心在批量处理方面需要应对较多难题。首先,联机交易量的井喷式增长引发了巨大的数据吞吐,批量处理的压力日益增大,时间窗口显着缩短,批量处理对联机交易的倒逼压力逐渐形成。其次,批量处理的流程日益复杂,操作人员需要维护的批量作业规模不断扩大,操作风险逐渐显现。再次,业务种类不断创新,业务流程日益精细,批量处理的关联关系愈发复杂,分散式的管理方式容易诱发各类潜在风险,实现批量的集中统一调度刻不容缓。最后,业务需求和技术架构日益复杂,传统的后台环境融合了大量新兴的系统平台,形成了包括Z/OS,Unix,AS/400,Windows,Linux在内的多种平台共存的局面,仅从某个应用或平台的角度出发很难管理全部业务流程,批量处理的跨平台问题El益突出。为了解决上述问题,数据中心正在积极寻求技术途径,实现批量作业的跨平台统一调度。
目前业界正在推广的技术解决方案主要基于IBMTWS(TivoliWorkloadScheduler)以及BMCCONTROL—M等工具。本文从技术实施的角度介绍如何利用IBMTws实现跨平台的批量调度,并分析跨平台批量调度和业务连续性之间的关系。86』2011期欢迎登录本文从技术实施的角度业务连续性之间的关系。二,技术实现(一)实验系统架构根据实践经验,大型数据中心的核心系统通常运行在Z/OS主机平台上,外围系统运行在各类Unix/b平台和Windows/]E务器上。基于TWS的跨平台批量调度系统以主机平台为核心,由主机平台上的TWST_具集中调度主机平台以及其它外围平台上的所有批量作业,实验系统的架构如图1所示。系统在逻辑上由两级域构成,分别是主控域(MasterDomain)和子域(DomainA,DomainB)。包括了三类功能单元:主控域管理器(MasterDomainManager),集中管理所有需要调度的批量作业,部署在主机Z/OS平台上;域管理器(DomainManager),把主控域管理器生成的批量计划文件下发到需要控制的所有系统平台;容错探针(Fault-TolerantAgent,FTA),指需要运行批量作业的各系统平台。
(二)实验环境配置实验环境由三大类系统平台组成,一是主机平台,用作主控域管理器,硬件可选择IBMZ系列主机,建议采用业界常用的并行耦合体(ParallelSysplex)部署结构,安装TwsForZ/OS8。2或更高版本的工具软件;二是开放平台,包括两个域管理器和两个容错探针,硬件可选择IBM,H趿SUNzb型机,全部安装TwsForUNIX;三是Windows平台,包括两个容错探针,硬件可选择IBMPC~JE务器,安装TWSForWindows。【部稽结构lAIXJ~放P台WindowsJ]~务器IFTA-1FTA。2IWindows~务器SUN开放甲台IFTA。3FTA-4………一一跨平台批量调度系统架构此外,在一台PC服务器上安装TWSJSC(JobSchedulingConsole),与主控域管理器连接,为用户提供基于Windows的可视化的操作界面。(三)系统客户化在实验系统的客户化方面批量数据上传业务意思,主要有以下一些实施要点。1。配置通信参数在主机平台上配置TCP/IP和IPSEC等参数,为各个平台分配统一的网络端口,在路由控制上保证各平台间的网络双向联通。在主机平台上配置用以兼容UnixOMVS环境,保证主机平台和开放平台之间TWSI信正常。
2。配置域拓扑结构在主机平台上配置各个域的拓扑结构,如系统名,操作系统版本,IP地址,网络端口等,以便主控域管理器定位所有的域管理器及容错探针。3。设置用户权限主控域管理器在调度各个容错探针上的批量作技术应用?研究栏目编辑梁春丽EmaiMianglizi505@l63corn业时,会附带一个处理批量作业的用户,此用户权限应按照"最小授权"原则,能且仅能处理权限以内的批量作业。4。实现系统高可用性主控域管理器部署在主机平台上,采用动态分配虚拟IP地址等技术,同时依托主机平台的ParallelSysplex结构,保证主控域管理器具备高可用性。两个域管理器部署在开放平台上,采用HA技术,保证域管理器具备高可用性。(四)批量作业调整为保证批量作业在功能逻辑上符合跨平台集中调度的要求,需要对批量作业进行一定的调整,调整的原则是"顺序分拆,功能明确,信息量化,纠错统一"。具体的将原先较为复杂的批量作业按照流程顺序分拆成若干功能明确的子批量作业,子批量作业以数字返回码的方式向所在平台上的TwS工具反馈作业执行结果,最后由用户在主控域管理器按照统一的标准进行纠错控制。(五)实验测试流程设计一个比较典型的跨平台批量作业测试流程,共有7个批量作业,其中主机平台2个作业,开放平台3作业,Windows平台2个作业。
在没有实施跨平台调度之前,批量处理顺序如图2所示。流程中存在7个手工中断点,在图2中用数字圆圈标注,每个中断点均需要操作人员人工判断作业执行情况。为实施跨平台批量调度,对部分批量作业进行了分拆调整,调整后批量作业数量增加为10个,人丁干预个减少为零个,批量处理流程如图3所示。(六)实验效果在实现跨平台批量调度之前,操作人员无法集中调度各个平台的批量作业,批量处理中需要大量的人工干预,时间延迟较长,出现操作风险的几率也较大。在实施跨平台批量调度后,批量处理不再需要人工分散干预,用户完全通过Tws工具实现批量的自动化处理和集中控制,并通过运行在Pc服务器上的JSC实现更为良好的可视化操作。基于TWS的跨平台批量调度系统还可提供一些附加功能。例如,与主流报警平台无缝对接,提供异常事件的实时报警;监测批量处理压力及时间窗口,实现早期预警;提供较为完善的报表功能,实现批量处理的统2011期欢迎登录w。jrdn。on『87研究?技术应用栏目编辑粱春丽E-mail:lianglizi505@l63corn调整前的批量测试流程计,分析和审计等。三,跨平台批量调度与业务连续性的关系在大型数据中心的工作实践中,跨平台批量调度有更为广泛的现实意义,对于提高数据中心的业务连续性管理水平有重要意义。
(一)规范操作流程,提升运行维护自动化水平和降低操作风险通过实施跨平台批量调度,可以在统一的技术框架下,实现对不同系统平台下批量处理的标准化管理,按照统一的技术标准制定覆盖所有平台的运行维护管88f2011调整后的批量测试流程理流程,解决以往因平台不同和技术不兼容而导致的流程异构和制度繁杂等问题,改变以往分散管理的被 动局面,实现操作流程的规范化和标准化。 在跨平台批量调度系统中,批量作业以自动化调度 处理为主,人工干预和信息判断的环节大大减少,避免 了因误操作和处理不当等人为因素诱发的系统异常,提 升了运行维护流程的自动化水平和安全等级,降低了操 作风险。 (二)优化资源配置,提高运行维护可靠性和增强 整体控制能力 通过实施跨平台批量调度,可以减少操作人员的 手丁操作数量,降低工作复杂度,为进一步优化人力资 源配置和提高人员技术水平提供了条件: 利用跨平台批量调度系统提供的实时监控和报表 分析等功能,可以解决以往存在的批量监控手段贫乏 和批量故障响应不及时等问题,实现对事前,事中和事 后等所有环节的全面控制,提高运行维护工作的可靠 性。利用丰富的系统资源,深入开展对批量处理的流程 审计T 作,及时发现流程中存在的各类风险隐患,制定 并完善相应的应急预案和业务连续性计划,增强信息 系统的整体控制能力。
(三三)实现技术创新,完善准人制度 通过深入研究跨平台的批量调度技术,探索技术 转化的有益途径,可以不断创新运行维护的技术手段, 逐步建立起跨平台的各类运行维护标准。 在此基础上,可以有效梳理批量处理和联机应 用的关联关系,将两者视为一个有机联系整体统筹 考虑,在应用系统J:线投产前提出具有针对性的批 量处理要求,完善应用系统的准入制度,解决由于批 量流程设计不完善而引发的各类投产问题,提高新上 线业务系统的连续服务能力,增强信息系统的整体管 理水平。 (四)满足监管要求,健全管理机制和提升核心竞 跨平台的批量调度系统可以帮助数据中心更好地提升工作水平,以满足监管部门的相关要求。 在中同银监会2010 年下发的《商业银行数据中心 监管指引》第四章"运营维护管理"中对于运行维护 操作有明确的要求,即"应统一调度各项运维任务,协 调解决各项运维任务冲突"。通过引入跨平台的批量 调度技术,可以帮助数据中心建立起更为先进的运行 维护管理理念,健全管理机制批量数据上传业务意思,全面实现运行维护工 作的统一调度,切实降低各项运行维护任务发生冲突 的可能性:实施跨平台的批量调度,不仅可以提升数据 中心的运行维护水平,而且可以有效提升联机应用系统 的后台支持水平,增强业务连续性管理水平,从根本上 提升核心竞争力。
在巾同银监会2009 年下发的《商业银行信息科技 风险管理指引》第七章"业务连续性管理"中规定"商 业银行应根据自身业务的性质,规模和复杂程度,制定 适
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。