西数超哥博客
运维经验教程分享

智锦:金融级运维PaaS平台实践

2018年3月21-22日,由中国信息通信研究院主办、中国通信标准化协会支持的”OSCAR云计算开源产业大会”在国家会议中心举行。

银行业云计算发展论坛作为大会分论坛之一,于22日下午召开。

李晓枫:感谢小袁的介绍,过去我们只管应用端,一旦介入到开源,稳定很多,结合你的要求来定制开发,深入开发。所以为什么银行上云走的路坎坎坷坷,就是这个道理。

下面我们请演讲嘉宾云霁科技创始人智锦先生给我们介绍金融级运维PaaS平台实践。

以下为演讲实录:

智锦:我今天主要分享一下运维和私有云、行业云。我们公司在互联网体系、行业体系做私有云、行业云,我们发现目前银行业上云两个问题。

第一个问题,传统IOE架构存量资源很大。传统IT资源和新的私有云、公有云多云统一管理需求非常强,用户希望在传统资源和云资源之间自由切换,让业务按需使用。

第二个问题,运维。我们上云之后发现银行体量很大,云计算解决IaaS层的问题,到业务运维,包括流程数据相关,复杂度也相当高。我们现在是两块方案,一块是多云管理平台,一块是运维PaaS平台。现在服务的机构也是大中型金融机构。

我们分析运维这个问题,其实整个金融行业对运维这个东西一直重视度很高,过去十来年投入也非常大,但是我们会看到这样一个问题,之前的运维体系按照专业做分割,在IT里面分类非常细,从底下机房管理,机房环境风火水电,再到上面的资源管理,再往上是系统平台管理,类似于操作系统数据库、中间件,既可以跑在公有云,也可以跑在私有云,跑在传统环境之上。再往上是应用管理,顶层是IT服务管理与运营,包括监控、故障、应急体系。我们发现,现在IaaS层面上云之后,解决的是最底下不用自己建数据站,更方便的方式管理这些虚拟机,往上系统平台到应用管理和IT服务管理,这三方面情况并没有因为上云问题就得到解决,反而因为上云之后带来了异构资源和虚拟机几何倍数增长,挑战反而是大事。

以前银行体系搞运维,流程是一块,监控系统、自动化系统,中间是配置管理,这套体系一直流传了很长时间,我们发现实际过程中落地效果并不是非常好。主要原因是系统体系按职能按专业建设的,落地过程中遇到一堆分散工具,导致职能分隔,监管控割裂,碎片化。

传统云计算里面,IaaS、PaaS、SaaS是大家很熟悉的三个体系,把PaaS平台再细分,更多面向业务提供服务,比如分布式,比如平台框架。运维PaaS我们希望能够把之前所有的运维工具整合在一起,自上而下构建平台,包括把最佳实践、体系、管理职能变化、数据整合变化反映在里面。所谓运维PaaS,要把流程数据整合在里面。云和非云资源统一管理,集中式分布式统一的管理,我们希望形成私有云和行业云门户,入口是一个方式。往下屏蔽硬件差异,往上可以支撑不同架构的业务系统,集中式也好,分布式也好。

现在双模架构传统是一块,分布式是一块,我的业务可以分两种,资源也可以分两种,但实际上管控体系和流程是统一的,这块很难分割。

这是我们现在提的运维PaaS思路,并不是说想要做新平台替换所有前面这些平台工具,以前工具系统都是自成体系的,局部应用效果还行,但是想要互联互通是很麻烦的事。现在我们提的思路是,通过平台化、场景化、自服务,自组织方式,整个运维PaaS平台运维门户是统一的,之下可以根据不同业务场景细分。再往下我们希望把交互层、处理层、数据层统一,最底下通过分布式API,提供业务能力,对外提供服务。在数据流程和业务层是集中式的,但是在实践,包括底层调用分布式,这是运维PaaS平台。

其实它还有另外一个思路,以前在传统监管控体系遇到很大的问题,选工具之后就会遇到工具封闭性,定制化的问题,怎样按需定制,前些年一般银行是买商业软件,这几年随着开源兴起以后自主可控开发,但自主可控也有这样的问题。整个金融行业运维需求比较强,每家去开发自己的运维平台,这个事情实现起来难度不太大,但我们发现长期维护成本非常高,主要是平台应用之后演进升级是很关键的事。我们现在提的思路是希望通过行业协会的力量,能够把最佳实践提炼出来,这是OSCAR做的事。我们希望取一个点,在底层公共框架提供业务,公司集中去做。但是在业务层,我们希望把它变成用户互动参与,按照自己需求做开发,实际上运维PaaS平台意思是组建平台,是公用的,业务层和逻辑层用户可以自行开发的方式做这个事。

这是一个全景图,基于运维PaaS平台构建一体化管理平台,这里就打破了过去的监管方式,强调以服务作为导向,最上层是服务目录,我们可以把IT里面所有的活动转变成服务。比如说专业服务,数据存储网络,包括私有云里面对于生产数据中心提供服务,包括行业云对外部租户提供服务,这个服务背后是通过流量管理、获客管理、自动化运维、监控,我们把流程、多元适配、数据管理、通道管理都做了分层方式。自动化部分我们既支持传统的DMC,也可以支持第三方开源软件,我们通过这种方式以服务做导向,把组件、数据、平台分割,构建出一个适用于不同环境不同用户的需要。

开源之后大家很关心如何选择开源软件,puppet体量比较重,saltstack兴起之后,可以支持有代理或无代理的方式,这也是比较好的点。ansible用的人也比较多,特点是易用性很好。经过深入分析之后,ansible不用装客户端,便捷度非常好,但会存在两个问题,一个是基于无客户端方式之下,在大型的数据中心很明显,性能会有影响。通过密钥的方式,用户需要自行解决密钥安全性管理问题,风险较大的。所以现在我们一般建议四大行这种复杂环境,确实很复杂,用ansible安全度比较好。像X86可以根据自己的需求选择一个方式。

我们希望以应用作为一个方式,整个私有云、行业云应用架构,部署架构,网络架构,我们希望可视化方式给用户展现。希望未来行业云、私有云,我们的运维不再是执行命令,而是希望将来变成一个在两种体系之上做动态维护的关系,自动化的方式下发。可视化配置管理,和自动化进行连通。这是自动化底层方式,这块我们现在看的也很清楚,之前的自动化更多是操作自动化,提供自动化工具。现在私有云和行业云之下,更多是需要用户把自动化封装成服务,这个服务可以给不同级别的用户去使用,甚至可以通过行业云给租户提供管理方式,着眼点不在于如何实现它,而是分层服务化。

这是复杂作业编排,银行里面有复杂业务,涉及到从数据存储网络到应用,到跨数据中心,我们帮助客户把它变成工作流,尽可能是自动化方式,但也支持复杂系统,它不是数字化,可以是人工的方式。最后,根据大银行经验总结,这里的需求很大,涉及到从各个工具专业到流程,到技术体系,管理思路也都不一样。我们觉得这个事情一步到位做运维体系运维平台是很难的事,我们建议客户分四个阶段做这个事。

第一个是操作平台,把巡检、安装、部署耗人工的方式做这些事情,把精力腾出来做上面的事情。第二个是统一管理平台,小型机、X86服务器、虚拟机IaaS等多种资源,建立基础设施云,统一管理异构资源。第三个是服务平台,我们需要通过devops理念,运维工具整合在一起,最后以IT作为服务交互方式对外提供,这是服务层的事情。最后是运营层,如果我们做私有云,做到体系化运维就差不多了,但如果做行业云对外服务,这个时候需要运营平台,我们可以支持私有云和行业云,把这套体系以服务化方式对外提供,包括计费计量和成本中心。这是我们分析运维的发展,从单点工具走向平台体系,从运维工具走向运营平台,特别是今天银行业成立云服务公司情况下,运维的服务化比以前是更加重要的事情。谢谢大家!

赞(0)
声明:本站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,若涉及侵权请及时告知,将会在第一时间删除。本站原创内容未经允许不得转载:西数超哥博客 » 智锦:金融级运维PaaS平台实践