西数超哥博客
运维经验教程分享

陈炜:多云时代:挑战多维一体化管理

2018年3月21-22日,由中国信息通信研究院主办、中国通信标准化协会支持的”OSCAR云计算开源产业大会”在国家会议中心举行。

混合云论坛作为”OSCAR云计算开源产业大会”的分论坛之一,于3月21日下午召开。论坛邀请到了中国信息通信研究院、华云数据、中国电信北京研究院、华为、云星数据、广东电信、云霁科技等单位的专家,与大家一起开启一场深度的混合云之旅。

云霁科技合伙人兼CTO陈炜应邀出席会议,并带了《多云时代:挑战多维一体化管理》的主题分享。

以下为演讲实录:

陈炜:今天很高兴有机会跟大家分享一下我们对在混合云时代多云情况下多维的一种条件下的一体化管理的一种思考。

今天的环境非常好,从信通院、研究院的老师给我们介绍整个行业的标准发展,然后再到电信、华为等介绍了云生态的一些东西,包括云网融合的东西。还有行业伙伴介绍了云管的发展历程。我今天作为一个最后的演讲者,我讲我们对多云时代挑战下的一种思考,一种方法论下的一种最佳实践,来跟大家分享一下。

云霁这家公司,其实聚集于做IT管理。所以说,无论是云,还是非云,或者说我们现在的多云情况下,我们关注点就是怎么样帮助用户更好的做IT管理。首先大家都知道,现在其实是一个最好的时代,我相信在座的,在我们这个场地里面的都是从事这个行业的人。云时代给我们所有从业者都带来了前所未有的机遇,包括以前的IT可能在技术团队,或者在整个公司里面都是一个成本中心。但是现在IT团队是一个非常有利的产品或者说业务的一个驱动中心,而不是单单的成本中心了,无论是金融行业,还是在电商行业,因为我本身在电商行业,金融行业整个过程待了十五六年的时间,很明显感受到这个变化,从我的感受非常感谢这个时代。

当然,这也是一个最坏的时代,为什么?选择太多了,技术上太长了。以前刚做技术的时候很简单,那时候老板说,你能把Linux搞定,能把PaaS搞定就可以了。或者说歇一歇脚本和代码就可以了,但是现在不一样,IT人员需要做各种各样的学习,非常常见的学习。所以,我解释为叫做长链、多链、跨链,有点像现在的区块链。长链的技术站很长,包括我们做IT管理也知道技术站非常长,从底层的基础设施开始,存储网络系统,应用数据流量,当然其中也隐掉了很多,链条非常长。

为什么现在很多创业团队,或者有些公司在提全站工程师。因为那么长的链条下要很多团队协作配合这个难度越来越高了。所以,我们需要全站,什么都懂,一个人就能搞定,多好,这个其实来说是可遇不可求的,而且组织壮大之后,这个很难搞的。

多链就是长链太多,这个成本又多了,几何级的往上涨。而且跨链可能在裸金属上也有,在私有云上也有,公有云上还有数据,流量可能是通过私有云跑一部分,公有云又帮我做一个CDN或者怎么样。这些东西又是在跨链的情况下,所以这是一个多维的IT管理的时代,确实来说对大家的挑战,也是有很大的促进。

所以,基于这种考虑,我们也会想怎么样应对,因为我刚才说的,一家作为IT管理的公司,怎么样应对这种挑战。我这边引用了一张DNA的图当做背景,DNA大家很清楚,两条染色体链,有点像我们的多链。但是,DNA就是描绘我们这个人应该长成什么样子,有什么性格。所以,我们把它认为最终你的链条要产生价值是什么?就是蓝图。就是定义你的业务也好,或者定义你的IT是一个什么样的状态也好,这是一个蓝图。最终定义这是我们的基因。

然后,序列。就是碱基排列的序列其实就是基因的编码。这就需要一种编排的技术,一种编码的技术,我们需要有编排的能力。然后,碱基对是什么?就是把两个基因链紧紧的扭合在一起的一种力量,我们叫抓手,能把两个链抓到一块,把两个链有一个结合点,不然永远是平行的。然后,我们往往说的基因,就是你有什么性格,或者你的容貌长什么样,每一种特质其实是一种基因片断,就是一类管理能力,或者一类抓手的一个集合,我们把它定义为平台,比如这一类,我们定义为平台。然后,这些东西最终会形成一个双螺旋的结构。

双螺旋是什么?首先,长链缩短了,大家知道造高架,就是进程缩短了,效能也提高了,占地面积也小了,所以双螺旋是高效能的一种结构。所以,基于这样的考虑,如果要解码长链、多链、跨链的状态,我们需要有一种类似于生物精华过渡形成的生物选择最佳的一种实践来描述我们最终提供的价值蓝图,这是我们做一个比喻,也阐述一下我们怎么样来应对这种多维挑战下,还要形成一种一体化的服务,这是一种理念。

所以,基于这种理念,我们也在想怎么做这个事。所以,基于刚才这些领域我们有一些思考。讲这个图之前,我讲一个小故事。就是前几天我们也有一个客户来问我说,现在有那么多云,我还有很多大部分是传统的业务,因为大部分客户是双模。这个也有,那个也有,我始终没搞明白我的业务没有长什么样子,我的业务架构只知道一个大概,很难描绘出一个很准确的东西。其实我上那么多云,对我来说价值在哪里。所以,他其实需要有一个东西帮助他描绘到底要提供什么样的业务,提供什么样的价值,给我的公司,给我的产品。

所以,结合这个例子,也是拿这个东西跟他交流。我跟他说,第一点,我还是一定要做一个混合云。为什么?如果你不能做云,代表你无法收敛。云其实就是自上而下收敛的一个过程,先做IaaS,再做PaaS,再做SaaS,从基础设施开始收敛,再到上层的平台,再到服务,你的分布式,各种服务的一种治理的收敛,你从下往上一定要有一个收敛的过程。比如我没有收敛,你上云其实也是一个半吊子。但是,你不能不开始这个过程。所以,你一定要先从混合云开始做。混合云就是现在类似于一些厂商提供一些管理平台,把机器管起来,或者传统的私有云也管起来,公有云也管起来。然后,上了混合云之后就开始了一个收敛的过程,从IaaS开始有一个收敛过程。中间我们可以帮助你做很多事情,你也可以借着这股劲去推行你的各种各样的标准,各种各样的收敛规范。所以,混合云一定要上。上了混合云之后一定要有能力抓手,像碱基对要有平衡性。

能力抓手简单来说分为两种,一种叫做资源,资源的管理。也就是常见的、狭义的云管理,混合云管理平台,我们把资源管理起来。其次,数据中心里面除了资源,抽象的各种资源,软件定义的各种资源之外还有什么,就是你的操作运行,或者说你的过程,这就是你的第二个抓手,怎么样在混合云的情况下做自动化的运行管理。数据中心里面除了资源、运行的东西之外还有什么?就是数据。当然,这个数据不是指业务数据,业务数据是另外一个平面的事情,我们现在讲混合云管理,你的数据需要通过一个数据纽带,要有一个跨云的数据管理的一种能力。数据纽带之后比如有两个抓手,然后有一个收敛的过程,这个事就是一个很好的开端了。然后,在这个上面,这些资源也好,运行也好,包括数据,你要交叉进行编排,整个序列的编排、编码转录的过程,所以要有编排的一种能力,在这边。然后,在上面长出很多很多的字符闭环。刚才哪位嘉宾也提到了闭环这个词,我是一直很喜欢闭环这个词的。为什么?就是一旦你的整个自动化的进程,包括了资源和操作,形成闭环之后就代表它是个标准过程。一旦你的准过程,标准闭环越多,你的整个服务能力,你的整个IT治理能力就越强。当然,这肯定要基于一堆这种我刚才说的片断来组成。然后,这些闭环的支撑之下,你就可以去定义你的顶层设计。这个时候你用的时候是自上而下的用的,你建设的时候是自下而上的建设的。当然,在某些垂直链路上是可以自上而下直接就建,但是你想一下子自下而上全部建完不太可能。所以,建的时候我建议它这样走,用的时候肯定是往上走,因为最终想要的是说,我可以来描绘我的业务是一个什么样的状态,我的架构是怎么样子的,我最终落地的是一个什么样的状态。

所以,我当时也是像今天这样跟他做交流的,其实最后他是这个其实也是我想要的东西。我作为一个管理者,或者说我作为一个架构的设计者,我是很希望有这么一个东西,最终来帮助我来管理好我的IT系统。

所以,其实对于我们来说,我们就是想构建一个以应用业务为核心视角的,自上而下构建一个一体化的多元云管理平台,是一个广义的东西,不仅限于云的管理,主要是聚焦在多云情况下的多维的IT管理。

基于刚才的一些方法论,我们也设计了一个,就是我们自己内部的一个系统的逻辑图。当然,这个只是D0层的图,就是最粗的图,再细的图,1层,2层会有更多,那个太大了,很难展示。当然,这个图里面有些元素没有包含,像安全。因为我认为安全是个非常专业的领域,而且一般来说我们面对的客户群有专门的安全团队来从事相应的事情。所以,我们暂时是没有包含安全这个大领域的。所以,底层其实刚才很多也讲了,这个东西就是我们现在一些资源池,包括一些网络的东西。这个就是你要做多云管理,肯定要有适配层。刚才华为的高老师也讲到,我们接生态的适配完整,北向接口不好,所以我们这边有执行通道。当你不完整的时候我要通过我自己的执行通道通过各种方式去完成最终用户的一个诉求。所以,适配归适配,适配偏差的东西我们一定要有一个通道,我这边只是列了一部分。这就是厂商在面临客户的时候,客户是不会管你生态健不健全,就是要做管理,所以必须有这一层通道,这个通道里面的内容很多,我们也希望这层能够越来越强大,我们少做一些事情。所以,如果高老师这边做的越哈,我们压力也会轻一点,也是OpenLab的一个东西。

往上走就是各种调度,从规则,到流程,到各种任务的调度,编排的一些隐形的东西,这些很多都做过,包括一些有资源的管理,配置库的东西,就是刚才说的跨云的数据,而不是以前有些用户历史比较长,可能系统里面光配置库就有四五个。所以,一定要有一个具备数字交换能力的,具备翻译能力的一个云配置库给他,而且最好有可视化的一种选择。

然后,网上就是列一些管理的闭环,比如自动化闭环,资源管理,流量管理,应用管理。当然,这些是比较粗的,往下还有很多东西,还有监控。云服务目录,其实刚才有些专家也提到过,云服务就是最终我们交付给用户的,用户其实最终不关心资源,资源是传统的一种玩法,到最后肯定是我是要申请一个性能怎么样的。或者发现一个安全漏洞,需要通过你的能力去完成一个打补丁,这是一些专业的服务目录。然后,DCOS,我们的一个应用全景,构架在一个应用环节之上,最终很多用户可能从这边往上调度各种各样的资源。结合这个方法论我们对我们的产品做了一个描绘。

接下来看一下我们的最佳实践。应用全景图的一种展示,比如可以看到它的应用逻辑架构,依赖哪些东西,它知道之后就往下赚取,比如某一个应用下面部署情况是什么样的,部署逻辑是什么样的,哪个数据中心下面的哪个地方是双机的还是单机的也能够比较明确的去展开,去看到。最后看到网络在哪一层,是内网还是DMZ,还是安全域。这三点是很清楚的,从架构管理角度已经很清晰了,要动任何一个东西就很清晰的知道。比如某一个应用的关联关系要改了,我的某个应用要扩容到百分之多少,然后从下往上通过这些能力编码分解下来,到最后变成一个很多的实现,所以是从全貌开始,是一种DNA的解码过程。

这是刚才说的配置管理的一些东西,也是可以可视化的展示。这是云的适配的资源的管理,有物理的,有裸金属的,也有私有的,也有共有的,这其实是方便的一个管理。这是裸金属的管理,包括巡检都是可以完成的,这说的是一些自动化作业,有些通过SDK不能完成,但是你的双模又需要,我就跨平台可以给你做到一些时间管理,内制参数。

这是编排能力,这边举的例子是一个业务的切换,其实它的链条很长,甚至有人工会参与进去,因为一些金融机构要做切换有些地方是比较保守,所以整个链表是很长的。当然,能做到可视化就比较安心,而且重复执行的时候有依据。给大家个服务目录发布出去。

所以,总的来说就是说,基于现在这么一个混合多云、多链条、长链、跨链的状态,我们是希望构建一个一体化的云管理体系出来,把这个云管理体系能够形成产品给到用户,能够支撑IT管理方方面面生命周期的管理的维护。然后,就是说通过我们的能力,最终能够让他们把生命周期管理起来,让他们运行保障也好,相当于比原来更好的不会被多云的情况受到这种干扰。我们也提到后面的IT技术人员,最终是要能力开放的,以前是说抓了这个资源不放,就是这个资源入口,要依赖我,但是未来肯定不一样,我要做运营者,要做一个开放平台,我要给你提供价值,驱动你的业务。所以,这也是我们想构建的一个体系。

今天讲的快了一点,因为时间比较晚了,大家听了几个小时比较累了。所以,今天主要分享就是我们在多云情况下,我们的一种想法,我们的方法论,以及我们自己的实践。然后,我们在大会也有展台,如果有更多交流可以到我们的展台上进行交流。感谢!

赞(0)
声明:本站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,若涉及侵权请及时告知,将会在第一时间删除。本站原创内容未经允许不得转载:西数超哥博客 » 陈炜:多云时代:挑战多维一体化管理