西数超哥博客
运维经验教程分享的博客

【2018亚太数据中心峰会】张静:企业数据中心建设实践分享

在过去的2017年,亚太地区的数据中心市场增速接近15%,领先于全球其他主要地区,与整体经济增长水平保持同步。区域内多元化的经济体发展特征使各国数据中心市场形成了鲜明的差异,以香港、新加坡为代表的成熟市场保持稳定增长,而以印度、印度尼西亚、为代表的新兴市场则呈现出强劲的增长动力。

2018年5月15日-17日,由中国IDC年度大典组委会主办,中国IDC圈、CloudBest承办的”2018亚太数据中心峰会”在深圳盛大召开。

5月17日,”2018亚太数据中心峰会”正式召开,深圳燃气集团信息部副总经理张静在现场进行《企业数据中心建设实践分享》精彩分享。

【2018亚太数据中心峰会】张静:企业数据中心建设实践分享 idc资讯 第1张

深圳燃气集团信息部副总经理张静

以下为演讲实录:

张静:大家好,刚才胡主任讲了非常多的数据中心宏观的层面,我这个非常微观,就是作为一个用户来说,我们在面对数据中心的问题的时候,我们的考虑。前两年我们刚刚经历了整个完整的数据中心的规划建设的过程,所以在这里跟大家分享一下,也是从用户的角度来看待企业级数据中心的事,希望大家有所参考。

我个人经验基本上都是在甲方公司,基本上是做信息化的建设及管理工作,目前是担任云计算及政策论坛的用户和中国互联网安全大会的行业委员会专家,希望和行业的同仁有些交流。深圳燃气实际上是城市燃气公司,我们主要的业务是两个,一个是管道的天然气,还有一个是瓶装石油气,大家都有接触,是传统的企业。我们总部在深圳,我们在全国28个省市都有项目,相当于一个全国性公司。管道气的用户接近300万,瓶装气用户接近125万,大概服务的人口超过了一千万。

说到数据中心的建设,为什么建数据中心,作为燃气行业给我感觉这么多年来,实际上行业的信息化正在加快。最近几年很多同行开始信息化建设,信息化建设意味着要建立大量数据系统,同时也会有大量数据的存在。这时候数据中心的需求就出来了。作为我们的考虑,当时可能在两三年前,云计算市场还没有这么成熟,当时有两个选择,一是自建数据中心,二是租用IDC.我们刚好有一个新建的办公楼,所以就选择了自建的机房。基础架构主要是分为三部分:一是数据中心,主要是包括主机房和灾备机房以及通信中心和整个运维管理的平台,这是作为传统的数据中心必备的三个部分。

建数据中心会有一个考虑,现在国际和国内都有非常多的数据中心的标准,我们知道国际上有整个数据中心建设的标准和评级的标准,在电信行业有非常知名的TIA-942,一般T的说法是授权给TIA联盟使用,但是现在的区分是UPTIME使用罗马数字,电信标准使用的是阿拉伯数字。根据我们的需求结合了国家的电子计算机设计规范,实际上我们应该是B级就可以满足要求,但是我们也是为了未来的长远的使用,所以我们是在有可能满足的领域尽量符合A级标准。我们从主数据中心应该是B+的等级,我们在能够做到的领域尽量的使用A级标准。

根据当时集团的业务现状以及未来的业务规划,我们考虑数据中心必须要支撑未来5-10年业务发展,在确保高度稳定的同时,尽量降低成本,同时我们作为燃气行业的公司,我们一直倡导的是绿色发展的理念。天然气本身是一种清洁能源,我们的机房要尽量使用绿色环保的技术。两地三中心是一个企业作为业务保障的标配,我们规划了三个数据中心,主数据中心是位于深圳总部大楼,主要是部署我们集团的核心业务和各类生产业务系统。

同时我们也规划和建设了同城的灾备中心,离主数据中心的距离大概是30公里。同城灾备主要是当主数据中心失效时,核心的业务能够在我们同城的灾备中心继续运行,保证一个业务的可持续性。同时,我们在灾备层面实现了容灾技术,保证数据的完整性和一致性。异地灾备中心还没有建,现在和最开始的规划又有不同的想法。现在云技术发展很成熟,我们正在做可行性研究和论证,有没有把异地灾备中心部署到公有云上。

国际SHARE 78容灾的体系,应该是从0到6,总共七级。越短的恢复时间、越少的数据丢失,意味着越高的投资,它分了几个等级,最下面是冷备、温备和热备。根据我们的需求和相关基础设施的情况,在核心业务系统采用最高级,6级的容灾方案,实际上是一个双活的概念。基本上运用级的容灾,可以实时进行切换。同时对于非核心的业务,我们基本上采用了数据级的容灾方案,包括把我们的数据、日志被分到灾备中心。一旦发生故障,可能还需要较多的人工介入和恢复时间。

容灾架构,我们的主备之间在运营商专线方面是实现全局的负载均衡,我们的用户可以毫无感知的在主和备两个数据中心之间进行切换。同时在存储的层面,也就是数据的层面是采用了裸光纤互联,基本上达到了数据的实时复制,基于券的实时复制。容灾我们的目标是业务连续性,应用的连续性、数据的一致性。方式可以采取远程数据备份,和根据应用层面所做的容灾的考虑。相当于把资源放在刀刃上,优先保证关键应用。

容灾建设分享几个关键的建设点,它是业务连续性为出发点,从业务上要考虑组织、流程和技术层面的容灾保障,而不只是建好灾备机房就完了,肯定有组织层面的事情,以及容灾恢复的流程。各个系统的容灾等级是根据系统产生的业务影像和风险进行综合的评估,然后来定义不同的容灾需求。

主要是包括以下几个工作,一是业务的影响和风险分析,基于分析的结果制定容灾的级别和方案,最后是机房的选址,网络的规划以及制定灾难恢复的流程,同时要定期进行灾难恢复的演练。数据中心的概况,我们的数据中心位于我们大楼的三层,总面积约为750平米,层高是4.4米,我们分为核心设备区和辅助区域两部分。其中核心设备区域为513平方米,辅助区域约为131平米,辅助区域主要是包含参观的缓冲区以及操作间。当时由于大楼的承重问题,实际上我们把UPS和电池间放到了大楼的负一层,相当于有些先天的不足,在大楼设计的时候就没有考虑到承重的要求。目前有120个标准的机柜和20个网络机柜,总共不到150个机柜。灾备的机房面积就会小很多,大概150平米,有30个机柜。

配电系统的设计,实际上我们也是按照国家A级标准来设计配电系统,主要包含了两路市电,通过转换切换成两路市电,分别输入两路UPS,两路UPS完全独立,通过电源分配柜到我们的列头柜,再通过列头柜进行组合,包括双电源的负载和单电源的负载。UPS选择2(N+1)的方案,通过整个配电系统输入到我们的机柜,可以有效防止因为供电系统的故障导致损失。在空调和通风系统方面,也是采用国家A级标准的要求,采用(N+1)的方案,为了最大限度的降低能耗,也是更加绿色,我们采用了冷通道封闭,实际上就是能够保证冷气封闭在独立的区域,更好的去冷却我们的设备。而且我们是采用了机房的新风系统,一方面在冬季的时候,把适于的冷空气直接接入机房作为降温使用。同时对机房整个的环境,空气质量也有了优化。当时主机房设计的PUE是1.8,同时灾备机房因为建得比较晚,采用了冷通道封闭技术,同时采用了水冷的行间制冷技术,PUE进一步降低,设计的PUE达到1.6.

这是机房综合布线的设计,遵循A级标准,采用完全冗余设计,包括KVM网络、存储的网络(SAN网络,全冗余架构),还有局域网的整个设置。整个布线也是遵循T3的布线标准,采用三级布线,由接入区到主配线区,同时由我们的主配线区到达我们的水平布线区,也就是我们的列头柜,由列头柜到达设备区域。我们可以看到整个网络布线的设计采用了完全冗余的设计。也是根据标准的要求提高可靠性。

综合监控系统,机房建了之后,实际上日常的运维管理还是非常重要的,采用了集中监控系统。监控对象包括精密空调、UPS、训练池、配电开关、温湿度监测、漏水、门禁以及闭路电视和消防监控,可以实现7×24小时的全面监控和管理,有效保障机房以及设备的安全、高效的运行。

网络分区,数据中心主要是运行四类系统:开发测试区、核心业务区、非核心业务区、调度中心。互联网边界区分成互联网接入区、企业边界区,可以实现员工访问互联网流量和我们的分子公司、合作伙伴的外网的隔离,提高安全性,也可以做到网络服务质量的管理。

回到基础架构的部分,现在云技术发展非常快,我们都知道传统架构资源使用率非常低,以前是烟囱式部署,一套系统配置一套硬件资源,我们也是在实施的时候,充分采用资源池,把所有的服务器资源全部池化,把存储资源,不同类别的存储放到存储池里面。包括网络的层面也充分利用SDN的技术进行池化,同时根据我们的业务需求分配给业务来使用。

运维流程分为三级支持,用户有问题首先找一线支持人员,一线支持人员一般可以把大部分问题解决掉,如果解决不掉的,那可能要分配给二线支持,包括服务器、网络的专家,如果还是解决不了,那就找厂商来支持。同时,在整个运维流程这块,我们充分借鉴了Intel的理念,建立了整个服务管理的平台,包括了事件管理、问题管理、发布、变更配制的管理。

未来的思考,数据中心不断发展,包括云化、智能化,实际上都越来越多的在影响数据中心的发展。在原来的资源池虚拟化的基础上,构建面向服务的敏捷数据中心,敏捷就是快速响应业务需求,优化成本架构。提升IT基础设施的服务能力。这里面有几个考虑因素,1、把原来的池化和虚拟化的基础架构做充分的应用。2、能够集成异构的环境。3、采用智能化的技术,尽可能自动化技术与IT流程。4、做到动态配置基础架构。5、按需进行灵活优化。6、对未来的预测要有很好的预测。

这是我们研究敏捷数据中心的架构,大概介绍几点,一是支持以服务为导向的基础架构,更多是从业务角度来思考问题。如果数据中心不对业务产生支持,产生积极的引导,它可能很难有价值的体现。二是建立和配置服务级别协议,通过自动化的就要流程来分配和部署IT的基础架构,也就是现在的公有云概念,用户通过门户提交一个需求,后台所有的工作都是可以自动完成。同时能实现监控报警和服务,因为这个东西是一个系统正常运行的有利保障,同时能够处理基础架构的使用和对SLI进行监测,同时能够为我们的服务进行计量,未来的企业的数据中心应该是一个非常复杂和综合的情况,包含内部的数据中心,也有可能包含了公有云的服务,甚至包含租用IDC的服务。

现在很多核心业务系统放在内部数据中心,但是偏向互联网的应用,包括我们的电商类应用都是一步到位,直接把它部署到公有云上。未来也就涉及到对所有的资源进行一个整合管理,能够做到最大化的满足我们业务的各方面的需求。实现更灵活的架构,为我们的业务创造价值。

我的分享就到这儿。谢谢!

赞(0) 打赏
声明:本站发布的内容(图片、视频和文字)以原创、转载和分享网络内容为主,若涉及侵权请及时告知,将会在第一时间删除。本站原创内容未经允许不得转载:西数超哥学习乐园 » 【2018亚太数据中心峰会】张静:企业数据中心建设实践分享

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

微信扫一扫打赏