面向绿色云计算数据中心的动态数据聚集算法(3)
发布时间:2021-06-07
发布时间:2021-06-07
第9期徐小龙:面向绿色云计算数据中心的动态数据聚集算法
缩放策略,把能耗优化问题归结成最优任务调度问题相应的技术。文献E18]提出以软件为中心减少能耗的思路:任务所需服务使用的硬件组件是能耗的源头,当一个组件不被调用时,将其设为休眠状态以降低能耗;指出一个绿色数据中心应该使用高效的能源供应和电压调整模式,来减少每个服务器的能源消耗,提高资源利用率;同时提出利用由虚拟化基础架构套件扩展而来的虚拟数据中心操作系统
(virtualdata
center
OS,VDCOS)从操作系统的层面上来实现节能的目的。另外,文献[19]将能耗成本作为考虑因素对数据库中的查询优化器进行了重新设计,并且取得了良
好的节能效果。
2动态数据聚集算法
2.1数据中心能耗分析
对于云计算系统而言,目前的这些解决方案存在着以下问题:
(1)温度控制的粗粒度。数据中心没有实施具有针对
性的细致温度控制,不能按实际设备的当前情况实施能耗
管理,导致较为严重的资源浪费问题。
(2)任务调度与数据部署的高能耗。现有的任务调度几乎完全不考虑能耗问题,以开源云计算项目Hadoop为例,系统提供3种调度算法(包括先来先服务(first
come
first
served,FCFS)算法、公平调度(fairscheduler,FS)算
法和计算能力调度(capacityscheduler,CS)算法)均不考虑能耗因素;目前数据部署机制主要关注存储空间节约、访问效率、可靠机制以及一致性控制等。对数据的访问规律以及由此产生的能耗则关注不够。
(3)偏重对硬件的依赖。目前的节能措施常常是从降低硬件的本身功耗角度人手,但是功耗与性能往往相背离,
且在相当一段时间呢,改进的难度较大。
(4)偏重对自然环境的依赖。为了节能和降低成本,许多数据中心选择设置在寒冷的地域,以达到引入自然室外空气而避免人工制冷,如果必须在炎热和较炎热区域设置数据中心,则人工制冷必不可少。
事实上,云计算数据中心在执行任务和提供服务时,存在着以下的一些值得关注的情况:
(1)节点和数据在不同时段的访问情况呈波态分布。某些类型的节点及数据的访问主要集中在08:30~17:30,而另外一些数据则集中在20:oo~24:00;部分类型的数据的访问主要集中在节假日,而在平时的访问量则
很少。
(2)处于空转状态的服务器(目前处于等待任务状态)的电力消耗常常达到满负荷时的60%左右;加上数据中心温控设备的能耗,数据中心总能耗增加甚至可以达
N50%~i00%Ezo]。
万方数据
(3)数据中心存储的数据和任务量都在不断增长,数据中心在设计时应该具有良好的可伸缩性和可扩展性,能灵活应对峰谷时段的用户需求。
(4)据调查,随着技术的进步,目前数据中心的设备可以承受的温度可达26.5℃,甚至更高,并不需要20℃以下的温度,适当调高数据中心的温度,可以显著地降低能耗和
电力成本。
2.2云数据模型
在云计算系统中任务从用户使用的角度可区分为4种
类型:
类型1用户仅需要提出任务执行请求,任务涉及的程序、数据等都由云计算服务器端提供,典型的应用如搜索引擎。
类型2用户任务涉及的程序由用户提供,数据由云计算服务器端提供,程序迁移到服务器端并利用服务器端数据和计算等资源完成任务,然后将结果返回用户终端。
类型3用户任务涉及的数据等由用户提供,云计算服务器端提供程序和计算资源,数据迁移到服务器端进行处理,再将处理结果返回用户终端。
类型4用户任务涉及的程序和数据等均由用户提供,云计算服务器端仅提供计算与存储等硬件基础,程序和数据迁移到服务器端完成任务后,将结果返回用户终端。
由于代码的迁移代价较小,因此,对于第1类和第2类任务的执行点的选择来说,主要受制于系统提供的数据的存储点;而对于第3类和第4类任务来说,主要考虑的是将数据迁移到哪个执行点处理可以达到系统的性能目标。
本文重点针对第1类和第2类任务涉及的数据部署问题进行研究,首先创建云计算中的数据模型。
定义1
云数据模型(CloudData)被定义为以下的6
元组:
CloudData一(DJD,Content,Storage,Visits,Access,Place)
(1)
式中,DID是数据的唯一标识;Content是数据内容;Sto-rage是指存储数据所需消耗的存储量;Visits反映了各个时段内数据的总访问量情况,时段△。(矗一1,2,…,托)的数据
的访问量M。表示为V。=(z5。,舰),则Visits一{V。。V2,…,
U,…};Access是指数据涉及的访问方式,包括读、写两种方式;Place是数据所存储的节点原始位置信息,即
Place—Section.NID’4
(2)
式(2)表明了数据所存储的节点位置信息包括了节点所在的数据中心的区域(Section)和节点标识(N/D)。
本文构建的云数据模型对数据本身、资源消耗、访问情况、所处环境及其使用方式都作了明确、细致的规定,这就为本文提出的面向绿色云计算数据中心的动态数据聚集算法有效运行提供了基本框架和前提。
上一篇:宿淮高速收费大棚施工组织设计
下一篇:八年级下册信息技术教案