抽象性
云计算虚拟化技术是优化云数据中心电耗的重要技术本代服务大都移向云层,结果数据中心负载增加结果,数据中心规模增长,因此能耗增加解决这一问题需要高效优化算法分配资源在这项工作中,建议基于遗传算法和随机森林虚拟机分配混合法,该方法属于监督机学习技术类工作目的是尽量减少电流消耗,同时保持现有资源之间更好的负载平衡并最大限度地利用资源。拟模型使用遗传算法生成随机森林模型培训数据集并进一步获取培训模型PlanetLab实时工作迹用于评价方法结果表明,拟议GA-RF模型比现有模型提高数据中心和主机的能源消耗、执行时间和资源利用工作用电量消耗、执行时间、资源利用、平均启动时间和平均完成时间作为性能度量
开工导 言
云计算是一种分布式计算形式,它带入实用模型远程交付可测量和可缩放资源云化并行计算、电网计算和分布计算一号..云环境向用户提供共享资源库,作为服务求用方法2..有效计算容量和庞大存储容量允许用户随时随地访问云服务云数据中心由IT资源组成,如数据库、服务器、通信设备、网络和软件系统用户对云资源需求增加,云提供方增加服务器数或所需硬件数产生更多物理节点将导致数据中心功耗增加数据中心耗用世界电量的2%预计到2030年将达8%数据中心有三个电源消费者,即冷却系统、数据中心网络和服务器10%至25%电量由网络耗用,冷却系统耗用15%至30%电量,服务器耗用约40%至55%电量3..
IaS(基础设施服务)提供RAM、CPU、网络和存储服务等计算资源,使用时可能遵守SLA(服务级协议)。资源利用也对能源消耗产生影响。低资源使用率是数据中心能量不足的原因4..CPU使用率低至10%,表示工作量小于50%峰值电量,耗能超过50%IaaS虚拟化技术在这方面发挥着关键作用,高效提高资源或云利用5..虚拟化提供资源共享允许虚拟机执行物理机处理用户请求三种可能使用虚拟化操作是VM隔离、VM迁移和VM合并VM迁移技术把运行虚拟机从物理机移到另一机虚拟机在不同主机上运行时会离开主机并收集较少主机,通过关闭初始运行主机或移入休眠模式来减少耗能6..虚拟机器定位技术用合适的物理机执行虚拟机提高功率和优化资源利用,非常需要高效VMP技术7..VMP问题是一个硬优化问题8..
高效混合VMP技术使用遗传算法和随机森林算法我们的目标是减少数据中心的耗能 并同时维护负载 多台物理机优化物理机资源使用也被视为评价拟议方法关键参数之一云最小等待时间最小请求补全时间最小化执行时间 平均启动时间 平均完成时间所拟模型的另一个目标是减少时间寻找最优解法,而最优解法需要最长时间迭代美术算法,如GA、ACO、PSO等模型旨在用最优解决方案训练机器学习模型,然后在下一个迭代中,训练模型可用于预测最优解决方案,在恒定时间消除进化所花时间以寻找全局最佳解决方案
算法是用于寻找全球最优解决办法的metheuric技术之一第一,GA侧重于生成优化资源分配调度程序,即培训数据集,内含虚拟机器对物理机映射取自GA的数据集用于随机森林算法培训,然后执行分类,即虚拟机分配物理机RF分类精度使用从GA获取的数据集子集测试
随机森林是一种受监督机学习技术,它能执行将虚拟机安装到最佳物理机上,精度良好,因为它能减少决策树的超容性图一号表示系统模型由数台物理机组成数据中心物理机可执行多台虚拟机虚拟机器监控程序(VMM)也称超视像程序,它促进虚拟机器的创建、管理和监测并管理虚拟环境除物理机外数据中心管理程序接收 VM执行请求时,首先从所有可用物理机收集状态信息并交付VM调度器VM调度器使用GA-RF技术开发下一步,VM调度器分析状态信息并分配虚拟机到适配物理机

其余工作组织如下:2带入文献调查并使用现有模型并比较提议方法在节中讨论3中段4显示对实验搭建法和结果的拟议方法评价,最后结论和未来工作见科5.
二叉文献评论
本节介绍研究人员完成的部分工作表2一号描述虚拟机定位领域不同方法及其为性能评价考虑的参数作者集九九VMP技术建议使用遗传算法和Tabu搜索算法作者注重提高能源效率并增加负载平衡并用执行时间比较工作上的不同算法Abohamama等[10显示VMP算法使用改良置换基遗传算法提高耗能率,减少运行VM机主动主机数拟方法比对流程商店调度问题和旅游推销员问题姚等人[11引入VM定位程序基于加权PageRank中心重点尽量减少主动物理机数并增加数据中心所有主机的资源利用为了避免拟方法下降局部最优解法,考虑非定位虚拟机的影响算法测量物理机在不同条件下完全使用资源的可能性
作者集12提议随机VMP方法提高数据中心的能效和资源利用资源需求建模随机变量,而不是用确定值表示资源需求因资源需求变化,拟优化模型受概率约束,即对每台物理机资源溢出概率限制13..VMP使用二进制重力搜索算法这项工作的目的是减少能源消耗拟方法使用代理物为对象并使用质量测量性能高质量对象有更好的求解14..作者建议进化方法提高能效此处建议方法还包含保留虚拟机模拟云环境与实时云环境都用于评价不同技术性能弱主机合并VM后能源消耗下降
Ghasemi等[15设计强化学习方法解决VM定位作者集中处理负载平衡问题,同时最大限度地利用资源并关闭多主机推荐方法从可用可接受动作中选择动作并用云环境执行接收加固信号与虚拟机定位解决方案相容性匹配16..作者建议基于NiveBayesian分类器和随机键Cuckoo搜索VM合并问题混合法,以最小化耗能奈夫贝叶斯使用检测宿主未来状态,这是高效安装虚拟机所必备的Khan等人[17HeporClord框架混合云平台, 内含综合算法单资源调度器和管弦拟议的资源管理可分派并预测有效工作量的定位和转移实证研究表明HeporCloud可高效规划并合并各类工作在能源、性能和成本方面扩展版云模拟器20码提高云精度扩展版评价证明它在能源、资源分配性能甚至多功能数据中心合并方面表现优异作者集18号介绍合并法优先最高效迁移,可以是VM、容器或容器内具体应用作者建模云应用和资源异质性并演示异式应用、容器和虚拟机器合并如何影响多式数据中心性能和能效中19号开发多存取边缘计算游戏理论资源管理技术Google的工作量跟踪用于评价拟议工作目标是开发资源管理技术,高效能、性能和成本[21号Ilias Mavridis和Helen Karatza建议一种方法合并虚拟机和容器以加强云隔离和扩展功能作者强调虚拟机运行容器的好处,并调查不同虚拟化方式和配置如何影响方法性能Docker容器被迫用KVM和XEN虚拟机运行,Linux容器则用Windows服务器运行以查看其表现通过运行多基准并安装实体应用案例,作者能够估计虚拟机额外虚拟化层的性能成本最后,作者调查了几套安装容器操作系统以及存储持久数据技术,以了解虚拟机器和容器上如何实现隔离
3级提议方法
虚拟机定位技术建议使用遗传算法和随机森林技术混合模型遗传算法是一种优化技术,在此生成随机森林算法培训所需要的数据集训练数据集包括虚拟机分配或映射物理机
3.1.遗传算法
遗传算法技术产生全局opima解法使用遗传算法生成虚拟机映射
将下列步骤纳入我们的工作(1)初始化人口群落初始随机生成 所有虚拟机VMi一=1至n)映射到物理机PMj大全高山市j大全=1至m)图2显示样本初始群(2)适配函数:主机适配值导出 去哪儿 随机常量高健康值个人用于复制过程3级选择:适配个人使用比赛选择法从人群中选择比赛规模取N类个人,随机从人群中选择优胜者接受交叉操作(4)交叉式交叉式交叉式处理程序使用二点交叉式处理方法从所选最佳个人中生成新人/互换式处理程序单点交叉、多点和统一交叉等系统也可用为改善多样性,新生成个人回归人口图中举二点交叉3.(5)变异性:变异性操作可用交换、移动、移动交换和再平衡实现交换操作变换个人二分识别并交换值创建新个体置换操作将交换分配到虚拟机的物理机图4.


(a)

(b)

伪编码建议遗传算法显示于图5.我们用100进化来获取更好的结果最终结果将绘制虚拟机器对物理机器的映射

3.2随机森林分类器
随机森林是监督机学习技术之一 用于回归和分类软易用算法随机森林由树组成 树越多 随机森林的抗御能力越强随机森林创建每一决策树时先随机选择,在每个节点选择一小组特征拆分,第二计算基于训练集这些特征的最佳拆分最后,它从每棵树上得到预测并选择最佳解决办法,或采用图中表示的“多数投票”或“性能投票”6.

模块1(数据集创建):数据集使用遗传算法创建数据集由VM分配最佳物理机映射组成上一节讨论使用GA创建数据集的程序311.数据集划分为2组第一组由80%数据集组成,该数据集用作培训数据集培训模型,其余20%数据集用于测试
模块2(培训):考虑培训数据集 内含随机向量观察 .向量 内含预测器或独立变量 C类标签使用此训练集开发随机森林 .组合结果B输出 ,去哪儿 , 预测Bth树分类数据对象合并所有树输出产生最终类y 所有树获得最大票
3.2.1树形构造
训练数据集用于树造并沿袭自上而下方法信息增益识别属性最大量使用信息增益测量
生成方式分立集D示例分解成二子D一依给定属性E(d)即为entropy 带 比例例子归为i类 大小集选择属性过程为非定点重复进程停止时节点接收少实例或到达给定深度时
模块3(测试):一旦模型使用培训集培训结束,则用测试集预测训练后精度使用实值和预测值检验获取精度小于期望值时,将做点调试并培训测试模型重试到预期精度实现
3.2.2.2流图
图7描述块图建议混合技术遗传算法读Planetlab数据集,这是一个实时数据集遗传算法遍历C节规定的所有过程311生成数据集并绘制虚拟机对物理机的映射数据集用作随机森林分类器的数据集随机森林分类程序将数据集划分为训练测试数据集使用培训数据RF生成指定数子样本随机树测试数据集测试分类过程最后,多数表决决定最终类标签(输出值)。输出值由物理主机数组成,用它执行所需的虚拟机

虚拟机安装到物理机上后开始执行过段时间后,物理机可能会获得更多VM执行,在这种情况下,物理机超载使用VM迁移技术处理这类假设等PM超载后,部分虚拟机将选择并迁移到负载较少的其他PM,从而保持数据中心所有物理机负载平衡区间射程用于检测数据中心超载物理机,这是可用超载检测法22号..下一个最大关联策略用于选择从超载PM迁移VM选择VM最大关联CPU使用
4级模拟结果
实验搭建、性能度量和实验结果在本节讨论
4.1.实验搭建
云Sim3.0工具模拟器评价提议的算法Oudensim提供不同的VM提供技巧和虚拟化资源执行实验 从PlanetLab获取实值跟踪PlanetLab是Comon项目的一部分,Comon项目由来自全世界500多个地点各种主机运行的1000多台虚拟机的CPU使用组成。实验搭建中 我们使用四种类型虚拟机 微小中型机800多式主机部署属于HPProLiantG4和HPProLiantG5类表显示这些服务器特征2.模拟时500主机和VM从500到650不等,数据中心配置见表2.PlanetLab数据集日志文件实词数据中心传输量、任务大小、VM大小等任务请求,VM配置如RAM、数处理器和MIPS计数
4.2性能度量和结果
使用下列度量法评价提议的算法和其他算法
4.2.1.能源消耗
表示数据中心内所有物理机耗用的总能量PMs耗能计算依据线性立方电耗模型电源模型中物理宿主电耗量直线增长,CPU使用量增加
容我们考虑电源模型的下列参数:i) :完全使用主机k时最大功耗二) :闲置功耗k三)U级k:当前CPU使用主机k四)T:数据中心主机总数
主机P电耗k可表示为
我们的目标是将数据中心耗电最小化目标最小化
图8显示不同算法的能量消耗GA-Random森林的耗能平均下降17%、31%和39%,而PlanetLab2011049/pletlab-1_amst_nodes_plane-lab_org和2011049/pl1_rc_otawa_ca_Google

4.2.2.2执行时间
从云提供方角度讲,在较短时间执行所有用户请求确实是一个重要因素执行时间作为关键性能因子之一评价算法
等一等T级={T一号.T2.TN级}成为任务集 表示集中任务总数虚拟机={VM一号虚拟机2.VMM级}表示数组虚拟机T级E级高山市一,j大全)表示任务Ti虚拟机执行时间j大全.表示为 去哪儿 表示执行长度指令所需时间I级虚拟机j大全并 表示虚拟机器j计算能力
任务运行时间虚拟机j
虚拟机完工时间j大全任务运行时间和虚拟机上所有任务之和
完全执行时间表示执行所有虚拟机所需的时间,从而完成执行所有用户请求可表示为
图中显示九九GA-RF平均执行时间比GA、ACO和PSO分别少15%、29%和37%GA-RF执行时间快

4.2.3资源利用
云数据中心根据用户资源需求处理用户请求时创建各种VMVMP技术旨在将虚拟机安装到合适的物理机上提高资源利用资源类型我们考虑 CPU假设有NPMs和MVM等一等PM语言={PM一号,PM2.. PMN级}表示PMs集PM语言一∈PM语言.PMC一表示CPU容量PM语言一.等一等虚拟机={VM一号虚拟机2.VMM级}表示一组虚拟机虚拟机j大全∈虚拟机.VMCj大全表示 CPU需求虚拟机j大全.
等一等P级JI测试表示是否虚拟机j大全置上PM语言一.if虚拟机j大全置上PM语言一,然后P级JI测试=1或虚拟机j大全不放PM语言一,然后P级JI测试=0方程分解九九表示安装在物理机上的所有虚拟机的需求,这些机量不得超过物理机资源容量
虚拟机类型确定后,所有物理机资源使用需要最大化CPU使用物理机P级米表示为
最大化CPU使用所有物理机
图10显示平均CPU使用所有活动PM平均CPU随机森林使用量比GA、ACO和PSO分别高6%、10%和11%

4.2.4.平均起始时间和完成时间
向云用户提供高性能正成为云提供者的重要标准在这方面,启动时间和用户请求/任务完成时间等参数可被视为主要因素图11并12显示平均启动时间和结束时间GA-RF可比其他现有算法少时间完成用户请求/任务


云计算中时间复杂性在研究算法性能方面发挥着重要作用现有各种研究显示对GA、ACO和PSO复杂性的比较分析23号,24码..研究表明,GA发现最优全局最佳解决办法,代价是高搜索时间,但发现解决办法优于ACO和PSO为了减少GA搜索时间,最优解决办法培训成随机森林模型培训并作进一步预测,在恒定时间提供最优解决办法成本间接管理仅为一次性间接管理,即使用GA培训模型最优求解生成
5级结论
开发虚拟化技术后,设计多目标虚拟机定位技术已成为热题研究我们的工作有双重性第一,拟对VMP使用遗传算法和随机森林算法混合法,以减少搜索时间以找到最优解决办法遗传算法用于寻找最优解析法数据集,内含虚拟机对物理机映射数据集用于训练随机森林算法,将虚拟机安装到适用物理机上,并用测试数据评价RF定位精度第二,训练模型用于负载平衡,将虚拟机从超载物理机移到负载不足物理机使用IQR技术检测过载物理机实现此目标,使用最大相关策略选择迁移VM结果表明,与现有方法相比,拟议模型通过减少电耗、执行时间、平均启动时间和结束时间提供节能搭建方案未来模型可用各种机器学习和深学习方法测试,以求更好的解决办法和性能学习
数据可用性
数据集模拟辅助并行工作.com实时分析
利益冲突
发件人没有利益冲突声明
作者贡献
MadhusudhanS.Satish KumarT.和Punit Gupta开发理论和提议模型博士S.M.F.公元前Syed Mustapha和Rajan PrasadTripathi研究数据编译、ML数据集模型并验证分析方法所有作者都讨论结果并投稿所有作者确认唯一职责如下:学习构思设计、数据收集、分析解释结果和手稿编译所有合写者都看到并赞同手稿内容