云计算 | 青训营

256 阅读37分钟

一:服务器虚拟化 1.名词解释 (1)资源动态调整(对象是虚拟机) 管理员操作,对CPU、内存、网卡、硬盘、GPU进行调整。 FusionCompute支持虚拟机资源动态调整,用户可以根据业务负载动态调整资源的使用情况。 虚拟机资源调整包括: 离线/在线调整vCPU数目 无论虚拟机处于离线(关机)或在线状态,用户都可以根据需要增加虚拟机的vCPU数目。虚拟机处于离线状态时,用户可以根据需要减少虚拟机的vCPU数目。通过离线/在线调整虚拟机vCPU数目,可以满足虚拟机上业务负载发生变化时对计算能力灵活调整的需求。 离线/在线调整内存大小 无论虚拟机处于离线或在线状态,用户都可以根据需要增加虚拟机的内存容量。虚拟机处于离线状态时,用户可以根据需要减少虚拟机的内存容量。通过离线/在线调整内存大小,可以满足虚拟机上业务负载发生变化时对内存灵活调整的需求。 离线/在线添加/删除网卡 虚拟机在线/离线状态下,用户可以挂载或卸载虚拟网卡,以满足业务对网卡数量的需求。 离线/在线挂载虚拟磁盘 无论虚拟机处于离线或在线状态,用户都可以挂载虚拟磁盘,在不中断用户业务的情况下,增加虚拟机的存储容量,实现存储资源的灵活使用。

在线增加CPU和内存可以在线生效,不需要重启,但前提是需要开启虚拟机的热插拔开关才行,且对操作系统的版本也有一定的限制,不是所有的操作系统都支持在线增加CPU和内存。

(2)动态资源调度DRS(对象是集群) DRS,即动态资源调度 (Dynamic Resource Scheduler):指采用智能负载均衡调度算法,并结合动态电源管理功能,通过周期性检查同一集群资源内各个主机的负载情况,在不同的主机间迁移虚拟机,从而实现同一集群内不同主机间的负载均衡,并最大程度降低系统的功耗。 在 FusionCompute 中,可以配置集群动态资源调度功能:采用智能负载均衡调度算法,周期性检查集群内主机的负载情况,在不同的主机之间迁移虚拟机,从而达到集群内的主机之间负载均衡目的。 集群的自动化级别有两种:自动和手动。在自动调度模式下,系统会自动将虚拟机迁移到最合适的主机上。在手动操作模式下,系统会生成操作建议供管理员选择,管理员根据实际情况决定是否应用建议。 资源调度可以配置不同的衡量因素,可以根据 CPU、内存或 CPU 和内存进行调度。只有资源复用时,才会影响虚拟机性能。因此,如果未使用内存资源复用,建议配置为根据 CPU 调度。如果使用内存复用,建议配置为根据 CPU 和内存综合调度。 资源调度的高级规则可以用来满足一些特殊需求。例如两台虚拟机是主备关系时,可以为其配置互斥策略,使其运行在不同的主机上以提高可靠性。 资源调度的分时阈值设置,可以满足不同时段的调度需求。由于虚拟机迁移会带来一定的系统开销,所以建议在业务压力较大时设置为保守策略,在业务压力较小时设置为中等或激进策略,避免影响业务性能。

操作对象:1、内存 2、cpu 3、cpu+内存 第3点的关系是“且”的关系。达到负载高度时,只要一个达到就触发。

引申: FC集群内无法使用DRS的原因有哪些? 1、设置了聚集或者互斥规则组; 2、虚拟机禁用了DRS; 3、虚拟机与所在主机进行了绑定; 4、虚拟机与DRS的目标主机不兼容; 5、迁移阈值为“保守”; 6、某设备挂载了一个或多个虚拟机; 7、虚拟机内存大于 8G。

DRS需要共享的存储

(3)动态资源管控QOS 即服务质量(quality of service),服务质量,为了在资源紧张的情况下,保障关键业务的体验度。Qos包括CPU Qos、内存QOS、磁盘Qos、网卡Qos。 CPU资源份额 CPU份额定义多个虚拟机在竞争物理CPU资源的时候按比例分配计算资源。 以一个主频为2.8GHz的单核物理主机为例,如果上面运行有三台单CPU的虚拟机。三个虚拟机A,B,C,份额分别为1000,2000,4000。当三个虚拟机CPU满负载运行时,会根据三个虚拟机的份额按比例分配计算资源。份额为1000的虚拟机A的计算能力约为400MHz的,份额为2000的虚拟机B获得的计算能力约为800MHz,份额为4000的虚拟机C获得的计算能力约为1600MHz。(以上举例仅为说明CPU份额的概念,实际应用过程中情况会更复杂)。 CPU份额只在各虚拟机竞争计算资源时发挥作用,如果没有竞争情况发生,有需求的虚拟机可以独占物理CPU资源,例如,如果虚拟机B和C均处于空闲状态,虚拟机A可以获得整个物理核即2.8GHz的计算能力。 CPU资源预留 CPU预留定义了多个虚拟机竞争物理CPU资源的时候分配的最低计算资源。 如果虚拟机根据份额值计算出来的计算能力小于虚拟机预留值,调度算法会优先按照虚拟机预留值的能力把计算资源分配给虚拟机,对于预留值超出按份额分配的计算资源的部分,调度算法会从主机上其他虚拟机的CPU上按各自的份额比例扣除,因此虚拟机的计算能力会以预留值为准。 如果虚拟机根据份额值计算出来的计算能力大于虚拟机预留值,那么虚拟机的计算能力会以份额值计算为准。 以一个主频为2.8GHz的单核物理机为例,如果运行有三台单CPU的虚拟机A、B、C,份额分别为1000、2000、4000,预留值分别为700MHz、0MHz、0MHz。当三个虚拟机满CPU负载运行时: 虚拟机A如果按照份额分配,本应得400MHz,但由于其预留值大于400MHz,因此最终计算能力按照预留值700MHz算。 多出的(700-400)MHz按照B和C各自的份额比例从B和C处扣除。 虚拟机B获得的计算能力约为(800-100)MHz,虚拟机C获得的计算能力约为(1600-200)MHz。 CPU预留只在各虚拟机竞争计算资源的时候才发挥作用,如果没有竞争情况发生,有需求的虚拟机可以独占物理CPU资源。例如,如果虚拟机B和C均处于空闲状态,虚拟机A可以获得整个物理核即2.8GHz的计算能力。 CPU资源限额 控制虚拟机占用物理CPU资源的上限。以一个两CPU的虚拟机为例,如果设置该虚拟机CPU上限为3GHz,则该虚拟机的两个虚拟CPU计算能力被限制为1.5GHz。 内存资源份额 内存份额定义多个虚拟机竞争内存资源的时候按比例分配内存资源。 在虚拟机申请内存资源,或主机释放空闲内存(虚拟机迁移或关闭)时,会根据虚拟机的内存份额情况按比例分配。 不同于CPU资源可实时调度,内存资源的调度是平缓的过程,内存份额策略在虚拟机运行过程中会不断进行微调,使虚拟机的内存获取量逐渐趋于比例。 以6G内存规格的主机为例,假设其上运行有三台4G内存规格的虚拟机,内存份额分别为20480、20480、40960,那么其内存分配比例为1:1:2。当三个虚拟机内部均逐步加压,策略会根据三个虚拟机的份额按比例分配调整内存资源,最终三个虚拟机获得的内存量稳定为1.5G、1.5G、3G。 内存份额只在各虚拟机竞争内存资源时发挥作用,如果没有竞争情况发生,有需求的虚拟机可以最大限度地获得内存资源。例如,如果虚拟机B和C没有内存压力且未达到预留值,虚拟机A内存需求压力增大后,可以从空闲内存、虚拟机B和C中获取内存资源,直到虚拟机A达到上限或空闲内存用尽且虚拟机B和C达到预留值。以上面的例子,当份额为40960的虚拟机没有内存压力(内存资源预留为1G),那么份额为20480的两个虚拟机理论上可以各获得最大2.5G的内存。 内存资源预留 内存预留定义多个虚拟机竞争内存资源的时候分配的内存下限,能够确保虚拟机在实际使用过程中一定可使用的内存资源。 预留的内存被会虚拟机独占。即,一旦内存被某个虚拟机预留,即使虚拟机实际内存使用量不超过预留量,其他虚拟机也无法抢占该虚拟机的空闲内存资源。 内存资源限额 控制虚拟机占用物理内存资源的上限。在开启多个虚拟机时,虚拟机之间会相互竞争内存资源,为了使虚拟机的内存得到充分利用,尽量减少空闲内存,用户可以在创建虚拟机时设置虚拟机配置文件中的内存上限参数,使服务器分配给该虚拟机的内存大小不超过内存上限值。 内存资源限额需要开启内存复用开关才有效,否则无法调整。 网络Qos策略提供带宽配置控制能力,Qos功能不支持同一主机上虚拟机之间的流量限制。包含如下方面: 基于端口组成员接口发送方向与接收方向的带宽控制 基于端口组的每个成员接口提供流量整形、带宽优先级的控制能力。

在端口组中配置,针对发送流量和接受流量流做Qos,有以下三种属性 平均带宽(某段时间内允许通过端口的平均每秒发送/接收位数) 峰值带宽(发送/接收流量突发时,每秒钟允许通过端口的最大传输位数) 突发大小(允许流量在平均带宽的基础上产生的突发流量的大小) 磁盘Qos: 可设置虚拟机每个磁盘的IO上限,以避免某个虚拟机的磁盘IO过大,影响其他虚拟机的性能

存储QOS在哪设置? 点击虚拟机-磁盘-更多-设置磁盘IO上线(BPS和IOPS) BPS:描述每秒IO大小 IOPS:每秒进行读写操作的次数 磁盘方面可以限制读写的IOPS和BPS。

(4)动态资源管理DPM DPM,动态电源管理 (Dynamic Power Management),根据业务情况,智能地将部分物理机上下电。 对应 FusionCompute 中的“电源管理自动化”:电源管理自动化功能会周期性地检查集群中服务器的资源使用情况,如果集群中资源利用率不足,则会将多余的主机下电节能,下电前会将虚拟机迁移至其他主机;如果集群资源过度利用,则会将离线的主机上电,以增加集群资源,减轻主机的负荷。

电源管理依赖于计算资源调度,因此电源管理只有在开启计算资源调度,并且迁移阈值的设置不为"保守"时生效。 当系统的集群下主机的“最大CPU占用率和最大内存占用率超过了设定值,此时会开始执行调度策略,调度方式分为手动跟自动。

引申: 上电:VRM通过 CNA 物理节点上的BMC 卡完成上电动作。 下电:VRM 通过 VNA 对 CNA 节点进行安全关机动作。

引申: CPU和内存预留有什么区别? CPU预留不会独占CPU,内存预留会独占内存。

分布式资源调度:(慎答) 先问考官是不是DRS,如果不是就答私有云场景的 针对私有云,在多个VDC中动态调整资源,把负载低的VDC中的资源调整到负载高的VDC资源中去用。 如果考官追问一个VDC可不可以动态调整资源,就答我一个VDC中可以动态调整多个AZ中的资源。 答案有待验证。

(5)弹性IP 弹性IP(Elastic IP,EIP),是基于互联网上的静态IP地址,是可以通过Internet直接访问的IP地址。弹性IP可以与子网中关联的弹性云服务器、裸金属服务器、虚拟IP、弹性负载均衡等资源灵活地绑定及解绑。 私有云局域网(LAN)上各个实例配置的IP地址都是私有IP地址,无法访问互联网。当实例上的应用需要访问外部网络时,可以通过绑定弹性IP的方式来实现VPC中的实例通过固定的公网IP地址与互联网互通。

作用: 弹性IP用于构建云资源的外网出口,可与多种业务资源灵活地绑定与解绑,满足各种业务诉求。 用户可以将弹性IP绑定到ECS或BMS上,绑定后的ECS或BMS即可连接公网。 用户可以为虚拟IP地址绑定一个弹性IP,从互联网可以访问后端绑定了同一个虚拟IP地址的多个主备部署的弹性云服务器,增强容灾性能。 用户可以为负载均衡器绑定弹性IP,可以接收来自公网的访问请求并将请求自动分发到添加的多台弹性云服务器。 共享带宽可提供多实例使用一条带宽的功能,用户根据实际业务情况,将对带宽要求不高的实例加入共享带宽。 多个弹性IP共享一条带宽,相较于独立带宽大大节省带宽使用成本。 提供Region级别的带宽复用共享能力,节省带宽使用的运营及运维成本。 共享带宽拥有超大弹性峰值,用户可根据实际情况通过调整带宽大小来调整峰值。

可以和哪些服务绑定? 弹性IP地址(Elastic IP address,EIP)是可以通过Internet直接访问的IP地址。弹性IP是一个静态的公共IP地址,可以与弹性云服务器、裸金属服务器、虚拟IP、弹性负载均衡等资源灵活地绑定及解绑 。将弹性IP地址和子网中关联的云服务器绑定,可以实现云服务器与Internet互通。

弹性IP一定公网IP吗? 不一定,他也可以是企业内部的IP

弹性IP和ECS什么比列关系? 是1:1。也可以1:M(就是我们可以申请一个ELB,为这个ELB绑定一个EIP,那么我们多个ECS就可以同时通过一个EIP出去了)。

EIP和FIP有什么关系? EIP=FIP EIP是私有云中云服务的说法 FIP是OpenStack的说法

(6)内存复用 内存复用是指在服务器物理内存一定的情况下,通过综合运用内存复用单项技术(内存气泡、内存共享、内存交换)对内存进行分时复用。通过内存复用,使得虚拟机内存规格总和大于服务器规格内存总和,提高服务器中虚拟机密度。

内存共享+写时复制:虚拟机之间共享同一物理内存空间(蓝色),此时虚拟机仅对内存做只读操作。当虚拟机需要对内存进行写操作时(红色),开辟另一内存空间,并修改映射(多台虚拟机共享数据内容为零的内存页(新版本叫共享数据内容相同的内存页))。 内存置换:虚拟机长时间未访问的内存内容被置换到外部存储中,并建立映射,系统需要使用这些数据时,再与预留在内存上的数据进行交换。 内存气泡:系统主动回收虚拟机暂时不用的物理内存,分配给需要复用内存的虚拟机。内存的回收和分配均为系统动态执行,虚拟机上的应用无感知。整个物理服务器上的所有虚拟机使用的分配内存总量不能超过该服务器的物理内存总量。

作用:当出现竞争时,由内存复用策略为虚拟机实时调度内存资源,综合运用内存复用技术释放虚拟机的空闲内存,为其他虚拟机的内存需求提供条件。

价值(应用场景上): 1)降低运营商或者企业的成本 2)计算节点内存数量固定时,提高虚拟机密度 3)计算节点虚拟机密度固定时,节省计算节点内存数量

限制条件: 1.每个计算节点上运行的所有虚拟机的预留内存之和不能大于节点虚拟化域内存总和。 2.旧版6.1之前:与Guestnuma、inic网卡冲突,Guestnuma、inic网卡会独占内存。与内存复用冲突。 3.新版6.3之后:内存复用与SRIOV直通、GPU直通、NVME SSD盘直通特性互斥。直通设备的虚拟机必须内存独占,内存独占后虚拟机的内存不会被交换到交换空间。内存复用的虚拟机不能直通设备。 4.主机需要配置足够的交换空间才能保证内存复用功能的稳定运行。主机最大内存复用率依赖于swap空间大小配置,具体计算公式如下: 主机支持的最大内存复用率=1+(主机swap空间大小-虚拟化域物理内存大小*0.1)/虚拟化域物理内存大小。

内存共享+写时复制:共享的是相同的数据,别答零页数据,零页数据虽然也可以,但是不全面。

引申: 内存复用作用的对象是主机还是集群? 集群

虚拟机内存复用比到120:触发告警 150:无法创建新的虚拟机。

内存气泡怎么将内存分配给其他虚拟机的? 是通过修改映射关系将内存分配给其他虚拟机的。

内存复用的3项技术可以单独使用某一个吗? 不可以,开启内存复用后,3项技术必须同时使用,不能单独使用。

内存复用技术开启对虚拟机有影响么? 内存复用技术默认不开启,开启后对虚拟机有一定影响,通过内存复用3项技术可知,虚拟机使用内存时会有一定的延迟。

关闭内存复用要注意什么? 将集群内所有运行中的虚拟机的内存预留设置:内存预留=内存规格。

谁监控内存不足? Hypervisor

内存置换,为什么不直接从硬盘的数据返回给用户,要置换回内存,再给用户? 从硬盘直接读取数据的话相对比较慢,因为在硬盘中还要进行数据的检索会浪费时间,性能相对较低,而且对于用 户读取数据的流程一般都是先读缓存,因为速度较快性能较好,这也是为什么要置换回内存的主要原因。

内存置换,是换到主机磁盘还是虚拟机磁盘? 主机磁盘,且是虚拟化的本地硬盘。

3种技术都有影响吗? 都有。内存共享因为要开辟新的写空间,导致性能下降。内存置换,因为要把数据存放在外部存储上,数据调用时需要访问外部存储。内存气泡因为要做内存的回收和重分发,会有性能影响。

哪种内存复用性能影响最大? 内存置换

实现内存超分配是用的哪一种技术? 内存气泡,其它两种技术用来配合内存气泡使用,提供更多的空闲内存。 (7)快照 快照是什么? 快照是(虚拟机)某一时刻下数据的一个副本或复制。 或者说快照是特定数据集的一个完整可用拷贝,该数据集包含源数据在拷贝点的静态映象,快照可以是数据再现的一个副本或者复制。

COW:COW 在创建快照时,并不会发生物理的数据拷贝动作,仅是拷贝了原始数据所在的源数据块的物理位置元数据。因此,COW 快照创建非常快,可以瞬间完成。在创建了快照之后,快照软件会监控跟踪原始数据的变化(即对源数据块的写操作),一旦源数据块中的原始数据被改写,则会将源数据块上的数据拷贝到新数据块中,然后将新数据写入到源数据块中覆盖原始数据。新数据块就组成了快照卷。COW 有一个很明显的缺点,就是会降低源数据卷的写性能,因为每次改写新数据,实际上都进行了两次写操作。(例如新数据 D’更新原始数据D。此时在D’覆盖D之前,需要先把D拷贝到快照卷中,并且更新快照数据指针表的记录使其指向新的存储地址。最后再将D’写入到D原来的位置,源数据指针表不需要更新。) ROW:ROW的实现原理与COW非常相似,区别在于ROW对原始数据卷的首次写操作,会将新数据重定向到预留的快照卷中。在创建快照之后,也就是在快照时间点之后,发生了写操作,那么新数据会直接被写入到快照卷中,然后再更新源数据指针表的记录,使其指向新数据所在的快照卷地址。 ROW与COW最大的不同就是:COW的快照卷存放的是原始数据,而ROW的快照卷存放的是新数据。ROW在传统存储场景下最大的问题是对读性能影响比较大。

ROW(写前重定向):写直接写快照卷,读:先读快照、再读原卷 读性能会有所影响,特别多次快照之后 ,读性能会有较大影响(可能会出现比较严重的数据碎片化) COW(写前复制):写:假如原位置有数据,先将数据复制到快照卷中,再把新数据写到原卷中。写性能会有较大影响。读,直接读原卷。 全拷贝:将数据完全镜像一份,优点:快照可以不依赖原卷 缺点:十分占用空间

对虚拟机快照:1、虚拟机本身的描述文件2、虚拟磁盘 一致性快照:将内存上的数据先写入到磁盘中再对磁盘打快照 内存快照:直接对内存打快照

引申: 创建快照时,当前磁盘被置为只读,系统自动在磁盘所在数据存储中创建增量磁盘,后续对该磁盘数据的编辑将保存在增量磁盘中,即增量磁盘表示磁盘当前状况和上次执行快照时的状况之间的差异。对该磁盘再次创建快照时,原磁盘和当前增量磁盘均被置为只读,系统会在数据存储中再创建一个增量磁盘。

如果该虚拟机有多个快照,则在删除快照后,该快照内的数据会自动合并到该虚拟机的下一个快照中。

应用场景: 虚拟机用户在执行一些重大、高危操作之前,例如系统补丁、升级、破坏性测试前执行快照,可以用于故障时的快速还原。

(8)HA 解释:当一台主机或者虚拟机发生故障的时候,系统将会在资源池内启动一台虚拟机到其他可用的物理主机上。

原理:管理节点会自动查询VM状态,发现故障后会查看VM是否有HA属性,如果开启了 HA属性会把故障机的规格信息发给可用的CNA并启动这台虚拟机,启动过程中会将VM 之前的卷重新挂载,包括用户卷。

怎么触发HA? 1.主机发生宕机、上下电、重启的时候 2.虚拟机系统放生故障的时候:window蓝屏、Linux Panic 3.CAN与VRM心跳中断30秒的时候 4.系统故障检测,通过在主机之间实行网络心跳检测,发现没有主机与虚拟机没有IO行为的时候触发HA(整个行为与VRM无关)

预留方案 HA 资源预留:在整个集群内按照配置的值预留 CPU 与内存资源,该资源仅用于虚拟机 HA 功能使用。 使用故障专用切换主机:预留故障专用切换主机,平时该主机不对外提供业务。 集群允许主机故障设置:设置集群内允许指定数目的主机发生故障,系统定期检查集群内是否留有足够的资源来对这些主机上的虚拟机进行故障切换。

条件: 1.安装Tools(实验证明,没有tools也能HA)。且正常运行; 2.其他主机有预留HA资源,不能处于维护模式; 3.共享存储; 4.VM不能绑定主机,USB设备和GPU; 5.集群开启HA功能。

整个HA过程数据会丢失吗? 会,会丢失未落盘的数据。

热迁移和HA有什么区别? 热迁移不会中断业务(用户无感知),HA会中断业务(HA触发时,业务已中断) 热迁移是计划性迁移,HA 是非计划性迁移

(9)镜像 镜像是一个包含了软件及必要配置的弹性云服务器模板,至少包含操作系统,还可以包含应用软件(例如,数据库软件)和私有软件。镜像分为公共镜像、私有镜像和共享镜像。

镜像服务(Image Management Service,以下简称IMS)提供简单方便的镜像自助管理功,能。用户可以灵活便捷的使用公共镜像、私有镜像或共享镜像申请弹性云服务器。同时,用户还能通过弹性云服务器或外部镜像文件创建私有镜像。

引申:3种镜像有什么区别? 公共镜像 公共镜像是云平台系统提供的标准镜像,包含常见的标准操作系统和预装的公共应用,能够提供简单方便的镜像自助管理功能,对所有用户可见。用户可以便捷的使用公共镜像创建弹性云服务器或裸金属服务器。 私有镜像 私有镜像是用户基于云服务器创建的个人镜像,仅用户自己可见。包含操作系统、预装的公共应用以及用户的私有应用。通过私有镜像创建云服务器,可以节省您重复配置云服务器的时间。私有镜像分为通过云服务器创建的私有镜像和通过外部镜像文件创建的私有镜像。 通过弹性云服务器创建新的私有镜像。 通过注册外部镜像文件创建新的私有镜像。 共享镜像 当用户将自己的私有镜像共享给其他用户使用时,可以使用镜像服务的共享镜像功能。对于多项目用户,共享镜像功能可以方便用户在同一个区域内的多个项目间使用镜像。 当用户作为共享镜像的提供者时,可以共享指定镜像、取消共享镜像、添加或删除镜像的共享租户。当用户作为共享镜像的接受者时,可以选择接受或者拒绝其他用户提供的共享镜像,也可以移除已经接受的共享镜像。

镜像怎么得到的? 镜像根据创建方式分为以下两种:(1)通过弹性云服务器创建并且转为镜像(2)通过外部镜像文件导入进行创建

(10)链接克隆 链接克隆是一种通过将链接克隆母卷和链接克隆差分卷组合映射为一个链接克隆卷,提供给虚拟机使用的技术。其中链接克隆母卷为只读卷,多个链接克隆虚拟机共用一份,链接克隆差分卷是读写卷,其存储是精简配置的,每个链接克隆虚拟机一份,保存了每个虚拟机差异化的数据。链接克隆技术具有创建速度快、占用存储空间小的优点,非常适合于同质化用户、桌面高度标准化场景。 2.内存复用? 作用:当出现竞争时,由内存复用策略为虚拟机实时调度内存资源,综合运用内存复用技术释放虚拟机的空闲内存,为其他虚拟机的内存需求提供条件。

限制条件: 每个计算节点上运行的所有虚拟机的预留内存之和不能大于节点虚拟化域内存总和。 旧版6.1之前:与Guestnuma、inic网卡冲突,Guestnuma、inic网卡会独占内存。与内存复用冲突。 新版6.3之后:内存复用与SRIOV直通、GPU直通、NVME SSD盘直通特性互斥。直通设备的虚拟机必须内存独占,内存独占后虚拟机的内存不会被交换到交换空间。内存复用(非100%内存预留)的虚拟机不能直通设备。

内存共享+写时复制:共享的是相同的数据,别答零页数据了,零页数据虽然也可以,但是不全面。

引申: 内存复用作用的对象是主机还是集群? 集群

虚拟机内存复用比到120:触发告警 150无法创建新的虚拟机。

内存气泡怎么将内存分配给其他虚拟机的? 是通过修改映射关系将内存分配给其他虚拟机的。

内存复用的3项技术可以单独使用某一个吗? 不可以,开启内存复用后,3项技术必须同时使用,不能单独使用。 3.快照 快照是什么? 快照是(虚拟机)某一时刻下数据的一个副本或复制。

ROW(写前重定向):写直接写快照卷,读:先读快照、再读原卷 读性能会有所影响,特别多次快照之后 ,读性能会有较大影响 COW(写前复制):写:假如原位置有数据,先将数据复制到快照卷中,再把新数据写到原卷中。写性能会有较大影响。读,直接读原卷。 全拷贝:将数据完全镜像一份,优点:快照可以不依赖原卷 缺点:十分占用空间

对虚拟机快照:1、虚拟机本身的描述文件2、虚拟磁盘 一致性快照:将内存上的数据先写入到磁盘中再对磁盘打快照 内存快照:直接对内存打快照

引申: 创建快照时,当前磁盘被置为只读,系统自动在磁盘所在数据存储中创建增量磁盘,后续对该磁盘数据的编辑将保存在增量磁盘中,即增量磁盘表示磁盘当前状况和上次执行快照时的状况之间的差异。对该磁盘再次创建快照时,原磁盘和当前增量磁盘均被置为只读,系统会在数据存储中再创建一个增量磁盘。 如果该虚拟机有多个快照,则在删除快照后,该快照内的数据会自动合并到该虚拟机的下一个快照中。

4.虚拟磁盘文件的格式? 固态磁盘文件(普通) 动态磁盘文件(精简&普通延迟置零) 差分磁盘文件(快照、链接克隆)

1、固态磁盘文件:创建时需要将磁盘文件对应的存储块空间全部进行初始化成”0”, 创建的时候,由于需要全部空间都写0,需要消耗较长时间,创建比较慢。但在写数据的时候,可以写数据,IO性能较好 应用在系统中的普通卷。

2、动态磁盘文件:创建时只需写头和结束块 创建的时候,只需要在头和结束块写0,不需要消耗时间,创建比较快,但在写数据的时候,需要先置0,再写数据,相对来说,IO性能较好。当动态磁盘文件使用时间越长,性能也就越接近固态磁盘文件。 应用于精简磁盘和普通延迟置零磁盘。

3、差分磁盘文件:差分磁盘的结构和动态磁盘一模一样,只是文件头中会记录它的父文件路径。 快照、非持久化磁盘、链接克隆等

磁盘的模式: 1、从属:快照中包含该从属磁盘,更改将立即并永久写入磁盘。 2、独立-持久:更改将立即并永久写入磁盘,持久磁盘不受快照影响。 即对虚拟机创建快照时,不对该磁盘的数据进行快照。使用快照还原虚拟机时,不对该磁盘的数据进行还原。 3、独立-非持久:关闭电源或恢复快照后,丢弃对该磁盘的更改。 若选择“独立-持久”或“独立-非持久”,则对虚拟机创建快照时,不对该磁盘的数据进行快照。使用快照还原虚拟机时,不对该磁盘的数据进行还原。

如果快照后,该磁盘被解绑定且未绑定其他虚拟机,则快照恢复的虚拟机会重新绑定该磁盘,但磁盘数据不进行还原。 如果快照后,该磁盘被删除,则快照恢复的虚拟机上不存在该磁盘。 5.非持久化磁盘和持久化磁盘? 存储时非持久化,如内存盘,虚拟机关机后,磁盘恢复到原始状态 持久化数据存储指硬盘等能够持久存储数据的空间,虚拟机关机后,数据还会在

6.模版文件类型? 虚拟机模板格式分为ova和ovf两种。其中ova格式的模板只有一个ova文件。ovf格式的模板由一个ovf文件和多个vhd文件组成,规则如下: ovf文件:虚拟机的描述文件,文件名为导出模版时设置的文件名,如“template01.ovf”。 vhd文件:虚拟机的磁盘文件,每个磁盘生成一个vhd文件(虚拟机的磁盘不算,在FC中看到的一个磁盘才算一个Vhd),文件名为:“模版名称-磁盘标识.vhd”,如“template01-sdad.vhd”。

7.两VM不通?

虚拟机侧: 虚拟机故障或者网卡故障。 同网段:1.虚拟机的操作系统的防火墙拦截。 2.IP地址或掩码配置有误(假如A:192.168.1.1/23 B:192.168.1.2/24 A ping B,A会认为B与自己同网段, B收到A的arp消息,通过子网掩码去匹配发现A与其不同网段,则发给网关。 不同网段:1.网关配置错误。 中间系统 1.同一主机、同一DVS、同一二层,不同端口组,也就是虚拟机1和2不通:端口组VLAN配置错误。 2. 不同主机、同一DVS、同一二层,同一端口组,也就是虚拟机1和3不通:TOR交换机可能未放行相应的VLAN、或者PVID配置错误。 3.同一主机、同一DVS、不同二层,同一端口组,也就是虚拟机1和2不通:TOR交换机可能未放行相应的VLAN、或者PVID配置错误(VM和TOR交换机pvid一定要不一致)、ACL策略拦截、网关配置错误、网关无法路由或这被路由器拦截。 4.不同主机、不同DVS,也就是虚拟机1和4不通:由于不同DVS分别属于不同的物理网络,所以虚拟机1和4天然不通。 5.对虚拟机配置了安全组,并被安全组策略拦截(安全组功能由虚拟机所在主机的 iptables 实现)

故障排错: 虚拟机1和2不通举例 二层情况下:ping目标VM,不通 查看arp表(不ping是因为刚ping完),如果有arp条目,则被可能被防火墙或第三方软件拦截。如果不存在,则说明时二层问题。 三层情况下:在源目查看arp表是否存在各自的网关,如果不存在,则是本端二层有问题 存在的话,各自ping下自己的网关看看是否能通,不能通还是二层问题,通的话,再ping对端VM的网关,通则可能被防火墙或第三方软件(为什么要ping网关,因为可能arp条目老化时间到了,ping是为了让arp重新有网关条目)。

如果在不同路由器下,则可能是路由问题,用tracert 二层问题: 检查虚拟机网口配置,查看连接的端口组 看是否在同一CAN主机,不在看条件是否允许迁移至同一主机,如果通,则可能是物理网络配置问题(到交换机上检查是否允许VLAN通过)

可以在不同DVS上划分相同的VLAN,因为两个不同物理网络的VLAN可以相同,这是两个不同的二层。

引申:为什么虚拟机1和2会单通? 可能是虚拟机1开了防火墙,虚拟机2关闭了,导致单通。或者是安全组拦截了。或者是物理交换机设置了ACL策略。

虚拟机不通快速定位? 比如VM1和VM3不通快速定位,首先我们将VM3迁移致CNA01中,然后去ping,如果能通,那么是tor交换机的问题,如果不通就是DVS的问题。

中继场景下,同一个ip网段的虚拟机但是不同vlan能不能只通过中继这个端口组通信? 不能。

8.华为存储资源模型 1、存储资源表示物理存储设备,告诉FC,需要添加存储叫什么名字,是什么类型,在哪里。例如IPSAN、Advanced SAN、NAS、FS等。 2、存储设备表示存储资源中的管理单元,类似ipsan(LUN)、 Advanced SAN、FS(存储池)、NAS(共享目录)等。本地磁盘 3、数据存储表示虚拟化平台中可管理、操作的存储逻辑单元。虚拟化的数据存储,裸设备映射,(旧版本还有非虚拟化数据存储) 由于裸设备映射、非虚拟化数据存储同样都不支持虚拟化特性,裸设备映射性能更好,所在6.3.1版本以后,把非虚拟化数据存储删除了。

9.存储虚拟化 1、裸设备+逻辑卷 非虚拟化数据存储 性能较好 2、主机存储虚拟化+文件系统 虚拟化数据存储 san(vims) 本地磁盘(ext4) nas(nfs)性能较差,应用于快照、链接克隆、精简配置等 3、存储设备虚拟化 Fusionstorage、advance san

10.FS\Advan SAN 与虚拟化数据存储的对比? 1、同样都支持虚拟化特性 2、FS虚拟化特性依赖DHT算法 3、FS是一种存储能力卸载的设备

存储能力卸载? 将原本需要CNA主机参与的动作,卸载交给FS、advsan自己实现。节省CNA主机的CPU。

11.如何给一个FC添加一个数据存储? 1、在FC上,添加存储资源(名字、类型、IP) 2、在存储侧创建lun,创建lun 创建主机,创建主组 添加映射关系 3、在FC上,存储资源,关联主机 4、在FC上,扫描存储设备,会扫出前面所映射单元 5、在FC上,把存储设备添加为数据存储。(虚拟化、非虚拟化、裸设备映射)

12.热迁移需要Tools吗? 新版FC热迁移不需要tools,6.5中不再需要。kvm本身可以实现。

13.HA? 解释:当一台主机或者虚拟机发生故障的时候,系统将会在资源池内启动一台虚拟机到其他可用的物理主机上。

原理:VRM或者集群的Master节点检测到某计算节点故障或者虚拟机故障,主动根据自身记录的虚拟机信息,在正常的节点上重新启动故障虚拟机,同时,存储层面的锁机制防止在多个节点上启动虚拟机。

怎么触发HA? 1.主机发生宕机、上下电、重启的时候 2.虚拟机系统放生故障的时候:window蓝屏、Linux Panic 3.CAN与VRM心跳中断30秒的时候 4.系统故障检测,通过在主机之间实行网络心跳检测,发现没有主机与虚拟机没有IO行为的时候触发HA(整个行为与VRM无关)

预留方案 HA 资源预留:在整个集群内按照配置的值预留 CPU 与内存资源,该资源仅用于虚拟机 HA 功能使用。 使用故障专用切换主机:预留故障专用切换主机,平时该主机不对外提供业务。 集群允许主机故障设置:设置集群内允许指定数目的主机发生故障,系统定期检查集群内是否留有足够的资源来对这些主机上的虚拟机进行故障切换。

条件: 1.安装Tools(实验证明,没有tools也能HA)。且正常运行;2.其他主机有预留HA资源,不能处于维护模式;3.共享磁盘;4.VM不能绑定主机,USB设备和GPU;5.集群开启HA功能。

整个HA过程数据会丢失吗? 会,会丢失未落盘的数据。