LC3会上飞天技术专场:阿里云弹性计算核心技术解密专场回顾

305 阅读2分钟
原文链接: click.aliyun.com
在备受业界关注的LC3会议飞天技术汇专场上,飞天技术专场:阿里云弹性计算核心技术解密专场内容颇为丰富,阿里云弹性计算团队分享了人工智能应用性能加速、热迁移、virtio-blk的加速qcache等议题,同时还对提升虚拟机性能提出了新的思考。
高级技术专家昀龙带来了人工智能服务极致加速的分享。通过不同的应用优化案例提出了若干针对AI场景的解决方案。例如,在一个CTR预估训练场景中, 通过GPU分布式训练性能优化,性能大约可提升至原来的14倍。
57a2b7bd71477a9415b04f24c651320d4b995368 9b79a32831411bc8d5b6b03f661ba9df35a1d614
技术专家张超分享了阿里云弹性计算高可靠性的技术保障之一:热迁移技术。通过热迁移技术,可以使虚拟机在保持运行状态的情况下,将其从一个物理宿主机迁移到另外一个物理宿主机,整个过程用户几乎无感。
2e5c57d2995efda716e014370a0bdf93704a83b2

高级工程师念卿全面分享了virtio-blk的加速qcache的相关内容。从kvm的存储背景栈,qcache的工作原理,qcache常见的使用模式,qcache的性能展示,到未来工作的思考等方面详细介绍了qcache。 除了介绍qcache的基本工作原理外,念卿还介绍了qcache 的两个特征,大量未命中请求处理以及seq-cut-off。其中,在大量请求未命中的场景,为了减少cache 磁盘压力以及保持guest请求的响应速度,qcache会在未命中请求过多的时候采用 PT的方式进行处理。而seq-cut-off特征提供了一种方法,使得可以自主调整是否缓存大块连续的请求。最后,会议介绍了 qcache的未来发展方向,包括spdk,optane 的支持,QOS的支持,cache size的动态分配以及开源。

0d6b1b44237cb2bcc4bd7079d2352d0c734976ac

高级技术专家哲杨则对典型业务场景在虚拟化场景下存在的性能问题进行了分析,并由此提出了一个新的技术解决方案。该方案通过在内核进行少量的修改,可以有效地降低虚拟化的开销,同时提升虚拟机的性能。在实际的业务测试场景中,通过该方案,可以有效提升大约20%的系统性能。

a610978c93fcca7d18e7d4205201594925694ed5

c1c71dce43783cdeb5287b21b8a3a27573db8aaa