@生信工程师,无需IT专家也能搞定的生信混合云算力平台是什么?

62 阅读5分钟
  • 初创团队,没有单独的IT,生信部门如何在完成业务的同时兼顾IT管理?
  • 业务发展挺好,但老板说接下来生信预算砍一半,如何承接越来越好的业务增长?
  • 业务量时多时少,本地服务器经常不够用,接下来IT资源怎么配置才合适?

MMCloud是一个能帮助生信团队实现降本增效的平台,这两年我们和越来越多的生信企业、科研团队一起验证了这个平台的效果——降本50%,提效30% ,这个不是宣传话术,而是我们所有客户运行下来的平均数值。

降本这个事儿,也没那么神秘。没有什么技术含量的降本逻辑是,和云厂商变成好朋友!拿到更低的折扣,再转手赚个差价,但这种方式既不稳定也拿不到特别低的折扣。

真正有效的降本办法是通过核心技术能力调度云平台公开的低折扣资源,同时保障业务运行过程中所使用的云资源和业务的高峰低谷量保持一致,不多花一分冤枉钱。

那么问题就来了,核心技术是啥?

MMCloud的核心是应用胶囊技术(AppCapsule),这是由MemVerge独创的checkpoint/restore功能。应用胶囊指的是某个应用程序的进程或者进程组的“运行时快照”,可用于支持应用进程的热迁移、高可用和按时间回滚。

图片

热迁移意味着可以将一个云主机在线移动到另一个中去,例如,移动到更高配置的云主机,该云主机的CPU、内存规格可能更适合该应用进程的下一阶段运行;或者移动到更低配置的云主机,使得空间的主机资源得以释放来节省成本。

高可用是指支持对应用进程的运行状态提供保护机制,当该应用进程所在的云主机实例被抢占或者回收时,应用进程将自动迁移到新的云主机并恢复运行,且该过程对用户是透明的。

按时间回滚是指应用进程可以使用过去某时刻的应用胶囊,来将应用运行状态恢复到过去时刻,这个能力常常被用于devops或者AI/ML这类需要频繁调整参数来重新启动应用的场景。

再通俗易懂点说,MMCloud算力调度平台以应用为核心进行本地集群和云端资源的混合管理、调度,面向生物分析场景,提供兼顾稳定高效和极致成本的解决方案。

但别误会,我们不是云代理商,不是“转卖”云厂商的算力资源;

我们也不是卖服务器,我们是帮你调度你们已经买好了的本地集群+云端算力;

当然,我们也不是公有云平台,我们和AWS、阿里云、腾讯云、火山云、百度云这些主流云平台是手拉手的好伙伴。

你可以把MMCloud当作为你量身定制的IT团队,你负责生信业务,我们来解决把底层IT资源变成好用的业务资源,主打一个超级易用,非IT也能快速上手。

图片

既然是混合云调度,那么就是本地集群也能调一调,云平台也能度一度。

一说到云,我们接触的很多生信团队对于上云这件事就有顾虑,一方面是没有懂云的人,需要从头开始了解各种云平台的技术能力和配置,特别是生信环境搭建起来复杂度又比较高;另一方面是觉得贵,有意思的是之前碰到一些企业,我们会先问一下:为什么不用云?对方总是很干脆利落的回答我们一个字:贵。

后来我们也不问了,如果你不用云,咱就帮你调度本地集群,如果你用云,那就调云算力;如果你都有,巧了,咱也都能调度。

对于已经在本地有服务器或者正在使用超算的团队来说,我们提供的混合云算力调度解决方案可以让企业在不改变原有的资源配置、团队配置和使用习惯的基础上,对于业务突发带来的算力需求激增,通过公有云算力服务来解决。

混合云是一种结合了本地和云端资源的架构,因为它具有很大的灵活性和可扩展性,所以在高性能计算(HPC)中变得很受欢迎。简单来说就是当你的计算需求超过了本地资源的限制时可以迅速地利用云端资源,MMCloud允许用户使用熟悉的HPC作业管理器,比如SLURM和PBS,在云端启动作业,有效地扩展了本地HPC环境与公有云的结合。

有突发任务怎么办?一杯咖啡钱弹到云上跑一跑;数据量太大,原本需要跑1天,没关系,我们1个小时跑完;

听说平台产品部署起来都很复杂,之前装几个分析软件都废掉半条命,我们点开链接就能用,还能一键提交脚本。

除此之外,还有……

  • 符合生命科学用户习惯的界面设计;
  • 兼容主流的生命科学流程框架和工具;

最后,一起来复盘下这个平台的价值

  • 大规模算力:支持主流公有云厂商(AWS、谷歌云、阿里云、腾讯云、百度云、火山云)
  • 应用智能调度:支持主流调度系统(SLURM、LSF、PBS、SGE);基于应用智能分配资源(SpotSurfer、 WaveRider);基于应用智能迁移、断点续算 
  • 混合统一管理:支持本地与云端统一资源管理;本地与云端统一混合调度
  • 降本增效:基于AI智能分析应用行为、合理分配应用资源,降低成本;基于AI 智能分析任务、优化任务workflow、提升业务效率

图片