
获得徽章 0
- BytePS 结合了字节跳动人工智能实验室几个月来对分布式训练通信的多个研究与优化成果,包含通信优先级调度、PS 的 RDMA 实现、针对 PCIe switch 与 NUMA 的优化,以及 BytePS 本身构架的创新等。
深度学习的效果取决于模型与数据,目前行业内不断刷新深度学习准确率的最新研究,大多都基于更大的模型以及更大的数据集。然而,大模型与大数据对训练时的计算能力提出了极高要求,单张 GPU 卡,或者单台服务器上的 GPU 卡,已经远远不能够满足内部训练任务的需求。因此,分布式训练的效率,即使用多台服务器协同进行训练,现在成为了深度学习系统的核心竞争力。
一直以来,在分布式训练中有两大流派,分别是 allreduce 和 PS(Parameter Server)。过去三年中,尤其是百度提出 allreduce,以及 Uber 开源基于 allreduce 的 Horovod 之后,行业内的认知中,allreduce 是最好的分布式训练通信方式,而过去的 PS 实现的性能也确实与 allreduce 存在一定差距。
BytePS 则颠覆了 allreduce 长期领先的局面,BytePS 拥有着超出目前其他所有分布式训练框架一倍以上的性能,包括 NVIDIA 开源的 NCCL,Uber 开源的 Horovod,以及 Tensorflow、PyTorch、MXNet 自带的分布式训练方案等。
BytePS 开发团队表示,在公有云或者私有云这类共享集群中,经过精巧设计和高质量实现的 PS,PS 架构不仅不比 allreduce 差,而且在一些环境还能得到比 allreduce 还高一倍的速度。展开评论点赞 - PoseNet 2.0发布,一个在浏览器里就能运行的人体姿态检测算法,这次还包括了一个更精准的基于ResNet的模型。demo在此:
storage.googleapis.com GitHub在此:
github.com 来源量子位
展开等人赞过评论32 - “我确信这是一张假脸,它具有AI合成假脸的所有特征。”德国艺术家Mario Klingemann说。
审查了Katie Jones在LinkedIn上的个人资料的专家表示,这是专业社交网站上典型的间谍活动,LinkedIn网站作为全球Rolodex角色对间谍具有强大的吸引力。评论点赞 - 【谷歌造了个虚拟足球场,让AI像打FIFA一样做强化学习训练】今天,谷歌开源了足球模拟环境Google Research Football,智能体可以在这个宛若FIFA的世界里自由踢球,学到更多踢球技巧。
tech.sina.com.cn
赞过11 - 【0.5秒闪译,12倍速转写,科大讯飞一口气发布五款超强AI产品】
t.cn
讯飞翻译机3.0:3.0版本的翻译机,支持普通话与粤语、东北话、河南话、四川话等方言之间的翻译,还新增了维汉、藏汉等民族语言翻译,翻译速度也再度提升,达到“0.5秒闪译”,并提升了图像拍照翻译水平。
此外,离线引擎也有了新的升级,采用了新一代离线语音识别引擎、离线翻译引擎,并内置了高通骁龙八核处理器。
讯飞转写机:科大讯飞将其定位为“面向办公场景的语音转写移动工作站”。
最大的亮点,是内置离线解决方案,转写准确率能够达到95%以上;并支持对讲话人进行智能分区、中英文同步展示、字幕实时叠加功能等等。
讯飞智能录音笔:与大部分录音笔不同,这款录音笔还带有独立的触摸屏,转写结果可以直接看到。并支持翻译功能,而且,翻译结果不仅能够实时可见,也能够实时可听。
对于录音的后期整理上,也有不少针对性的功能,能够对重点快速进行标记,支持语音便捷搜索,通过4G、WiFi方式连接网络,能够实现录音文本快速分享。
讯飞智能办公本:这是一款墨水屏智能硬件设备,屏幕大小为10.3吋。核心的亮点是,能够让你在录音转写的同时,也能够手写记录要点。
手写关键词也可以做到字音同步,只要点击手写的文字,就能播放手写文本时的语音。
讯飞学习机:讯飞介绍称,基于智学网随机调研的400万学生中35亿条数据,他们发现学生60%的练习都是无效的。围绕着这个方面,学习机主要有两大功能:一是数理化精准学习提升效率,二是英语听说读写综合提升。展开等人赞过评论4