
获得徽章 0
BytePS 结合了字节跳动人工智能实验室几个月来对分布式训练通信的多个研究与优化成果,包含通信优先级调度、PS 的 RDMA 实现、针对 PCIe switch 与 NUMA 的优化,以及 BytePS 本身构架的创新等。
深度学习的效果取决于模型与数据,目前行业内不断刷新深度学习准确率的最新研究,大多都基于更大的模型以及更大的数据集。然而,大模型与大数据对训练时的计算能力提出了极高要求,单张 GPU 卡,或者单台服务器上的 GPU 卡,已经远远不能够满足内部训练任务的需求。因此,分布式训练的效率,即使用多台服务器协同进行训练,现在成为了深度学习系统的核心竞争力。
一直以来,在分布式训练中有两大流派,分别是 allreduce 和 PS(Parameter Server)。过去三年中,尤其是百度提出 allreduce,以及 Uber 开源基于 allreduce 的 Horovod 之后,行业内的认知中,allreduce 是最好的分布式训练通信方式,而过去的 PS 实现的性能也确实与 allreduce 存在一定差距。
BytePS 则颠覆了 allreduce 长期领先的局面,BytePS 拥有着超出目前其他所有分布式训练框架一倍以上的性能,包括 NVIDIA 开源的 NCCL,Uber 开源的 Horovod,以及 Tensorflow、PyTorch、MXNet 自带的分布式训练方案等。
BytePS 开发团队表示,在公有云或者私有云这类共享集群中,经过精巧设计和高质量实现的 PS,PS 架构不仅不比 allreduce 差,而且在一些环境还能得到比 allreduce 还高一倍的速度。
深度学习的效果取决于模型与数据,目前行业内不断刷新深度学习准确率的最新研究,大多都基于更大的模型以及更大的数据集。然而,大模型与大数据对训练时的计算能力提出了极高要求,单张 GPU 卡,或者单台服务器上的 GPU 卡,已经远远不能够满足内部训练任务的需求。因此,分布式训练的效率,即使用多台服务器协同进行训练,现在成为了深度学习系统的核心竞争力。
一直以来,在分布式训练中有两大流派,分别是 allreduce 和 PS(Parameter Server)。过去三年中,尤其是百度提出 allreduce,以及 Uber 开源基于 allreduce 的 Horovod 之后,行业内的认知中,allreduce 是最好的分布式训练通信方式,而过去的 PS 实现的性能也确实与 allreduce 存在一定差距。
BytePS 则颠覆了 allreduce 长期领先的局面,BytePS 拥有着超出目前其他所有分布式训练框架一倍以上的性能,包括 NVIDIA 开源的 NCCL,Uber 开源的 Horovod,以及 Tensorflow、PyTorch、MXNet 自带的分布式训练方案等。
BytePS 开发团队表示,在公有云或者私有云这类共享集群中,经过精巧设计和高质量实现的 PS,PS 架构不仅不比 allreduce 差,而且在一些环境还能得到比 allreduce 还高一倍的速度。
展开
评论
点赞
PoseNet 2.0发布,一个在浏览器里就能运行的人体姿态检测算法,这次还包括了一个更精准的基于ResNet的模型。demo在此:
storage.googleapis.com GitHub在此:
github.com 来源量子位
展开
评论
32
“我确信这是一张假脸,它具有AI合成假脸的所有特征。”德国艺术家Mario Klingemann说。
审查了Katie Jones在LinkedIn上的个人资料的专家表示,这是专业社交网站上典型的间谍活动,LinkedIn网站作为全球Rolodex角色对间谍具有强大的吸引力。
审查了Katie Jones在LinkedIn上的个人资料的专家表示,这是专业社交网站上典型的间谍活动,LinkedIn网站作为全球Rolodex角色对间谍具有强大的吸引力。
评论
点赞
【谷歌造了个虚拟足球场,让AI像打FIFA一样做强化学习训练】今天,谷歌开源了足球模拟环境Google Research Football,智能体可以在这个宛若FIFA的世界里自由踢球,学到更多踢球技巧。
tech.sina.com.cn
1
1
【0.5秒闪译,12倍速转写,科大讯飞一口气发布五款超强AI产品】
t.cn
讯飞翻译机3.0:3.0版本的翻译机,支持普通话与粤语、东北话、河南话、四川话等方言之间的翻译,还新增了维汉、藏汉等民族语言翻译,翻译速度也再度提升,达到“0.5秒闪译”,并提升了图像拍照翻译水平。
此外,离线引擎也有了新的升级,采用了新一代离线语音识别引擎、离线翻译引擎,并内置了高通骁龙八核处理器。
讯飞转写机:科大讯飞将其定位为“面向办公场景的语音转写移动工作站”。
最大的亮点,是内置离线解决方案,转写准确率能够达到95%以上;并支持对讲话人进行智能分区、中英文同步展示、字幕实时叠加功能等等。
讯飞智能录音笔:与大部分录音笔不同,这款录音笔还带有独立的触摸屏,转写结果可以直接看到。并支持翻译功能,而且,翻译结果不仅能够实时可见,也能够实时可听。
对于录音的后期整理上,也有不少针对性的功能,能够对重点快速进行标记,支持语音便捷搜索,通过4G、WiFi方式连接网络,能够实现录音文本快速分享。
讯飞智能办公本:这是一款墨水屏智能硬件设备,屏幕大小为10.3吋。核心的亮点是,能够让你在录音转写的同时,也能够手写记录要点。
手写关键词也可以做到字音同步,只要点击手写的文字,就能播放手写文本时的语音。
讯飞学习机:讯飞介绍称,基于智学网随机调研的400万学生中35亿条数据,他们发现学生60%的练习都是无效的。围绕着这个方面,学习机主要有两大功能:一是数理化精准学习提升效率,二是英语听说读写综合提升。
讯飞翻译机3.0:3.0版本的翻译机,支持普通话与粤语、东北话、河南话、四川话等方言之间的翻译,还新增了维汉、藏汉等民族语言翻译,翻译速度也再度提升,达到“0.5秒闪译”,并提升了图像拍照翻译水平。
此外,离线引擎也有了新的升级,采用了新一代离线语音识别引擎、离线翻译引擎,并内置了高通骁龙八核处理器。
讯飞转写机:科大讯飞将其定位为“面向办公场景的语音转写移动工作站”。
最大的亮点,是内置离线解决方案,转写准确率能够达到95%以上;并支持对讲话人进行智能分区、中英文同步展示、字幕实时叠加功能等等。
讯飞智能录音笔:与大部分录音笔不同,这款录音笔还带有独立的触摸屏,转写结果可以直接看到。并支持翻译功能,而且,翻译结果不仅能够实时可见,也能够实时可听。
对于录音的后期整理上,也有不少针对性的功能,能够对重点快速进行标记,支持语音便捷搜索,通过4G、WiFi方式连接网络,能够实现录音文本快速分享。
讯飞智能办公本:这是一款墨水屏智能硬件设备,屏幕大小为10.3吋。核心的亮点是,能够让你在录音转写的同时,也能够手写记录要点。
手写关键词也可以做到字音同步,只要点击手写的文字,就能播放手写文本时的语音。
讯飞学习机:讯飞介绍称,基于智学网随机调研的400万学生中35亿条数据,他们发现学生60%的练习都是无效的。围绕着这个方面,学习机主要有两大功能:一是数理化精准学习提升效率,二是英语听说读写综合提升。
展开
评论
4
Facebook称其新的AI技术可以更快发现仇恨言论
www.cnbeta.com
Facebook的人工智能工程师已经研发出一种称为自我监督学习的技术,因此社交网络的技术可以更快地适应诸如发现仇恨言论等挑战。自我监督学习需要的培训数据远远少于常规人工智能培训,这样可以缩短组装培训数据和培训系统所需的时间。
目前已将所需的培训数据量减少了10倍,Facebook的人工智能研究负责人Manohar Paluri周三在该公司的F8开发者大会上表示。
而这种速度对于让Facebook变得有趣和安全至关重要,社交网络不应该成为有毒评论,错误信息,滥用和诈骗的污水池。
Facebook的AI正在改善世界上最大的社交网络上的许多问题:欺凌,仇恨言论,暴力,恐怖主义宣传,儿童相关有害内容,垃圾邮件,成人内容和虚假账户。AI系统更容易提供对于自然语言处理(NLP)或理解人类语音和文本等任务非常有用的“海量数据”。 Schroepfer说,Facebook也正在使用自我监督的学习来处理照片,视频和文字
Facebook的人工智能工程师已经研发出一种称为自我监督学习的技术,因此社交网络的技术可以更快地适应诸如发现仇恨言论等挑战。自我监督学习需要的培训数据远远少于常规人工智能培训,这样可以缩短组装培训数据和培训系统所需的时间。
目前已将所需的培训数据量减少了10倍,Facebook的人工智能研究负责人Manohar Paluri周三在该公司的F8开发者大会上表示。
而这种速度对于让Facebook变得有趣和安全至关重要,社交网络不应该成为有毒评论,错误信息,滥用和诈骗的污水池。
Facebook的AI正在改善世界上最大的社交网络上的许多问题:欺凌,仇恨言论,暴力,恐怖主义宣传,儿童相关有害内容,垃圾邮件,成人内容和虚假账户。AI系统更容易提供对于自然语言处理(NLP)或理解人类语音和文本等任务非常有用的“海量数据”。 Schroepfer说,Facebook也正在使用自我监督的学习来处理照片,视频和文字
展开
评论
1
刚刚结束的Dota“人机决战”上,TI8冠军OG,0:2完败给OpenAI,第二局直到最后只拿下了6个人头。
5
6
【Facebook开源了超大规模#图嵌入#算法,上亿个节点也能快速完成】要把图数据喂给机器学习,就要先用图嵌入把数据变成低维向量。可上亿个节点的图,传统方法会捉急。所以,Facebook发布了#PyTorch-BigGraph#,说再大的图,也能快速生成图嵌入。GitHub 地址:
github.com
详细介绍参见
mp.weixin.qq.com
详细介绍参见
展开
评论
3
#一周AI# 近日,Science Robotics 发表一篇由瑞士研究员发明的一款对话机器人,它能够使鱼和蜜蜂这两种几乎不可能“见面”的物种进行交流。
科研人员在相隔700公里的鱼群和蜂群中,分别放置一个“电话”(机器人),两个机器人分别收集来自鱼群和蜂群的信号,而后将接收到的信号转换成对方物种能够“听得懂的话”。两组动物都对这些信号有反应;鱼开始沿着信号指定的方向游动,蜜蜂开始朝着其中一个终端聚集。两组中的机器人记录下每组的动态,并交换这些信息,然后将接收到的信息转换成对应物种的信号。
研究结果表明,在多个物种的生物混合体中生成并控制行为模式是可行的,为新的人工集体智慧打开了大门。参考来源
weibo.com
科研人员在相隔700公里的鱼群和蜂群中,分别放置一个“电话”(机器人),两个机器人分别收集来自鱼群和蜂群的信号,而后将接收到的信号转换成对方物种能够“听得懂的话”。两组动物都对这些信号有反应;鱼开始沿着信号指定的方向游动,蜜蜂开始朝着其中一个终端聚集。两组中的机器人记录下每组的动态,并交换这些信息,然后将接收到的信息转换成对应物种的信号。
研究结果表明,在多个物种的生物混合体中生成并控制行为模式是可行的,为新的人工集体智慧打开了大门。参考来源
展开
1
2
一位名叫 Damian Bogunowicz 的慕尼黑工业大学硕士生,和他的小伙伴一起利用计算机视觉、深度强化学习和 Unity 3D 游戏引擎开发了一款自主收集垃圾的机器人。据 Damian 的博客介绍,他和小伙伴被慕尼黑啤酒节的一片狼藉的垃圾所震撼,由此想到是否能开发出一款智能机器人,全天候、高效率的帮助这些清洁工人,那么他们的工作效率就会成几何倍数增长。
他们使用 Unity 3D 游戏引擎模拟机器人,此外,还使用 Unity Machine Learning Agents Toolkit(ML-Agents)插件,使游戏场景成为训练智能体的环境。在这个实验中,他们将机器人的目标设置为探索环境并学习正确的策略。然后设定一系列的奖励和惩罚,使得机器人的动作越来越熟练。
weibo.com
他们使用 Unity 3D 游戏引擎模拟机器人,此外,还使用 Unity Machine Learning Agents Toolkit(ML-Agents)插件,使游戏场景成为训练智能体的环境。在这个实验中,他们将机器人的目标设置为探索环境并学习正确的策略。然后设定一系列的奖励和惩罚,使得机器人的动作越来越熟练。
展开
评论
6
英伟达公布了一项名为「GauGAN」的技术,只需要在屏幕左侧的简单涂鸦,通过庞大的影像资料量让电脑系统进行深度学习,就可以快速改变右侧图中的自然场景。油管:
www.youtube.com
离失业又进了一步…
离失业又进了一步…
2
22