首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
前沿技术
OneFlow一流科技
创建于2021-12-13
订阅专栏
深度学习框架的创新实践。
等 3 人订阅
共22篇文章
创建于2021-12-13
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
有奖征集|与OneDiff加速前行,GenAI探索触手可及
现在,硅基流动正发起OneDiff应用案例征集活动,无论你是企业客户还是独立开发者,我们希望听到关于OneDiff加速你的GenAI应用的故事,并期待把创新案例分享给更多人,共同加速行业的创新步伐。
五年谷歌ML Infra生涯,我学到最重要的3个教训
近期,ML/AI Infra行业的发展引发了业内人士的热烈讨论。其中,硅谷创业公司Bluesky创始人Mingsheng Hong分享了他在这一领域的心路历程,总结了ML Infra发展的经验教训。
DeepMind爆发史:决定AI高峰的“游戏玩家”|深度学习崛起十年
很少有人会否认,过去十年,AI领域最耀眼的明星组织当属DeepMind,没有之一。 那个震动世界的高光时刻发生在2016年3月的一天,AI选手AlphaG击败了世界围棋冠军李世石的那一刻……
推出全新分布式计算接口!OneFlow v0.7.0发布,LiBai代码库、Serving、MLIR一应俱全
今天是 OneFlow 开源的地 610 天,OneFlow v0.7.0 正式发布。欢迎下载体验最新版本。
黄仁勋口述:英伟达的发展之道和星辰大海
在未来10年里,不一定是在晶体管层面,在计算层面我们绝对会看到更大的进步。如果人工智能要进入下一个阶段,就必须学习物理定律。
两大图灵奖得主力作:计算机架构的新黄金时代
”未来十年,将会有一场新计算机架构的寒武纪爆炸,这对业界和学界的架构师们来说将是激动人心的时刻。 “
强化学习算法成功控制核聚变;元宇宙里的AI玩出新花样
近期业内发布了这些有趣且重要的AI应用: Nature重磅:DeepMind利用强化学习算法成功控制核聚变装置 突破原有技术应用形态,Meta元宇宙这样玩AI 告别渣画质动漫视频,B站开源动漫超分辨率
AI系统内容推荐第25期:GPU架构变迁之AI系统视角:从费米到安培;GitHub 1.6万星的JAX并不完美;一个Tensor在深度学习框架中的执行过程
1、GPU架构变迁之AI系统视角:从费米到安培;GitHub 1.6万星的JAX并不完美;一个Tensor在深度学习框架中的执行过程
GPU架构变迁之AI系统视角:从费米到安培
技术脉络的演进,总是草蛇灰线、伏脉千里,透过某个技术出现的单点时刻,回溯其源起和演进路径,可以更有效地指导后续的技术决策,而不是寄希望于灵光一现式的运气。
Ion Stoica:做成Spark和Ray两个明星项目的秘笈
从中我们可以通过第一手资料了解到发起Spark和Ray、成立创业公司、重视开源、拥抱云这一系列关键决策是怎么做的。通过这篇文章,希望朋友们能找到Spark和Ray成功的秘笈。
深度学习框架如何优雅地做算子对齐任务?
这篇文章介绍了OneFlow的算子AutoTest框架,提供了一个深度学习优雅地做算子对齐的方法,使得开发者和用户可以像写PyTorch那样方便写测试程序。
CUDA高性能计算经典问题②:前缀和
Prefix Sum(前缀和),也被称为Scan/Prefix Scan等。Scan 是诸如排序等重要问题的子问题,所以基本是进阶必学问题之一。
以OneFlow为例探索MLIR的实际开发流程
OneFlow和MLIR是如何结合的,如何在OneFlow IR中新增一个图级别的Pass,OneFlow的Operation是如何自动变成MLIR 的Operation的?
最理想的点到点通信库究竟是怎样的?
在本文中,我们讨论一下,一个最理想的点到点通信库应该是什么样?如果现在还没有这样的库,我们何不一起做一个这方面的开源项目?
如何实现比PyTorch快6倍的Permute/Transpose算子?
经过深度优化后的Permute操作在OneFlow上的速度和带宽利用率远超PyTorch,带宽利用率能够接近原生Copy操作。
对齐PyTorch,一文详解OneFlow的DataLoader实现
OneFlow的动态图做到了几乎和PyTorch一致,其中也包括和torch几乎对齐的DataLoader/Dataset设计。
高效、易用、可拓展一键打包:CUDA Elementwise模板库的设计优化
OneFlow 针对这种 Elementwise 操作抽象出一套 CUDA 模板,开发者只需把计算逻辑封装到一个结构体内,即可获得一个 CUDA Elementwise 算子。
用OneFlow实现基于U型网络的ISBI细胞分割任务
本文更多以一个初次接触OneFlow框架的用户角度进行分析,包括API、分布式训练能力、高性能和我的一些实习感受
Credit-based Flow Control的前世今生
Credit-based Flow Control这简洁思路背后有着不简单的身世,甚至,还引发过一场激烈的学术论战,并且在论战中还输了。虽然输了, 它思想却在论战中得到了完善,后来在多个领域大放异彩。
如何超越数据并行和模型并行:从GShard谈起
我只介绍一些背景信息,以及从OneFlow里做过的类似工作来评价一下GShard还有哪些可改进的地方。只有把GShard放在上下文里去看,才能更清楚地看到它的好和不好。
下一页