首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
嵌入式视觉
掘友等级
算法开发工程师
|
商汤科技
关于博主,本科双非一本,曾3个半月考研上岸某 211,现大厂算法开发工程师,从事视觉算法开发、模型压缩部署、LLM 推理部署工作,终身学习践行者。
获得徽章 8
动态
文章
专栏
沸点
收藏集
关注
作品
赞
414
文章 387
沸点 27
赞
414
返回
|
搜索文章
赞
文章( 387 )
沸点( 27 )
农村程序员&独立开发者,在村里各处写代码的日常与一路走来的历程
大家好,我是陈随易,目前是全职自由独立开发者,已经3年没上班了,一直待在农村。23年6月到9月,研发和推出了自己的2款自研小产品(utools插件易待办和vscode扩展fnMap),盈利6000元。
🔥🔥🔥在北京这种城市,周末假期怎么整才算浪......
看到这很多人可能就要发现了, 这不是一篇技术文,不过不重要了... 这一年都在拥抱变化 今年我更文只有2-3篇,主要是因为今年2月份经历了团队大调整,我们客户端4个同学被整体划到了另一个客户端团队,目
RPC 保姆级教程
RPC(Remote Procedure Call),即远程过程调用,主要是为了解决在分布式系统中,服务之间的调用问题。 分布式系统顾名思义就是将一个完成任务 A 的整体的系统拆分成多个模块服务分别部署在不同的计算机节点上,这些模块通过网络通讯协同工作完成任务 A。分布式系统主…
深度学习模型大小与模型推理速度的探讨
本文将对衡量深度学习模型大小的一些常用指标,如计算量、参数量、访存量、内存占用等进行探讨,分析这些指标对模型部署推理的影响,尤其是计算量与访存量对模型推理速度的影响,并给出在不同硬件架构下设计网络结...
transformers库快速入门
本文总结了 Transformers 的常用术语并给出详细解释,然后对 transformers 库总结了快速使用方法,并结合实例代码做分析,可当作 LLM 的快速入门学习。
DeepSpeed: 通过系统优化和压缩加速大规模模型推理和训练
我们都知道大语言模型(LLM)的计算成本极高,且在许多实际场景中都会有响应速度太慢的问题,总结起来就是 LLM 的推理的有两个主要挑战:延迟(lateny)和成本(cost)。
DeepSpeed 推理: 具有定制推理内核和量化支持的多 GPU 推理
本文总结了 DeepSpeed Inference 系统的主要三个特性,如具有自适应并行性的多 GPU 推理、专为推理优化的 CUDA 内核和灵活的量化感知训练以及量化推理内核。
⚠️ 关于掘金社区 2023 年1-2 双月内容治理的公告
掘金一直致力于为广大掘友提供一个良好的平台和多元的内容,我们始终坚持抵制抄袭、刷量、谩骂等违反社区规则的行为,欢迎大家监督,也欢迎大家参与到我们的社区建设中。
22年回家,治好了我的精神焦虑,终于睡了一周的好觉
每天晚上睡觉就做梦,半年了,回家睡得很香,确诊了,我就是太焦虑了,来自30岁的焦虑,一种离职就能好的病。
BLOOM模型结构详解
BLOOM模型也是 Decoder-only 架构,但和原始 decoder 结构主要有两个区别: ALiBi Positional Embeddings 和 Embedding LayerNorm。
下一页
个人成就
优秀创作者
文章被点赞
1,448
文章被阅读
690,844
掘力值
10,352
关注了
36
关注者
310
收藏集
2
关注标签
56
加入于
2019-03-30