首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
果冻虾仁
掘友等级
公众号
|
编程往事
C++工程师,brpc committer,搜广推在线工程
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
10
文章 10
沸点 0
赞
10
返回
|
搜索文章
最新
热门
[译] 深入vLLM:高吞吐LLM推理系统剖析
本文将从分页注意力机制、连续批处理、前缀缓存、投机解码再到大规模多GPU、多节点的动态服务逐一展开。
盖坤长序列建模论文解读系列:SIM
盖坤在搜广推领域可谓鼎鼎大名,2011年盖坤清华大学博士毕业,以第一批“阿里星”计划的身份入职阿里的广告团队,即阿里妈妈。早年以发表了用于召回的模型TDM闻名,后来长期致力于推荐系统CTR预估领域。
[译] jemalloc归档事后剖析
原文 jemalloc内存分配器最初构思于 2004 年初,至今已公开使用约 20 年。得益于开源软件许可的特性,jemalloc 将无限期地保持公开可用。但其上游的积极开发工作已经结束。本文将简要介
防微杜渐,向扁鹊学习治理代码
疾在腠理,汤熨所及 “扁鹊见蔡桓公“曾入选中学课本,当年的教材节选删去了原文后面的一句议论: 故而语文老师们在讲授这篇文章时,将其中心思想落脚在“人要正视缺点,切莫讳疾忌医”上。但实际上有些断章取义
Pytorch2.0体验,一行代码开八门,让训练速度狂飙!
去年12月2日Pytorch团队官宣了Pytorch2.0。今年3月19日,Pytorch2.0终于从Preview 变成了Stable。来试一下Pytorch2中强大的一行代码让训练速度提升的能力!
AIGC体验与观察:第一期
无论是移动端还是PC端,在公众号文章的阅读页面是看不到封面图的,所以无法通过长按图片或者右键来保存的。需要自己从HTML源码中找到URL然后下载。现在来使用Cursor帮我提取公众号封面图,并自动命名
浅谈AIGC:人工智能的iPhone时刻,还是普通人至暗时刻?
2022年,当AI开始绘画的时候,很多设计师们觉得没什么。当AI开始生成代码的时候,很多程序员也觉得没什么。当ChatGPT出现的时候,才将AIGC这一领域彻底引爆。被称为AI届的『iPhone时刻』
一剑破万法:noexcept与C++异常导致的coredump
由于异常没有被catch导致的coredump。这是十分常见的一大的coredump原因,在后台服务中由于回调函数的存在,coredump常常给人以误导,今天我带你来勘破它。
使用bRPC和ONNX Runtime把BERT模型服务化
在上文中,我们将BERT的Pytorch模型转换成ONNX模型,并使用onnxruntime完成了python版的ONNX模型预测。今天我们来把预测搬到C++版本的bRPC服务上,模拟一下模型的部署。
实践演练BERT Pytorch模型转ONNX模型及预测
Pytorch模型部署上线一般需要转成ONNX模型,本文接续之前的文章继续实践演练,完成模型转换和利用onnxruntime完成预测。
下一页
个人成就
文章被点赞
119
文章被阅读
40,942
掘力值
1,233
关注了
2
关注者
34
收藏集
0
关注标签
27
加入于
2016-04-18