首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
IguoChan
掘友等级
机器学习平台工程师
|
快手
盾盾守护者、王小波门下走狗、五道口职业技术学院9003大楼非唯一0号球员
获得徽章 6
动态
文章
专栏
沸点
收藏集
关注
作品
赞
11
文章 11
沸点 0
赞
11
返回
|
搜索文章
IguoChan
机器学习平台工程师 @快手
·
6天前
关注
sglang(1):开发环境搭建
0. 简介 sglang是一个高性能的大语言模型和视觉-语言模型服务框架。 它旨在从单 GPU 到大型分布式集群等各类部署环境中提供低延迟、高吞吐量的推理服务。 在通过na...
1
评论
分享
IguoChan
机器学习平台工程师 @快手
·
15天前
关注
nano-vllm(3):Continuous Batching
0. 概念 0.1 为什么需要批处理 LLM以自回归方式进行decode,而decode阶段是典型的数据密集型的计算方式,如果GPU调度时每次只计算一个Sequence,只...
0
评论
分享
IguoChan
机器学习平台工程师 @快手
·
19天前
关注
nano-vllm(2):KV Cache、PagedAttention和nano-vllm的实现
0. 什么是KV Cache 在0. nano-vllm:大模型推理原理和流程中我们阐述了大语言模型作为一种自回归模型的基本工作流程,其主要工作阶段分为: prefill阶...
0
评论
分享
IguoChan
机器学习平台工程师 @快手
·
25天前
关注
nano-vllm(1):大模型推理原理和流程
0. 简介 LLM:就是大语言模型,指参数量较大且具有较强生成能力的语言模型。 vLLM:功能完备的生产级大语言模型推理引擎。 nano-vllm:是vLLM的极简教学版实...
1
评论
分享
IguoChan
机器学习平台工程师 @快手
·
2月前
关注
2. d2l — softmax回归
0. 简介 线性回归是预测多少的问题,而回归亦可被用于预测哪一个的问题: 某个电子邮件是否属于垃圾邮件文件夹? 某个用户可能注册或不注册订阅服务? 某个图像描绘的是驴、狗、...
0
评论
分享
IguoChan
机器学习平台工程师 @快手
·
3月前
关注
1. d2l — 线性回归
0. 背景 虽然一直从事的是工程开发,但是目前从事的工作和算法、特别是大模型相关,因此想了解一下算法的相关基础,而d2l就是入门的教程,可参考dl2。 比如书中中的线性回归...
1
1
分享
IguoChan
机器学习平台工程师 @快手
·
7月前
关注
话一话职场PUA
原文 工作已逾三年,第一份工作在某汽车电子公司,从事Linux应用开发。现旷厂后端开发在职。忽然在知乎刷到职场PUA,今日也来从自己的经历谈一谈这个话题吧。 我性格张扬,求...
5
1
分享
IguoChan
机器学习平台工程师 @快手
·
7月前
关注
10. Redis Operator (3) —— 监控配置
0. 简介 前面,我们已经分别可以部署了单机版和Sentinel版的Redis Operator,我们现在来完善一些监控指标。 0.1 Redis Exporter Red...
0
评论
分享
IguoChan
关注了
阿里云云原生
机器学习平台工程师 @快手
IguoChan
机器学习平台工程师 @快手
·
8月前
关注
9. Redis Operator (2) —— Sentinel部署
0. 简介 上一篇,我们借由Redis的单机部署,学习了一下Operator的基本使用,今天,我们在此基础上,部署一下Redis的Sentinel模式。 Sentinel本...
2
评论
分享
IguoChan
赞了这篇文章
jack_yin
@百度
·
8月前
关注
修复 Go 官方 Bug,被GOLANG创始人 Rob 点名 CR 是什么体验?
一行不起眼的代码,一次直通 Go 源码的奇妙旅程 去年,在我日常阅读 Golang 官方 issue 时,一条并不起眼的问题引起了我的注意。 某位开发者在 Go 的 tex...
42
11
分享
IguoChan
机器学习平台工程师 @快手
·
9月前
关注
8. Redis Operator (1) —— 单机部署
0. 简介 k8s内置的资源类型,可以满足绝大部分的需求,然而对于追求更高自由度的特殊需求下,用户可以使用CRD(CustomResourceDefinition)实现,无...
5
评论
分享
IguoChan
赞了这篇文章
陈珙_SkyChen
11月前
关注
后端思维之高并发方案
我有话想说 这篇文章的构思始于2023年,受限于个人经验与知识积累,初稿拖延至2025年1月才最终完成。在此过程中,许多同行大佬慷慨提供了审稿意见与建议,对此我深表感谢。 ...
77
9
分享
IguoChan
赞了这篇文章
京东云开发者
技术运营 @京东科技信息技术有限公司
·
2年前
关注
简单一招竟把nginx服务器性能提升50倍
需求背景 接到重点业务需求要分轮次展示数据,预估最高承接 9w 的 QPS,作为后端工程师下意识的就是把接口写好,分级缓存、机器扩容、线程拉满等等一系列连招准备,再因为数据...
45
4
分享
IguoChan
赞了这篇文章
爱敲代码的小黄
公众号 | 爱敲代码的小黄 @阿里巴巴
·
2年前
关注
2023年度总结:晋升、跳槽、万粉、圆梦、成为阿里淘天人
2023年度总结:晋升、跳槽、万粉、圆梦、成为阿里淘天人又到了一年一度的年终总结时间了,不出所料,今年我的年终总结又迟到了,不过没关系,好东西永远不怕晚...
112
50
分享
IguoChan
机器学习平台工程师 @快手
·
2年前
关注
7. gRPC 基于 endpoints 做客户端负载均衡
0. 简介 在 3. Service 中我们可以知道,Service 负载均衡是在第四层,而 gRPC 是基于 HTTP/2 协议的长连接,第四层的基于连接的负载均衡对其不...
1
评论
分享
IguoChan
关注了
爱发白日梦的后端
机器学习平台工程师 @快手
IguoChan
赞了这篇文章
爱发白日梦的后端
公众号 【爱发白日梦的后端】
·
2年前
关注
10个令人惊叹的Go语言技巧,让你的代码更加优雅
在开发生产项目的过程中,我注意到经常会发现自己在重复编写代码,使用某些技巧时没有意识到,直到后来回顾工作时才意识到。 为了解决这个问题,我开发了一种解决方案,对我来说非常有...
111
9
分享
IguoChan
机器学习平台工程师 @快手
·
2年前
关注
6. Sidecar 容器
0. 简介 边车(Sidecar)一般指的一种附有单轮的设备,加装在摩托车等车侧,而边车容器指的也是这种可以随时拆卸的容器。比如我们会经常在一个 Pod 中除了设置主程序容...
1
评论
分享
IguoChan
机器学习平台工程师 @快手
·
2年前
关注
5. Pause 容器
0. 简介 前面我们说过,一个 Pod 中的可以有多个容器,其实准确的说,一个 Pod 除了应用容器外,还至少应该拥有一个 Pause 容器。那这个 Pause 容器是干嘛...
1
评论
分享
下一页
个人成就
文章被点赞
180
文章被阅读
106,419
掘力值
2,671
关注了
4
关注者
119
收藏集
1
关注标签
18
加入于
2022-07-24