首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
BothSavage
掘友等级
软件开发
写点代码
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
24
文章 24
沸点 0
赞
24
返回
|
搜索文章
赞
文章( 24 )
沸点( 0 )
OpenHarness源码研究-2-CLI构建工具Typer
OpenHarness源码研究-2-CLI构建工具Typer 前文 从cli.py,用传统web开发的视角,看typer框架如何定义通信和交互的,以及观察命令是如何设计的 运行主方法 入口方法 ope
OpenHarness源码研究-1-配置打包管理
OpenHarness源码研究-1-配置打包管理 前言 围绕OpenHarness中pyproject.toml配置细节展开,讲解项目打包工具的使用、uv包管理器的优势与操作方法 toml项目文件 b
Qwen3-VL-8B-Instruct推理测试transformer+sglang双版本
Qwen3-VL-8B-Instruct推理测试transformer+sglang双版本 契机 Qwen3-VL-8B发布了,结合官方demo+github仓库issue,在h20显卡服务器上跑了一
Ubuntu-8*H20服务器升级nvidia驱动+cuda版本
Ubuntu-8*H20服务器升级nvidia驱动+cuda版本 契机 看到qwen3-vl-30b开源了,想测试下性能+资源占用,奈何部署sglang需要12.7版本的cuda?我目前手里的H20的
Java获取被nginx代理的emqx客户端真实ip
Java获取被nginx代理的emqx客户端真实ip 契机 ⚙ 使用nginx作为负载均衡(Load Balancing)的时候,发现真实ip无法获取。几经折腾终于拿到真实ip,又发现被代理的端口又无
尝试使用gocryptfs实现大模型加密部署
最近公司需要把大模型部署到三方公司服务器,当然不能让三方公司搞到模型的源文件。由于用transformers框架加载模型,输入参数直接就是模型的目录,所以传统的文件加密有点难搞,所以尝试使用go
SkyWalking高频采集泄漏线程导致CPU满载排查思路
SkyWalking高频采集泄漏线程导致CPU满载排查思路 契机 最近在消除线上服务告警,发现Java线上测试服经常CPU满载告警,以前都是重启解决,今天好好研究下,打arthas火焰图发现是SkyW
旧版本NotionNext图片失效最小改动解决思路
旧版本NotionNext图片失效最小改动解决思路 契机 好久没写博客了,最近在notion写博客的时候发现用notionNext同步到个人网站时,图片无法预览。
Knife4j在Gateway下的URI优化以及热刷新
Knife4j在Gateway下的URI优化以及热刷新 契机 (遗留输出)最近在整理之前的笔记,逐渐梳理成文章输出到博客网站。之前在做Gateway集成knife4j的时候。发现uri的地址缺少了项目
部署Kimi-VL-A3B-Instruct视频推理
# 部署Kimi-VL-A3B-Instruct视频推理 # 契机 ⚙ 最近国内AI公司月之暗面推出了**Kimi-VL**开源视觉模型。模型参数16.4B,但是推理时候激活参数2.8B。看了hugg
下一页
个人成就
文章被点赞
41
文章被阅读
9,665
掘力值
492
关注了
0
关注者
4
收藏集
0
关注标签
0
加入于
2020-12-12