稀土掘金 稀土掘金
    • 首页
    • 沸点
    • 课程
    • 数据标注 HOT
    • AI Coding
    • 更多
      • 直播
      • 活动
      • APP
      • 插件
    • 直播
    • 活动
    • APP
    • 插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
  • 后端
  • 前端
  • Android
  • iOS
  • 人工智能
  • 开发工具
  • 代码人生
  • 阅读
  • 12GB 小模型路由器(推理篇):INT4、vLLM 与双 QLoRA 切换
    12GB:INT4+vllm双LoRA切换;max-model-len必写、避vllm._C目录;OpenAI兼容接口。
    • 韩师傅
    • 35分钟前
    • 1
    • 点赞
    • 评论
    PyTorch LLM 架构
    12GB 小模型路由器(推理篇):INT4、vLLM 与双 QLoRA 切换
  • 12GB 小模型路由器(实战篇):12GB 上 QLoRA 与训练环境
    12GB上QLoRA/SFT:数据与预期、cu128、快照与GPU自检;加载到首步易OOM,先dry run。推理下篇。
    • 韩师傅
    • 43分钟前
    • 4
    • 点赞
    • 评论
    PyTorch LLM
    12GB 小模型路由器(实战篇):12GB 上 QLoRA 与训练环境
  • 为什么我不再在简历里写"熟悉 XX"——一个被面试官问到 3 秒卡壳后的反思
    一个小故事 去年某次面试,面试官盯着我简历看了 30 秒,抬头问了我一个问题: "你这里写"熟悉 Redis"——我能问你 Redis 的主从复制是怎么做一致性保证的吗?"
    • 用户068185912054
    • 1小时前
    • 1
    • 点赞
    • 评论
    面试
  • 12GB 显存 + INT4 4B + vLLM + 双 QLoRA = 最小模型路由器
    12GB 显存上 INT4 底座 + vLLM 双 QLoRA,同底座按请求切能力;本文为引子,串动机与路线,命令在续篇。
    • 韩师傅
    • 1小时前
    • 4
    • 点赞
    • 评论
    LLM PyTorch 架构
    12GB 显存 + INT4 4B + vLLM + 双 QLoRA = 最小模型路由器
  • 数据结构----树
    本文介绍树的定义及递归特性,详解双亲、孩子、孩子兄弟三种存储结构,附 C 语言实现代码及初始化、查找、插入等基础操作说明。
    • yuannl10
    • 1小时前
    • 3
    • 点赞
    • 评论
    数据结构
  • elpis:企业级全栈框架
    前言 背景 业务开发过程中(尤其是后台项目),会有很多表单、表格这种相似的、重复开发的页面,针对这部分可以利用DSL进行描述、在运行时进行动态渲染,从而降低开发时间。因此elpis诞生了,框架核心采用
    • 歪脖砖家
    • 1小时前
    • 21
    • 点赞
    • 评论
    前端工程化
    elpis:企业级全栈框架
  • skill 合集
    这是一份涵盖常用技能及对应用法的合集,内容会持续更新迭代,诚邀各位积极推荐实用技能,助力合集不断丰富完善。
    • JenkinYu
    • 1小时前
    • 4
    • 点赞
    • 评论
    AIGC
  • 4-19 LeetCodeHot100-栈
    太好了我学了栈!这篇文章主要记录了我刷几道经典栈题后的理解,从括号匹配、最小栈到单调栈和字符串解码,总结了栈在处理“延迟计算”和嵌套问题中的核心作用。
    • 竹曲曲儿
    • 2小时前
    • 1
    • 点赞
    • 评论
    算法
  • Vue的响应式把我坑惨了,原来问题出在这
    Vue的响应式把我坑惨了,原来问题出在这** -- 引言 Vue.js 作为一款流行的前端框架,其响应式系统是其核心特性之一。然而,正是这个看似简单却深藏玄机的响应式机制,让不少开发者(包括我自己)踩
    • 阿橙的百宝箱
    • 2小时前
    • 21
    • 点赞
    • 评论
    后端 前端 人工智能
  • Java技术专家成长执行表
    一、1 年核心突破路线(优先级从高到低) 阶段 1:先补 JVM + 并发(2~3 个月) 目标:能看懂线上问题、能讲原理、能调优。 必学内容: JVM 内存结构、堆 / 栈 / 方法区 GC 算法、
    • 用户9381691255360
    • 2小时前
    • 3
    • 点赞
    • 评论
    Java
  • 从零开始学 Go:协程并发与 Web 开发初探
    从零开始学 Go:协程并发与 Web 开发初探 前言 最近开始系统学习 Go 语言,被它简洁的语法和强大的并发模型所吸引。本文是我学习过程中的一些笔记和代码整理,从最基础的语法到协程并发,再到用 Gi
    • 不会敲代码1
    • 2小时前
    • 2
    • 点赞
    • 评论
    Go
  • 跨境电商之ozon
    Ozon是俄罗斯新跨境电商黑马,同时也是俄罗斯市场唯一的多品类综合电商平台。Ozon拥有1140万俄罗斯客户群,每天有超过300万的独立访客。ozon作为跨境电商新手入门是个不错的选择。 下面是我整理
    • shining
    • 2小时前
    • 3
    • 点赞
    • 评论
    开源
  • Java技术专家成长规划
    一、先明确:Java 技术专家到底是什么水平? 不是 “写代码很溜”,而是: 能独立负责复杂系统(微服务、高并发、分布式) 能做技术选型、架构设计、方案评审 能解决线上疑难问题、性能瓶颈、稳定性风险
    • 用户9381691255360
    • 3小时前
    • 2
    • 点赞
    • 评论
    Java
  • 我用 Vue3 + Web Workers 做了一个胶片效果模拟器,全程在浏览器运行
    在线体验:https://seamys.github.io/grainlab/ GitHub:https://github.com/seamys/grainlab 为什么做这个 我喜欢胶片摄影,但胶片
    • 用户373494961395
    • 3小时前
    • 4
    • 点赞
    • 评论
    前端
    我用 Vue3 + Web Workers 做了一个胶片效果模拟器,全程在浏览器运行
  • Por que los aviones son mas lentos que antes
    下面从正文内容开始整理,已跳过开头的译者信息。 我会按你的要求,按原顺序逐句处理;遇到长句,先拆分再解释。 【第1句】 西语原句: En 1996, un avión de British Airwa
    • 用户38350844486
    • 3小时前
    • 5
    • 点赞
    • 评论
    前端
  • 欠薪维权实录:仲裁调解达成分期赔付
    复盘了作者因公司欠薪发起劳动仲裁并达成调解的全过程。内容涵盖纠纷起因、仲裁请求(工资、补偿金等)、调解结果(当庭付2000元+余款分期)及关键证据清单,旨在为同类维权提供实操参考。
    • 无声2017
    • 4小时前
    • 11
    • 点赞
    • 评论
    程序员
  • El mito del viaje de Thor a la tierra de los gigantes
    下面从正文内容开始整理,已跳过开头的译者信息。 我会继续按你给的 A1 学习规则来处理:逐句、长句先拆分、再解释。 【第1句】 西语原句: Thor, hijo de Odin, dios del t
    • 用户38350844486
    • 4小时前
    • 4
    • 点赞
    • 评论
    前端
  • 用AI免费生成Gemini风格图标Logo?这篇教程帮你从零搞定UI设计!
    前言 最近后台私信炸了,好多小伙伴都在问同一个问题:"Gemini那个渐变色的星环Logo太好看了,能不能用AI自己生成类似风格的图标?"答案是——当然可以!而且完全免费。
    • 玲珑骰子安红豆509
    • 4小时前
    • 1
    • 点赞
    • 评论
    前端框架
    用AI免费生成Gemini风格图标Logo?这篇教程帮你从零搞定UI设计!
  • Hexo搭建个人博客基础操作
    安装依赖 hexo基于Node.js,所以hexo首先依赖node和npm。安装node和npm的过程不再赘述。 设置npm镜像 安装hexo相关依赖 初始化hexo 首先我们在需要创建hexo项目的
    • 使一颗心免于哀伤
    • 4小时前
    • 2
    • 点赞
    • 评论
    前端 程序员 Hexo
  • Cuales podrian ser las consecuencias de no dormir
    下面从正文内容开始整理,已跳过开头的译者信息。 我会按你要求,逐句处理,长句先拆分再讲。 【第1句】 西语原句: En 1965, un alumno de secundaria, Randy Gar
    • 用户38350844486
    • 4小时前
    • 2
    • 点赞
    • 评论
    面试
  • 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30