稀土掘金 稀土掘金
    • 首页
    • AI Coding
    • 数据标注 NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
  • 后端
  • 前端
  • Android
  • iOS
  • 人工智能
  • 开发工具
  • 代码人生
  • 阅读
  • 大模型 Temperature=0为什么输出不同结果
    我们知道,大模型接口参数中,temperatue 是控制温度的,按理说,当temperature = 0时,温度最低,每次都取概率最大的那个,输出应保持一致。但在实际时,这种情况很少发生,每次输出还是
    • dony7247
    • 18小时前
    • 13
    • 点赞
    • 评论
    后端
  • 拒绝"炼丹"玄学:一文读懂 LoRA、P-Tuning 与全量微调的核心差异
    当微调术语成为学习的第一道门槛 "师兄,我想做一下模型微调,LoRA 和 P-Tuning 哪个效果好啊?" "这个要看你的数据量和任务类型。不过你先告诉我,Full Fine-tuning 和 Lo
    • 大模型探索者肠肠
    • 18小时前
    • 8
    • 点赞
    • 评论
    前端
    拒绝"炼丹"玄学:一文读懂 LoRA、P-Tuning 与全量微调的核心差异
  • 拒绝玄学炼丹:大模型微调显存需求精确计算指南,全参数微调与LoRA对比全解析
    显存计算为什么是一门玄学 "我的模型7B参数,24GB显存够不够?" "LoRA训练需要多少显存?" "QLoRA真的能让我用消费级显卡跑起来吗?" 这些问题在大模型开发的社区中每天都会出现,但答案往
    • 大模型探索者肠肠
    • 18小时前
    • 8
    • 点赞
    • 评论
    前端
    拒绝玄学炼丹:大模型微调显存需求精确计算指南,全参数微调与LoRA对比全解析
  • 16个AI两周手搓编译器:Claude Opus 4.6 正在改写代码规则
    甚至不需要我多说什么,Anthropic 这次扔出来的“深水炸弹”——Claude Opus 4.6,光是这一个案例就足以让整个技术圈炸锅: 16个智能体,没有任何人类插手,花了大概两万美金,两周时间
    • 墨风如雪
    • 18小时前
    • 47
    • 点赞
    • 评论
    AIGC
    16个AI两周手搓编译器:Claude Opus 4.6 正在改写代码规则
  • 美业老板用AI工具做年货节海报:这个工具真的太好用了
    大家好,我是一个在上海经营了5年美甲店的90后老板。 说实话,开美甲店这五年,我见过太多同行倒闭。有的是技术不过关,有的是选址失误,但更多的,是输在了"不会营销"这件事上。 特别是每年的春节前夕,这本
    • 晴天说AI
    • 18小时前
    • 15
    • 点赞
    • 评论
    人工智能
  • 别再二选一了:高手都在用的微调+RAG混合策略,今天一次讲透
    "我们公司有大堆内部文档,想用大模型来做智能问答。有人说该用RAG,有人说该微调,我到底该听谁的?" 这个问题,在大模型应用的社区中几乎是每天都会出现的热门议题。支持RAG的人说:"知识库可以实时更新
    • 大模型探索者肠肠
    • 18小时前
    • 7
    • 点赞
    • 评论
    前端
    别再二选一了:高手都在用的微调+RAG混合策略,今天一次讲透
  • 电商商家如何用AI工具拓展更多素材:实测后这款Ai工具真的好用
    大家好,我是一个主营3C数码电商商家,在亚马逊、速卖通、独立站都有店铺。巅峰时期,一个月能出货3万单,净利润30多万。 但2024年下半年,我差点破产。 不是产品不行,也不是价格没优势,而是败在了一个
    • 晴天说AI
    • 18小时前
    • 9
    • 点赞
    • 评论
    人工智能
  • 你的大模型微调对了吗?科学评估让训练效果肉眼可见
    在人工智能领域,大模型微调已经成为企业级应用和学术研究的标配技术。然而,一个困扰着无数开发者和研究人员的核心问题是:如何判断微调是否真正有效?训练 loss 下降了,是否意味着模型真的变好了?答案远没
    • 大模型探索者肠肠
    • 18小时前
    • 6
    • 点赞
    • 评论
    前端
    你的大模型微调对了吗?科学评估让训练效果肉眼可见
  • 拒绝"体感"调优——如何科学地量化LLM微调效果
    引言:从"玄学"到"科学"的跨越 当你花费数天时间微调一个大模型后,打开聊天界面测试效果,却发现模型要么在重复回答,要么在一本正经地胡说八道——这种感觉就像在黑暗中摸索,不知道模型到底有没有在进步。仅
    • 大模型探索者肠肠
    • 18小时前
    • 6
    • 点赞
    • 评论
    前端
    拒绝"体感"调优——如何科学地量化LLM微调效果
  • 电商老板如何用AI工具做春节年货节物料?从被动挨打到主动出击的实战经验
    我是一名深耕食品电商6年的老板。 主营礼盒、组合装、年货大礼包,春节年货节对我来说,不是一场促销活动,而是决定全年现金流的生死战。 在我身边,有做美妆的电商老板、做家居的电商老板、做服装的电商老板,大
    • 晴天说AI
    • 18小时前
    • 11
    • 点赞
    • 评论
    人工智能
  • 做宣传海报的AI软件怎么选?行政人事的实用指南
    我是一名公司行政,同时也兼顾单位的宣传工作。 在我身边,无论是企业的行政人员,还是人事部门的同事,大家都有一个共同的痛点: 经常需要做宣传海报,但又不是专业设计师。 通知海报、活动宣传、文化墙、培训资
    • 晴天说AI
    • 18小时前
    • 8
    • 点赞
    • 评论
    人工智能
  • 从"续写机器"到"智能助手":一文讲透指令微调背后的魔法
    本文深入解析指令微调(Instruction Tuning)技术:为何大模型擅续写却“听不懂人话”?因其预训练本质是预测下一个词;而指令微调通过高质量“指令-输入-输出”数据,让模型从自我中心转向用户
    • 大模型探索者肠肠
    • 18小时前
    • 8
    • 点赞
    • 评论
    前端
    从"续写机器"到"智能助手":一文讲透指令微调背后的魔法
  • 当数据开始“连线”:图模型与现代开发的新连接
    你是否曾在复杂的代码库中迷失,试图理清一个函数如何被三个服务调用,而每个服务又依赖五个不同的库?或者,当你试图为AI助手构建“理解”整个代码库的能力时,是否感到传统的数据结构力不从心?
    • 一个骇客
    • 18小时前
    • 16
    • 1
    • 评论
    架构
    当数据开始“连线”:图模型与现代开发的新连接
  • 你每天在用的ChatGPT,到底是怎么训练出来的?
    本文深入解析LoRA微调核心参数(r、lora_alpha、target_modules、学习率等),从原理出发,结合任务复杂度与资源限制,提供实用设置策略与避坑指南,助你高效避开过拟合
    • 大模型探索者肠肠
    • 18小时前
    • 8
    • 点赞
    • 评论
    前端
    你每天在用的ChatGPT,到底是怎么训练出来的?
  • DDIA 第一部分-1. 数据系统架构中的权衡
    第一章 将介绍 数据系统架构中的利弊权衡。我们将讨论不同类型的数据系统(例如,分析型与事务型),以及它们在云环境中的运行方式。
    • 3sy11
    • 18小时前
    • 9
    • 点赞
    • 评论
    架构
    DDIA 第一部分-1. 数据系统架构中的权衡
  • 说实话,用对这4个场景,Gemini Deep Research帮你省下3个月时间
    和 ChatGPT 的 Deep Research 比起来,Gemini Deep Research 在某些学术使用场景下确实更有优势。 我们选了最常见的四大学术应用场景,对 Gemini Deep
    • 小虚竹说技术
    • 18小时前
    • 7
    • 点赞
    • 评论
    Gemini
  • 每周AI论文速递(260202-260206)
    ERNIE 5.0 Technical Report ERNIE 5.0 技术报告 本报告介绍了 ERNIE 5.0,这是一个原生自回归的基础模型,专为跨文本、图像、视频和音频的统一多模态理解与生成而
    • 叶子的技术碎碎念
    • 18小时前
    • 26
    • 1
    • 评论
    人工智能
  • 代码随想录算法训练营day24
    491非递减子序列 1.递归三部曲 2.去重的关键要素 46.全排列 1.递归三部曲 2.需要引入used数组来对使用过的字符进行标记 47 全排列Ⅱ 1.重点在于去重!!!
    • 流浪小孩
    • 18小时前
    • 7
    • 点赞
    • 评论
    算法
  • https://editor.csdn.net/md/?articleId=139321571&spm=1011.2415.3001.9698
    故障注入测试用来模拟各种故障情形,以测试系统在这些情形下的行为和恢复能力。在使用Hibernate进行故障注入测试时,可以模拟数据库连接中断、事务失败等故障情形。我们可以使用一些工具,如Chaos M
    • Victor356
    • 18小时前
    • 19
    • 点赞
    • 评论
    后端
  • Grafana Enterprise SCIM漏洞利用工具(CVE-2025-41115)
    针对Grafana Enterprise严重权限提升漏洞(CVE-2025-41115)的Python利用脚本。该漏洞允许攻击者通过SCIM接口覆盖用户UID,实现管理员账户接管。适用于授权安全测试。
    • qife122
    • 18小时前
    • 7
    • 点赞
    • 评论
    人工智能 AIGC
  • 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30