稀土掘金 稀土掘金
    • 首页
    • AI Coding
    • 数据标注 NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
  • 后端
  • 前端
  • Android
  • iOS
  • 人工智能
  • 开发工具
  • 代码人生
  • 阅读
  • Claude Opus 4.6 模型新特性(2026年2月5日发布)
    核心能力提升 编码能力大幅增强:计划更周密,agentic 任务持续时间更长,在大型代码库中运行更稳定,代码审查和 debug 能力更强,能更好地发现自己的错误。 1M token 上下文窗口(Bet
    • tiantian_cool
    • 22小时前
    • 25
    • 点赞
    • 评论
    前端
  • OSI参考模型&&TCP/IP模型
    OSI参考模型&&TCP/IP模型 在计算机网络领域,OSI 参考模型与 TCP/IP 模型是两个至关重要的概念。它们为网络通信提供了标准的框架和协议,使得全球范围内的计算机能够进行开放式通信。本文将
    • 任白
    • 22小时前
    • 13
    • 1
    • 评论
    网络协议
    OSI参考模型&&TCP/IP模型
  • RAG效果好不好,全看这一步做没做对
    为什么文档切分如此重要 检索增强生成(RAG)技术在过去一年中获得了广泛的关注和应用。RAG的核心思想是在模型生成答案之前,先从知识库中检索相关的信息,然后将检索到的信息作为上下文提供给模型,从而提高
    • 大模型探索者肠肠
    • 22小时前
    • 9
    • 点赞
    • 评论
    前端
    RAG效果好不好,全看这一步做没做对
  • 切分粒度,如何影响 TopK 的风险分布
    很多 RAG 系统的问题,早在 TopK 之前就注定了 在 RAG 系统里,TopK 往往被当成一个“显眼参数”: K 设小了 → 召回不够 K 设大了 → 模型胡说   于是大家花大量时间在调: T
    • 大模型玩家七七
    • 22小时前
    • 9
    • 点赞
    • 评论
    后端 架构 人工智能
    切分粒度,如何影响 TopK 的风险分布
  • 向量数据库到底香不香?这篇选型指南帮你不再踩坑
    向量数据库的核心优势 向量数据库之所以在近年来获得如此广泛的关注,源于其在特定场景下展现出的独特优势。这些优势使得向量数据库成为构建AI应用不可或缺的底层组件。 语义理解能力是向量数据库最显著的优势。
    • 大模型探索者肠肠
    • 22小时前
    • 9
    • 点赞
    • 评论
    前端
    向量数据库到底香不香?这篇选型指南帮你不再踩坑
  • 大模型 Temperature=0为什么输出不同结果
    我们知道,大模型接口参数中,temperatue 是控制温度的,按理说,当temperature = 0时,温度最低,每次都取概率最大的那个,输出应保持一致。但在实际时,这种情况很少发生,每次输出还是
    • dony7247
    • 22小时前
    • 13
    • 点赞
    • 评论
    后端
  • 拒绝"炼丹"玄学:一文读懂 LoRA、P-Tuning 与全量微调的核心差异
    当微调术语成为学习的第一道门槛 "师兄,我想做一下模型微调,LoRA 和 P-Tuning 哪个效果好啊?" "这个要看你的数据量和任务类型。不过你先告诉我,Full Fine-tuning 和 Lo
    • 大模型探索者肠肠
    • 22小时前
    • 11
    • 点赞
    • 评论
    前端
    拒绝"炼丹"玄学:一文读懂 LoRA、P-Tuning 与全量微调的核心差异
  • 拒绝玄学炼丹:大模型微调显存需求精确计算指南,全参数微调与LoRA对比全解析
    显存计算为什么是一门玄学 "我的模型7B参数,24GB显存够不够?" "LoRA训练需要多少显存?" "QLoRA真的能让我用消费级显卡跑起来吗?" 这些问题在大模型开发的社区中每天都会出现,但答案往
    • 大模型探索者肠肠
    • 22小时前
    • 8
    • 点赞
    • 评论
    前端
    拒绝玄学炼丹:大模型微调显存需求精确计算指南,全参数微调与LoRA对比全解析
  • 16个AI两周手搓编译器:Claude Opus 4.6 正在改写代码规则
    甚至不需要我多说什么,Anthropic 这次扔出来的“深水炸弹”——Claude Opus 4.6,光是这一个案例就足以让整个技术圈炸锅: 16个智能体,没有任何人类插手,花了大概两万美金,两周时间
    • 墨风如雪
    • 22小时前
    • 52
    • 点赞
    • 评论
    AIGC
    16个AI两周手搓编译器:Claude Opus 4.6 正在改写代码规则
  • 别再二选一了:高手都在用的微调+RAG混合策略,今天一次讲透
    "我们公司有大堆内部文档,想用大模型来做智能问答。有人说该用RAG,有人说该微调,我到底该听谁的?" 这个问题,在大模型应用的社区中几乎是每天都会出现的热门议题。支持RAG的人说:"知识库可以实时更新
    • 大模型探索者肠肠
    • 22小时前
    • 8
    • 点赞
    • 评论
    前端
    别再二选一了:高手都在用的微调+RAG混合策略,今天一次讲透
  • 你的大模型微调对了吗?科学评估让训练效果肉眼可见
    在人工智能领域,大模型微调已经成为企业级应用和学术研究的标配技术。然而,一个困扰着无数开发者和研究人员的核心问题是:如何判断微调是否真正有效?训练 loss 下降了,是否意味着模型真的变好了?答案远没
    • 大模型探索者肠肠
    • 22小时前
    • 7
    • 点赞
    • 评论
    前端
    你的大模型微调对了吗?科学评估让训练效果肉眼可见
  • 拒绝"体感"调优——如何科学地量化LLM微调效果
    引言:从"玄学"到"科学"的跨越 当你花费数天时间微调一个大模型后,打开聊天界面测试效果,却发现模型要么在重复回答,要么在一本正经地胡说八道——这种感觉就像在黑暗中摸索,不知道模型到底有没有在进步。仅
    • 大模型探索者肠肠
    • 22小时前
    • 6
    • 点赞
    • 评论
    前端
    拒绝"体感"调优——如何科学地量化LLM微调效果
  • 从"续写机器"到"智能助手":一文讲透指令微调背后的魔法
    本文深入解析指令微调(Instruction Tuning)技术:为何大模型擅续写却“听不懂人话”?因其预训练本质是预测下一个词;而指令微调通过高质量“指令-输入-输出”数据,让模型从自我中心转向用户
    • 大模型探索者肠肠
    • 22小时前
    • 8
    • 点赞
    • 评论
    前端
    从"续写机器"到"智能助手":一文讲透指令微调背后的魔法
  • 当数据开始“连线”:图模型与现代开发的新连接
    你是否曾在复杂的代码库中迷失,试图理清一个函数如何被三个服务调用,而每个服务又依赖五个不同的库?或者,当你试图为AI助手构建“理解”整个代码库的能力时,是否感到传统的数据结构力不从心?
    • 一个骇客
    • 22小时前
    • 16
    • 1
    • 评论
    架构
    当数据开始“连线”:图模型与现代开发的新连接
  • 你每天在用的ChatGPT,到底是怎么训练出来的?
    本文深入解析LoRA微调核心参数(r、lora_alpha、target_modules、学习率等),从原理出发,结合任务复杂度与资源限制,提供实用设置策略与避坑指南,助你高效避开过拟合
    • 大模型探索者肠肠
    • 22小时前
    • 8
    • 点赞
    • 评论
    前端
    你每天在用的ChatGPT,到底是怎么训练出来的?
  • DDIA 第一部分-1. 数据系统架构中的权衡
    第一章 将介绍 数据系统架构中的利弊权衡。我们将讨论不同类型的数据系统(例如,分析型与事务型),以及它们在云环境中的运行方式。
    • 3sy11
    • 22小时前
    • 9
    • 点赞
    • 评论
    架构
    DDIA 第一部分-1. 数据系统架构中的权衡
  • 说实话,用对这4个场景,Gemini Deep Research帮你省下3个月时间
    和 ChatGPT 的 Deep Research 比起来,Gemini Deep Research 在某些学术使用场景下确实更有优势。 我们选了最常见的四大学术应用场景,对 Gemini Deep
    • 小虚竹说技术
    • 22小时前
    • 7
    • 点赞
    • 评论
    Gemini
  • 每周AI论文速递(260202-260206)
    ERNIE 5.0 Technical Report ERNIE 5.0 技术报告 本报告介绍了 ERNIE 5.0,这是一个原生自回归的基础模型,专为跨文本、图像、视频和音频的统一多模态理解与生成而
    • 叶子的技术碎碎念
    • 22小时前
    • 27
    • 1
    • 评论
    人工智能
  • 代码随想录算法训练营day24
    491非递减子序列 1.递归三部曲 2.去重的关键要素 46.全排列 1.递归三部曲 2.需要引入used数组来对使用过的字符进行标记 47 全排列Ⅱ 1.重点在于去重!!!
    • 流浪小孩
    • 22小时前
    • 7
    • 点赞
    • 评论
    算法
  • https://editor.csdn.net/md/?articleId=139321571&spm=1011.2415.3001.9698
    故障注入测试用来模拟各种故障情形,以测试系统在这些情形下的行为和恢复能力。在使用Hibernate进行故障注入测试时,可以模拟数据库连接中断、事务失败等故障情形。我们可以使用一些工具,如Chaos M
    • Victor356
    • 23小时前
    • 19
    • 点赞
    • 评论
    后端
  • 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30