首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
后端
前端
Android
iOS
人工智能
开发工具
代码人生
阅读
大模型微调参数设置 —— 从入门到精通的调参指南
一、引言 大模型微调的核心魅力,在于通过调整模型参数,让通用大模型适配特定任务与场景。但对初学者而言,微调参数如同 “黑箱操作”—— 学习率、训练轮次、批次大小等参数的细微变化,都可能导致微调效果天差
一天一个开源项目(第19篇):Folo - AI驱动的下一代信息阅读器
深入解读 Folo,一个37.1k+ Stars的开源AI阅读器,支持RSS订阅、AI摘要翻译、多端同步,将信息聚合到统一时间线,打造无噪音的阅读体验
大模型微调实战:从原理到落地的完整指南
大模型微调实战:从原理到落地的完整指南 引言 随着大语言模型技术的快速普及,通用大模型在面对垂直场景时,往往会出现 “水土不服” 的问题。比如电商客服模型需要精准理解行业话术,教育类模型要贴合特定的知
打通OpenClaw与Telegram的超详细实操教程
本文详细讲解如何在OpenClaw中接入Telegram:从BotFather获取Token,发送消息获取配对码,再到通过`openclaw config`完成配置与配对,最后测试成功。轻松实现Tel
Anthropic Claude Opus 4.6实测
Anthropic旗舰新模型来袭,Agent能力飙升成最大亮点,但中文场景下能否守住王座?我们用万题实测揭晓答案,结果有惊喜也有意外。
深度解读Django settings.py:从核心配置到高级实战的完整指南
在Django项目中,许多开发者的拦路虎并非视图或模型,而是看似复杂的settings.py配置文件。它虽非业务代码,却决定了项目能否启动、运行是否安全、报错是否可读。本文将为你系统拆解这个核心文件
DeepSeek V4春节炸场,三大黑科技让Claude和GPT都坐不住了
今儿看到个信息,DeepSeek可能发布V4了。 老金我第一时间测试佐证了一下。 虽说官方没明确公布上线,但是咱可以先来了解下它的 3大创新能力。 DeepSeek作为国产之光(毕竟 价格屠夫),老金
AI主播监管新规,技术合规边界与行业影响分析
2026年2月1日,《直播电商监督管理办法》(以下简称《办法》)正式施行,标志着AI生成内容在直播电商领域进入全面监管时代。作为中国首个将数字人主播等人工智能生成内容明确纳入监管范围的部门规章,新规不
PPO的神奇应用:除了ChatGPT,它还能做什么
提到PPO,很多人首先想到的是ChatGPT、Claude这些对话AI的训练。确实,PPO在RLHF流程中的出色表现,让它成为了大模型与人类价值观对齐的关键技术,功不可没。但PPO的应用远不止于此,从
PPO算法大揭秘:ChatGPT背后的神秘力量
在大模型训练领域,有一个名字几乎无处不在——PPO。它是ChatGPT、Claude等先进AI系统的核心技术之一,神秘而强大。PPO的全称是Proximal Policy Optimization,中
Milvus 权限绕过漏洞检测工具 (CVE-2025-64513)
CVE-2025-64513 是 Milvus 向量数据库代理组件的严重权限绕过漏洞,CVSS评分9.3。本项目提供完整的漏洞检测PoC脚本与报告生成工具,无需认证即可验证目标系统是否存在该漏洞,并自
微调黑话大揭秘:老司机必备的行话指南
大模型微调领域充斥着各种专业术语,对于初学者来说,这些术语往往令人困惑。什么是一阶导数,什么是秩分解,什么是KL散度?这些概念不理解透彻,很难真正掌握微调技术的精髓。本文将系统介绍大模型微调中最常见的
Chainguard AI 工厂突破5亿次构建
Chainguard的AI驱动Factory 2.0已生成超5亿容器构建清单,并持续维护2000多个零CVE开源项目和34万个镜像版本,确保软件供应链安全,被近400家组织采用。
开源大模型哪家强?看完这篇不再纠结
开源大模型的蓬勃发展让AI技术的门槛大幅降低,从LLaMA到Mistral,从Qwen到Yi,各种开源模型层出不穷。但光有模型还不够,要让模型在特定任务上表现出色,微调是关键环节。面对众多开源模型和微
开源大模型哪家强?看完这篇不再纠结
你有没有遇到过这种情况:问大模型一个问题,它明明有这个知识储备,却给出了一个风马牛不相及的回答。或者你让它做个简单的任务,它却理解错了你的意图。这种情况往往让人困惑:模型不是已经训练得很好了吗,为什么
改进 HTTP 的设计
前几篇从底往上清理了三层。engine 有 js_engine.h,conn 有 js_conn.h,buffer 有 js_buf.h,timer 有 js_timer.h——每个模块都有自己的头文
刷 Leetcode 的开挂方式:AiPy 一站式刷题
在Leetcode上刷题的你,是否也有过这样的困扰: 想针对性刷题,却要在题库里费劲搜寻? 卡壳时翻遍论坛,却找不到清晰的解题思路和可运行代码? 好不容易找到答案,复制粘贴后还要手动调试,效率极低?
大模型对齐实战:PPO算法的原理与应用实践
引言 在大模型技术飞速普及的今天,如何让模型输出贴合人类偏好、满足特定场景需求,已经成为开发者和中小企业关注的核心问题。从最初的监督微调,到如今的强化学习对齐技术,大模型优化路径不断清晰,而PPO(近
“氛围编程”已是过去式?Karpathy 揭示软件新未来
Andrej Karpathy 认为大型语言模型已让“氛围编程”过时,提出“代理式工程”:由代理而非人直接编写代码,人类负责监督,提升软件质量。
向量数据库实战指南:从部署到RAG落地
向量数据库的核心价值的在于落地应用,而非单纯的理论认知。本文聚焦实战场景,以轻量开源产品Chroma为例,从环境部署、数据接入、相似性检索到RAG简单集成,一步步带大家上手实操,全程避开新手常见坑,适
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30