首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大语言模型
nine是工程师
创建于2024-09-06
订阅专栏
大语言模型入门需要的一切。
等 3 人订阅
共11篇文章
创建于2024-09-06
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
大模型不听话?试试提示词微调
想象一下,你向大型语言模型抛出问题,满心期待精准回答,得到的却是答非所问,是不是让人抓狂?在复杂分类场景下,这种“大模型不听话”的情况更是常见。
大模型能力评测方式很多?
AI评测非单一分数比拼,而是多维度、多方法的系统工程。其核心框架可拆解为基础维度、主流基准与关键方法,共同构成模型能力的“CT扫描”系统。
n8n和扣子该怎么选?
n8n是一款获GitHub 129k+星标的开源工作流平台,以「400+集成生态+原生AI能力+双模式操作+全栈部署自由」为核心,兼顾无代码的敏捷与代码级的灵活,成为技术团队的自动化基础设施。
纯本地AI知识库搭建:DeepSeek-R1+AnythingLLM全流程
在数据隐私与效率需求双重驱动下,本地部署AI知识库已成职场刚需。本文基于DeepSeek-R1开源模型与AnythingLLM文档处理工具,构建一套私有化智能问答系统,30分钟即可让电脑变身专业分析师
LLMs.txt:AI时代网站的"智能身份证"
当AI模型因HTML冗余代码浪费50%上下文窗口时,LLMs.txt正成为网站与AI对话的新语言。这个轻量级标准已被Anthropic、Cursor等企业采用,让AI理解内容效率提升3倍。
四大主流AI Agent框架选型梳理
随着AI技术的快速发展,多智能体系统(Multi-Agent)已成为企业智能化转型的关键技术。本文将梳理2025年7月值得关注的四大AI Agent框架(注:OpenAI Swarm属于学习项目),帮
从缓存 CAS 看Kimi K2使用的MuonClip优化器
对每天和 Redis、Caffeine 打交道的 Java 工程师来说,MuonClip 的“qk-clip”机制听起来像玄学;但如果把它翻译成你熟悉的 分布式缓存并发写冲突,味道立刻对了。
Anthropic Cookbook:开发者可以参考的Claude AI高效开发指南
作为配套资源的Anthropic Cookbook开源项目,更是凭借其丰富的代码示例和实用指南,在GitHub上获得了18k+颗星的高度认可。
DeepSeek-R1技术突破:纯RL训练竟能激发大模型"反思"能力?
仅通过强化学习(RL)训练,无需监督微调(SFT),就能让大模型自发产生带有反思的思维链(long CoT)。这一发现颠覆了此前行业对模型训练范式的认知。
如何让AI真正理解你的意图(自适应Prompt实战指南)
目前的LLM模型,在理解用户意图方面,正在使用自适应Prompt技术,来提升模型的理解能力。目前使用deepseek推理模型能明显看到自适应的一个过程。
大模型微调使GPT3成为了可以聊天发布指令的ChatGPT
正是通过微调大模型使得gpt3成为了可以聊天发布指令的chatgpt。聊天大模型在通用大模型的基础上加一层微调就实现人人能用的大模型,使得通用大模型的能力被更多人使用和了解。