大语言模型

大语言模型

大语言模型

大语言模型入门需要的一切。

等 3 人订阅共11篇文章创建于2024-09-06

大模型不听话？试试提示词微调

想象一下，你向大型语言模型抛出问题，满心期待精准回答，得到的却是答非所问，是不是让人抓狂？在复杂分类场景下，这种“大模型不听话”的情况更是常见。

8月前
480
2
评论

大模型能力评测方式很多？

AI评测非单一分数比拼，而是多维度、多方法的系统工程。其核心框架可拆解为基础维度、主流基准与关键方法，共同构成模型能力的“CT扫描”系统。

8月前
279
点赞
评论

n8n和扣子该怎么选？

n8n是一款获GitHub 129k+星标的开源工作流平台，以「400+集成生态+原生AI能力+双模式操作+全栈部署自由」为核心，兼顾无代码的敏捷与代码级的灵活，成为技术团队的自动化基础设施。

8月前
530
1
1

纯本地AI知识库搭建：DeepSeek-R1+AnythingLLM全流程

在数据隐私与效率需求双重驱动下，本地部署AI知识库已成职场刚需。本文基于DeepSeek-R1开源模型与AnythingLLM文档处理工具，构建一套私有化智能问答系统，30分钟即可让电脑变身专业分析师

8月前
271
1
评论

LLMs.txt：AI时代网站的"智能身份证"

当AI模型因HTML冗余代码浪费50%上下文窗口时，LLMs.txt正成为网站与AI对话的新语言。这个轻量级标准已被Anthropic、Cursor等企业采用，让AI理解内容效率提升3倍。

9月前
189
点赞
评论

四大主流AI Agent框架选型梳理

随着AI技术的快速发展，多智能体系统(Multi-Agent)已成为企业智能化转型的关键技术。本文将梳理2025年7月值得关注的四大AI Agent框架（注：OpenAI Swarm属于学习项目），帮

9月前
376
点赞
评论

从缓存 CAS 看Kimi K2使用的MuonClip优化器

对每天和 Redis、Caffeine 打交道的 Java 工程师来说，MuonClip 的“qk-clip”机制听起来像玄学；但如果把它翻译成你熟悉的分布式缓存并发写冲突，味道立刻对了。

9月前
329
2
评论

Anthropic Cookbook：开发者可以参考的Claude AI高效开发指南

作为配套资源的Anthropic Cookbook开源项目，更是凭借其丰富的代码示例和实用指南，在GitHub上获得了18k+颗星的高度认可。

9月前
409
点赞
评论

DeepSeek-R1技术突破：纯RL训练竟能激发大模型"反思"能力？

仅通过强化学习(RL)训练，无需监督微调(SFT)，就能让大模型自发产生带有反思的思维链(long CoT)。这一发现颠覆了此前行业对模型训练范式的认知。

9月前
252
点赞
评论

如何让AI真正理解你的意图（自适应Prompt实战指南）

目前的LLM模型，在理解用户意图方面，正在使用自适应Prompt技术，来提升模型的理解能力。目前使用deepseek推理模型能明显看到自适应的一个过程。

10月前
557
点赞
评论

大模型微调使GPT3成为了可以聊天发布指令的ChatGPT

正是通过微调大模型使得gpt3成为了可以聊天发布指令的chatgpt。聊天大模型在通用大模型的基础上加一层微调就实现人人能用的大模型，使得通用大模型的能力被更多人使用和了解。

1年前
199
点赞
评论

大模型微调使GPT3成为了可以聊天发布指令的ChatGPT