首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
人工智能应用
果冻人工智能
创建于2024-10-24
订阅专栏
普及人工智能应用技术。
等 26 人订阅
共191篇文章
创建于2024-10-24
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
别再说AI是工具了,它不是工具
我收到一些反馈,说我那些长达12到18分钟的深度分析——探讨生成式AI与艺术(尤其是音乐)之间关系的内容太长了。所以我现在用不到5分钟,把我的核心观点讲清楚。
AI 不是问题,有问题的是你。
所有我们的思维和输出就像是一只酒杯,而AI就像是打破它的完美音调,不是通过外来的东西,而是通过与已存在的东西相匹配。
Nvidia 开源了“Describe Anything”——10 个现实应用场景,震撼你的认知
Nvidia 开源了“Describe Anything”——10 个现实应用场景,震撼你的认知 从疾病诊断到作物追踪——Nvidia 的视觉 AI 正在彻底改变游戏规则
当AI开始做研究时,研究人员的身份就开始崩塌了!
带着年假被砍、职称评审延期、一些差点压垮我的研究论文、以及足够糊满整个办公室墙壁的拒信,我坐在那里开始思考:难不成我已经成了特斯拉时代下的马车?是得进博物馆那种。
Chain-of-Draft (CoD) 是提示工程的新王者
推理型大模型,是当前 AI 研究的热门话题。 我们从最早的 GPT-1 一路走到现在像 Grok-3 这样的高级推理模型。 这段旅程可以说非常精彩,过程中也发现了很多重要的推理方法。
AI能否取代软件架构师?我将4个大语言模型进行了测试
AI是否会取代软件工程师”一直是2022年及以后技术圈的核心问题。产品经理、图形设计师等角色紧随其后,成为这个话题的讨论对象。
免费的AI才是最贵的
就像互联网上“免费”的大多数东西一样,人工智能并不真的免费。就像“免费”的社交媒体网站和搜索引擎一样,我们应该假设,在某个地方,某些人正在从我们使用这些工具中赚取钱,或者计划从中赚钱。
别再硬推本地大模型了
全文速览: 本文作者 Andrew Zuo 的核心观点是: “本地大语言模型(Local LLM)没意义,性能太差、成本太高、体验太慢,远不如用云端模型实用。” 他从多个角度反复强调这个核心论点
一篇就够:从0开始学会如何优化大模型推理(含实战技巧)
1. LLM服务中的难题 2. 第一主题:聪明的KV缓存管理 3. 第二主题:Query稀疏注意力 4. 第三主题:猜测式解码 5. 第四主题:权重调度 6. 第五主题:系统级优化 7. 其他主题
为什么微软的 Phi-4 14B 比 GPT-4o 和 o1 强太多了 —— 看结果就知道了
2024 年 1 月 7 日,微软在 Hugging Face 上发布了小型语言模型(SLM)“Phi-4”。这个模型采用 MIT 协议发布,可以自由用于商业用途并加以修改。
今日AI 的三大核心能力,通俗讲清楚了
💡 AI 到底能帮企业做什么?除了会写文案、答问题,其实它还有更强的三种能力值得关注。如果你也在做 AI 项目、AI 产品或训练推理平台,欢迎关注+私信交流。
2025年最猛的AI开发底座?这5款MCP服务器让你编程像开挂一样爽
在智能开发全面爆发的 2025 年,懂得用对工具就能事半功倍。今天就来分享 5 款真正能让工作流程“飞起来”的 MCP 服务器。
介绍最前沿的人工智能创新,‘无反向传播’神经网络训练方法?
📌 本文整理自 NoProp 原始论文与实践代码,并结合多个公开实现细节进行了全流程复现。 🔍 对神经网络训练机制的探索仍在不断演进,如果你也在研究反向传播之外的新路径,这篇内容可能会给你一些启发
我们是不是太蠢,连偷懒都不会?AI 应该给我们留点时间思考
在 AI 时代,我们不该继续盲目追求形式上的努力和勤奋,而应该主动拥抱一种‘聪明的懒惰’,把重复、低效、装样子的工作交给机器,把人的智慧用在创造性、判断性、更具人性价值的部分上。
用更好的方式来监控神经网络的训练过程
这是一系列文章的第一篇,教你如何提升神经网络训练过程中的监控和排查能力: 1. 更好的方式来监控神经网络训练(本篇) 2. 神经元死亡问题(即将推出) 3. 梯度消失与爆炸(即将推出)
我试用了50个AI工具——AI正在如何改变设计方式
📩 本文基于我亲测50款AI产品后的真实总结,记录了我观察到的设计趋势和用户变化。 如果你也在打造AI产品或研究用户体验优化,不妨一起交流 👉 可后台私信我【AI体验手册】
EU AI法案:开发者和部署者,都得担责
👋 本文由一位深耕AI软硬件落地10年的技术实战者整理翻译。 平时主要从芯片设计、电路、GPU部署,到Linux系统、推理引擎、模型训练都亲自操刀,长期关注AI法规对工程实践的影响。 🚀 有兴趣一
DeepSeek-V3 解析第二篇:DeepSeekMoE
📚 本文也是我们【LLM 架构演化系列】的第二篇,聚焦 DeepSeek-V3 的 MoE 架构创新。如果你正研究大模型性能优化或架构设计,欢迎参考本系列其他内容,我们也整理了多份内部实验图与流程笔
DeepSeek-V3 解读,第一部分:理解 Multi-Head Latent Attention
🔍 我们在研究这些新架构的同时,也在整理一套完整的「LLM底层机制拆解系列」资料,聚焦模型结构演进与推理效率优化。如果你也在搭建或评估大模型系统,不妨关注这个系列一起深入分析底层设计背后的工程逻辑。
🧠5个AI工程师在第一次构建RAG时常犯的错误
📦 本文是我「RAG工程实战反思系列」的第1篇,如果你也在构建基于LLM的RAG系统,建议收藏本文。文末有资料领取方式,可快速搭建实战系统框架。
下一页