首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
不会弹吉他的布鲁克
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
不会弹吉他的布鲁克
2天前
关注
AI 大语言模型的达尔文进化论:从"狗屁不通"到帮你写情书的AI秘史
各位看官,今天我们要聊的可是当代最魔幻的黑科技——大语言模型。这货现在不仅能帮你写作业,还能替你给女神发微信,但它的进化史可比你家猫主子打翻水杯的借口还要精彩。...
0
评论
分享
不会弹吉他的布鲁克
1月前
关注
25 年最新大佬 Paper DyT,Transformers再也不需要层归一化,这届AI学会“自我管理”了!
在深度学习的世界里,归一化层(如BatchNorm、LayerNorm)就像一位兢兢业业的“管家”。它们每天忙着给数据做按摩 (减均值、除方差),再涂点护肤品(γ、β sc...
0
评论
分享
不会弹吉他的布鲁克
2月前
关注
DeepSeek开源周-Day01之DeepSeek FlashMLA 深度解析
DeepSeek 开源周 Day01 FlashMLA 深度解析 DeepSeek的开源周可谓是给AI界点燃了一根“加速火箭”,一开场便引爆了全球开发者的热情!在北京时间周...
0
评论
分享
不会弹吉他的布鲁克
3月前
关注
AI智能操盘-你的纯视觉界面解析神器:OMNIPARSER 自动操作电脑,助你轻松搞定全自动化任务
图形用户界面(GUI)自动化需要一个能看懂屏幕、会动手(鼠标、键盘都不在话下)的聪明代理。但用一般的 大模型 LLM 来充当这个代理,往往会遇到两个大难题: 如何稳稳找出可...
1
评论
分享
不会弹吉他的布鲁克
3月前
关注
DeepSeek R1 —— 用 RL 点燃推理引擎的新纪元
DeepSeek 推理大模型 R1 一出,瞬间在 AI 领域掀起了“核爆”级别的轰动。谁能想到,要实现尖端 AI 表现竟然可以跳过传统的监督微调(SFT)?DeepSeek...
0
评论
分享
不会弹吉他的布鲁克
3月前
关注
DeepSeek-V3 — 史诗级 MoE 模型,参数多到爆表
简介 论文《DeepSeek-V3 Technical Report》于 2024 年 12 月发布**。DeepSeek-V3 总参数达到 671B**,每个 token...
1
评论
分享
不会弹吉他的布鲁克
3月前
关注
号称 AI 学霸的Grok 3 宣布免费!这波操作你绝对想不到
马斯克又来了一波“大动作”!这次,不是火箭升空,也不是电动车降价,而是他的 AI 公司 xAI 突然宣布:Grok 3 免费开放!对,你没听错,完全免费!就在 2025 年...
0
评论
分享
不会弹吉他的布鲁克
3月前
关注
GPU寄存器缓存的魔法秀 —— 当 CUDA 代码化身为闪电侠
在这个技术魔法秀中,我们带来了一招“寄存器缓存”大法,颠覆了传统的共享内存操作,让 CUDA 程序从慢吞吞变成快如闪电!别急,接下来我们就一探这门绝技的神秘奥义 warp ...
0
评论
分享
不会弹吉他的布鲁克
3月前
关注
DeepSeek V2 —— 强大、经济又高效的 MoE 进阶版
DeepSeek V2 —— 强大、经济又高效的 MoE 进阶版 简介 论文《DeepSeek-V2: A Strong, Economical, and Efficien...
1
评论
分享
不会弹吉他的布鲁克
3月前
关注
DeepSeekMoE:专家学霸们的“脑力盛宴”
论文《DeepSeekMoE: Towards Ultimate Expert Specialization in Mixture-of-Experts Language ...
0
评论
分享
不会弹吉他的布鲁克
3月前
关注
GPU葵花宝典:当原子操作遇上warp:GPU界的"拼团"大法
现在NVCC编译器已能自动实现线warp级原子操作聚合,躺着也能享受性能飙升!不过想了解原理的小伙伴们,快搬小板凳来听书,这招在其他场景也能大显身手哦 问题场景:数组元素大...
0
评论
分享
不会弹吉他的布鲁克
3月前
关注
免费也能打?GitHub Copilot Free横空出世,编程界“白嫖”新风暴来袭!
💥【开箱暴击】GitHub Copilot Free横空出世!程序员集体"白嫖"时代来临? 2024年寒冬最暖消息:GitHub突然甩出王炸!Copilot免费版让全球码...
0
评论
分享
不会弹吉他的布鲁克
3月前
关注
DeepSeek王炸来袭!原生稀疏注意力 Native Sparse Attention助力64K长上下文前向飙升9倍、反向极速6倍加速!
Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention 本论文的...
0
评论
分享
不会弹吉他的布鲁克
3月前
关注
DeepSeek LLM:以长远主义视角扩展开源语言模型
核心内容总结 论文《DeepSeek LLM: Scaling Open-Source Language Models with Longtermism》于 2024 年 ...
0
评论
分享
不会弹吉他的布鲁克
3月前
关注
[史诗级转型]:DeepSeek 进化之路:低成本强化学习如何引爆 AI 革命?
DeepSeek 原生注意力NSA架构炸场!长文本处理迎来"三体式"降维打击,总之,DeepSeek 系列从 LLM 到 MoE,从 V2、V3 再到最新的 R1,以及最新...
0
评论
分享
不会弹吉他的布鲁克
3月前
关注
震惊!CUDA程序员竟被这个函数坑到秃头?一招提速10000倍的骚操作来了!
听说你们在代码里偷偷养了只树懒?🦥事情是这样的——当你优雅地在CUDA性能核心区写下cudaGetDeviceProperties()时,相当于突然掏出手机给英伟达客服打...
0
评论
分享
不会弹吉他的布鲁克
3月前
关注
探秘AutoGen AgentChat:AI超级英雄的幕后故事-“超能力”大揭秘!
在AI的世界里,AutoGen AgentChat就像是一支拥有“超能力”的超级英雄团队!它们不仅能让AI聊天变得更智能,还能帮你完成各种复杂任务,比如搜索信息、分析数据、...
0
评论
分享
不会弹吉他的布鲁克
4月前
关注
AutoGen AgentChat:从搜索信息到执行代码,AI代理如何用“超能力”颠覆你的AI体验
在AI的世界里,AutoGen AgentChat就像是一位拥有“超能力”的超级英雄,它不仅能让AI聊天变得更智能,还能帮你完成各种复杂任务!无论是搜索信息、分析数据,还是...
0
评论
分享
不会弹吉他的布鲁克
4月前
关注
AgentChat消息大揭秘:智能体代理间的“悄悄话”与内部“小秘密
在AutoGen的AgentChat世界里,消息就像是代理们的“社交货币”,让它们能够愉快地交流、传递信息,甚至和应用程序“打情骂俏”。今天,我们就来扒一扒这些消息的“底细...
2
评论
分享
不会弹吉他的布鲁克
4月前
关注
AI Agent-智能体框架-超级智能体全家桶
随着大语言模型(LLM)和人工智能技术的快速发展,智能体(Agent)框架成为了构建自动化任务处理系统、对话系统和多智能体协作平台的重要工具。类似于 AutoGPT 的智能...
0
评论
分享
下一页
个人成就
文章被点赞
6
文章被阅读
5,386
掘力值
425
关注了
2
关注者
5
收藏集
0
关注标签
9
加入于
2024-08-27