首页
AI Coding
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
AI
订阅
wpy1314
更多收藏集
微信扫码分享
微信
新浪微博
QQ
10篇文章 · 0订阅
Text2SQL准确率暴涨22.6%!3大维度全拆
摘要 技术背景:Text2SQL 是将自然语言查询转为 SQL 的任务,经历了基于规则、神经网络、预训练语言模型、大语言模型四个阶段。当前面临提示优化、模型训练、推理时增强三大难题,研究基于 BIRD
开源RAG框架汇总
本文搜集了一些开源的基于LLM的RAG(Retrieval-Augmented Generation)框架
一天 Star 破万的开源项目「GitHub 热点速览」
虽然现在市面上的 AI 编程助手已经“琳琅满目”,但顶流就是顶流!OpenAI 新开源的轻量级编程助手 Codex,发布不到 24 小时 Star 数就轻松破万!姗姗来迟的 OpenAI,不禁让人感叹
别再学DeepSeek本地部署了,根本没用!用这招5分钟用上满血版DeepSeek-R1,手机可用,打工人速存!(附保姆级教程)
DeepSeek 一发布,便引起了全球轰动。 然而 DeepSeek 轰动世界的那一刻,也是争议和挑战的开端。 由于最近 DeepSeek 遭受了大规模、持续的恶意攻击,导致 DeepSeek 的服务
DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍
DeepSeek V3/ R1 火爆全网,基于原始模型的解决方案和 API 服务已随处可见,陷入低价和免费内卷。 如何站在巨人肩膀上,通过后训练(post-training)结合专业领域数据,低成本打
撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开
昨天下午,DeepSeek 发布了一篇新论文,提出了一种改进版的注意力机制 NSA;加上还有创始人兼 CEO 梁文锋亲自参与,一时之间吸引眼球无数,参阅报道《刚刚!DeepSeek 梁文锋亲自挂名,公
挑战数据传输路由规划,与DeepSeek共探大模型算法优化
挑战数据传输路由规划,与DeepSeek共探大模型算法优化,邀你共同攻克大模型训练的“最后一公里”难题!
清华团队构建大型社会模拟器AgentSociety,推动智能社会治理与研究范式变革
“凡我无法创造的,我就无法真正理解。” -- 费曼 智能时代呼啸而来,正深刻改变着人们生产、生活和学习的方式。过去几十年里,社会科学家和相关领域的研究者,一直**致力于通过实证数据与模型揭示人类行为和
有了DeepSeek等AI大模型,人人都能当医生吗?
作者:京东健康 王付刚 春节期间,DeepSeek的爆火无疑让大家对AI大模型有了全新的认识和体验。与其他大模型不同之处,DeepSeek不仅提供答案,还输出推理过程,这一功能引起了大家的震惊和担忧。
🧐 DeepSeek-R1原理解析及项目实践(含小白向概念解读)
作者:京东零售 王加伟 一、概念解读(小白向) 我们打开deepseek官网,会发现对话框之下:有两个按钮,那他们的含义如何理解🤔?最近爆火的deepseek究竟指的是哪个模型?深度思考R1与联网搜索