首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
AI
订阅
wpy1314
更多收藏集
微信扫码分享
微信
新浪微博
QQ
10篇文章 · 0订阅
Text2SQL准确率暴涨22.6%!3大维度全拆
摘要 技术背景:Text2SQL 是将自然语言查询转为 SQL 的任务,经历了基于规则、神经网络、预训练语言模型、大语言模型四个阶段。当前面临提示优化、模型训练、推理时增强三大难题,研究基于 BIRD
开源RAG框架汇总
本文搜集了一些开源的基于LLM的RAG(Retrieval-Augmented Generation)框架
一天 Star 破万的开源项目「GitHub 热点速览」
虽然现在市面上的 AI 编程助手已经“琳琅满目”,但顶流就是顶流!OpenAI 新开源的轻量级编程助手 Codex,发布不到 24 小时 Star 数就轻松破万!姗姗来迟的 OpenAI,不禁让人感叹
别再学DeepSeek本地部署了,根本没用!用这招5分钟用上满血版DeepSeek-R1,手机可用,打工人速存!(附保姆级教程)
DeepSeek 一发布,便引起了全球轰动。 然而 DeepSeek 轰动世界的那一刻,也是争议和挑战的开端。 由于最近 DeepSeek 遭受了大规模、持续的恶意攻击,导致 DeepSeek 的服务
DeepSeek V3+R1满血微调工具上线!一键启动,硬件要求降10倍
DeepSeek V3/ R1 火爆全网,基于原始模型的解决方案和 API 服务已随处可见,陷入低价和免费内卷。 如何站在巨人肩膀上,通过后训练(post-training)结合专业领域数据,低成本打
撞车DeepSeek NSA,Kimi杨植麟署名的新注意力架构MoBA发布,代码也公开
昨天下午,DeepSeek 发布了一篇新论文,提出了一种改进版的注意力机制 NSA;加上还有创始人兼 CEO 梁文锋亲自参与,一时之间吸引眼球无数,参阅报道《刚刚!DeepSeek 梁文锋亲自挂名,公
挑战数据传输路由规划,与DeepSeek共探大模型算法优化
挑战数据传输路由规划,与DeepSeek共探大模型算法优化,邀你共同攻克大模型训练的“最后一公里”难题!
清华团队构建大型社会模拟器AgentSociety,推动智能社会治理与研究范式变革
“凡我无法创造的,我就无法真正理解。” -- 费曼 智能时代呼啸而来,正深刻改变着人们生产、生活和学习的方式。过去几十年里,社会科学家和相关领域的研究者,一直**致力于通过实证数据与模型揭示人类行为和
有了DeepSeek等AI大模型,人人都能当医生吗?
作者:京东健康 王付刚 春节期间,DeepSeek的爆火无疑让大家对AI大模型有了全新的认识和体验。与其他大模型不同之处,DeepSeek不仅提供答案,还输出推理过程,这一功能引起了大家的震惊和担忧。
🧐 DeepSeek-R1原理解析及项目实践(含小白向概念解读)
作者:京东零售 王加伟 一、概念解读(小白向) 我们打开deepseek官网,会发现对话框之下:有两个按钮,那他们的含义如何理解🤔?最近爆火的deepseek究竟指的是哪个模型?深度思考R1与联网搜索