首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
ai
订阅
用户201294308761
更多收藏集
微信扫码分享
微信
新浪微博
QQ
13篇文章 · 0订阅
《AI导演手册:用CRTF法则写出95%成功率的提示词》
摘要:用导演视角重构提示词工程,CRTF框架+3级案例,从30%到95%成功率,附Cursor/Copilot配置实战,AI秒变影帝。
深入解析大型语言模型:从训练到部署大模型
简介 随着数据科学领域的深入发展,大型语言模型——这种能够处理和生成复杂自然语言的精密人工智能系统—逐渐引发了更大的关注。 LLMs是自然语言处理(NLP)中最令人瞩目的突破之一。这些模型有潜力彻底改
PyTorch进阶:从自定义损失函数到生产部署全栈指南
本文深入讲解PyTorch高级开发技巧,涵盖自定义层/损失函数实现、模型保存加载策略以及TensorBoard可视化监控,提供工业级最佳实践和完整代码示例。
多任务推荐任务建模(包含MMOE,PLE)
推荐系统的多任务目标 在业务场景中,常常不只有一个业务目标。比如Youtube:用户点击率,完播率,满意度指标等。 在模型中,如果采用一个网络同时完成多个任务,那么就可以把这样的网络模型称为多任务模型
深入理解Transformer技术原理 | 得物技术
谷歌在2017年发布Transformer架构的论文时,论文的标题是:Attention Is All You Need。重点说明了这个架构是基于注意力机制的。
超越DeepSeek GRPO的关键RL算法,字节、清华AIR开源DAPO
DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率,不过其论文中似乎还缺少一些关键细节,让人难以复现出大规模和工业级的强化学习系统。 近日,清华 AIR 和字节联合 SIA La
从PPO到GRPO:算力减半的大模型推理能力训练革命
作者 | Greg Schoeninger 编译 | 岳扬 不久前,我们深入研究了 DeepSeek-R1 背后的技术原理(图解系列|DeepSeek-R1的出众推理能力因何而来?),但是没有详细介绍
Deepseek系列论文解读1:从DeepSeek V3、DeepSeekMath到DeepSeek R1原理解读
最近开始读ds的论文,为了方便巩固知识,记录一下。 总体来说,我想按照 DeepSeek V3 -> DeepSeekMath -> DeepSeek R1 路径来讲解
6 个 GitHub 上狂飙的 AI 教程,牛啊。
LLM-Universe 本文会经常提到 LLM ,先补充下哈。LLM 是指的大型语言模型(Large Language Model)的缩写。
实战项目--基于梯度提升树算法的多特征分类任务
前言 笔者在前不久参加了梧桐杯大数据创新大赛,在该赛事的省级初赛中笔者最终选用了梯度提升树模型来完成初赛要求的多特征二分类任务,那么接下来笔者就为大家讲解一下该项目以及其中用到的梯度提升树算法。 赛题