ai - 用户201294308761的收藏集 - 掘金

ai

用户201294308761

更多收藏集

13篇文章 · 0订阅

《AI导演手册：用CRTF法则写出95%成功率的提示词》

摘要：用导演视角重构提示词工程，CRTF框架+3级案例，从30%到95%成功率，附Cursor/Copilot配置实战，AI秒变影帝。

之维
6月前
456
1
评论

《AI导演手册：用CRTF法则写出95%成功率的提示词》

深入解析大型语言模型：从训练到部署大模型

简介随着数据科学领域的深入发展，大型语言模型——这种能够处理和生成复杂自然语言的精密人工智能系统—逐渐引发了更大的关注。 LLMs是自然语言处理（NLP）中最令人瞩目的突破之一。这些模型有潜力彻底改

MobotStone
2年前
4.2k
7
评论

PyTorch进阶：从自定义损失函数到生产部署全栈指南

本文深入讲解PyTorch高级开发技巧，涵盖自定义层/损失函数实现、模型保存加载策略以及TensorBoard可视化监控，提供工业级最佳实践和完整代码示例。

聚客AI
9月前
1.6k
2
评论

PyTorch进阶：从自定义损失函数到生产部署全栈指南

多任务推荐任务建模（包含MMOE，PLE）

推荐系统的多任务目标在业务场景中，常常不只有一个业务目标。比如Youtube：用户点击率，完播率，满意度指标等。在模型中，如果采用一个网络同时完成多个任务，那么就可以把这样的网络模型称为多任务模型

zccccc_
11月前
457
2
2

深入理解Transformer技术原理｜得物技术

谷歌在2017年发布Transformer架构的论文时，论文的标题是：Attention Is All You Need。重点说明了这个架构是基于注意力机制的。

得物技术
1年前
7.4k
61
2

深入理解Transformer技术原理｜得物技术

超越DeepSeek GRPO的关键RL算法，字节、清华AIR开源DAPO

DeepSeek 提出的 GRPO 可以极大提升 LLM 的强化学习效率，不过其论文中似乎还缺少一些关键细节，让人难以复现出大规模和工业级的强化学习系统。近日，清华 AIR 和字节联合 SIA La

机器之心
1年前
243
1
评论

从PPO到GRPO：算力减半的大模型推理能力训练革命

作者 | Greg Schoeninger 编译 | 岳扬不久前，我们深入研究了 DeepSeek-R1 背后的技术原理（图解系列｜DeepSeek-R1的出众推理能力因何而来？），但是没有详细介绍

Baihai_IDP
1年前
502
3
评论

从PPO到GRPO：算力减半的大模型推理能力训练革命

Deepseek系列论文解读1：从DeepSeek V3、DeepSeekMath到DeepSeek R1原理解读

最近开始读ds的论文，为了方便巩固知识，记录一下。总体来说，我想按照 DeepSeek V3 -> DeepSeekMath -> DeepSeek R1 路径来讲解

RaoChongzhi
1年前
1.4k
6
2

6 个 GitHub 上狂飙的 AI 教程，牛啊。

LLM-Universe 本文会经常提到 LLM ，先补充下哈。LLM 是指的大型语言模型（Large Language Model）的缩写。

逛逛GitHub
1年前
4.5k
46
评论

实战项目--基于梯度提升树算法的多特征分类任务

前言笔者在前不久参加了梧桐杯大数据创新大赛，在该赛事的省级初赛中笔者最终选用了梯度提升树模型来完成初赛要求的多特征二分类任务，那么接下来笔者就为大家讲解一下该项目以及其中用到的梯度提升树算法。赛题

念旧_
1年前
257
2
评论

实战项目--基于梯度提升树算法的多特征分类任务