好文 - 用户531744882502的收藏集 - 掘金

好文

用户531744882502

更多收藏集

17篇文章 · 0订阅

CVer从0入门NLP（三）———GPT、BERT模型

Hello，大家好，祝JYM中秋快乐，阖家团圆。节前最后一篇，陪你走到最后一刻。🥗🥗🥗本节将为大家介绍GPT和BERT的原理，一起来学学叭。🍚🍚🍚

秃头小苏
2年前
5.5k
15
9

CVer从0入门NLP（三）———GPT、BERT模型

【人工智能】深入解析GPT、BERT与Transformer模型｜从原理到应用的完整教程

在当今人工智能迅猛发展的时代，自然语言处理（NLP）领域涌现出许多强大的模型，其中GPT、BERT与Transformer无疑是最受关注的三大巨头。这些模型不仅在学术界引起了广泛讨论，也在工业界得到了

XinZong
1年前
2.5k
1
评论

Java 开发面试题精选：Kafka 一篇全搞定

在Java开发工程师面试中，特别是涉及到Apache Kafka的部分，面试官可能会从基础知识、架构理解、实际应用、故障排查和性能优化等多个维度来考察您的能力。这篇文章会将一些大概率被问到的面试题目梳

凡夫贩夫
1年前
18k
121
7

Java 开发面试题精选：Kafka 一篇全搞定

大模型工程面试经典（八）—对比PPO和GRPO算法核心原理

本期分享详细介绍了PPO算法和GRPO算法的核心原理以及两者最大的区别。总的来说强化学习微调是新锐的大模型技术，也是面试官非常关注的问题，大家按模板回答一定是加分项！

大模型真好玩
6月前
528
3
评论

大模型工程面试经典（八）—对比PPO和GRPO算法核心原理

强化学习—PPO（Proximal Policy Optimization）算法原理及实现

近端策略优化（PPO）算法是OpenAI在2017提出的一种强化学习算法，本文将从PPO算法的基础入手，理解从传统策略梯度算法直到PPO算法的演进过程，以及算法迭代过程中的优化细节。

安可可可可
2年前
10k
5
2

强化学习(Reinforcement Learning)中的Q-Learning、DQN，面试看这篇就够了！

1. 什么是强化学习其他许多机器学习算法中学习器都是学得怎样做，而强化学习（Reinforcement Learning, RL）是在尝试的过程中学习到在特定的情境下选择哪种行动可以得到最大的回报。在很多场景中，当前的行动不仅会影响当前的rewards，还会影响之后的状态和一…

mantch
6年前
2.5k
5
评论

一文读懂强化学习：RL全面解析与Pytorch实战

> 在本篇文章中，我们全面而深入地探讨了强化学习（Reinforcement Learning）的基础概念、主流算法和实战步骤。从马尔可夫决策过程（MDP）到高级算法如PPO，文章旨在为读者提供一套

techlead_krischang
2年前
2.5k
3
评论

LangGraph实战项目：从零手搓DeepResearch（一）——DeepResearch应用体系详细介绍

本篇系统介绍了DeepResearch技术，阐述了其通过大规模检索与流程编排解决大模型幻觉和长文本生成难题的核心机制，详细梳理了四种主流架构模式及多家科技巨头的技术路线，同时总结当前面临的挑战与机遇。

大模型真好玩
5月前
2.2k
9
评论

LangGraph实战项目：从零手搓DeepResearch（一）——DeepResearch应用体系详细介绍

深入浅出LangGraph AI Agent智能体开发教程（一）—全面认识LangGraph

本期分享从LangGraph与LangChain的对比出发，介绍了LangGraph的三层核心架构、完整生态工具，带大家全面认识最火热最全面的智能体开发框架LangGraph。

大模型真好玩
7月前
4.3k
32
评论

深入浅出LangGraph AI Agent智能体开发教程（一）—全面认识LangGraph

AI智能体开发框架LangChain & LangGraph快速入门实战（包含LangSmith）

最近乱七八糟的事太多，今天来点偏技术实战的，带大家用LangChain & LangGraph快速入门用编程创建智能体，用LangSmith进行追踪，Agent-Chat构建Agent UI。

AI大模型
5月前
1.3k
3
评论