首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
好文
订阅
用户531744882502
更多收藏集
微信扫码分享
微信
新浪微博
QQ
17篇文章 · 0订阅
CVer从0入门NLP(三)———GPT、BERT模型
Hello,大家好,祝JYM中秋快乐,阖家团圆。节前最后一篇,陪你走到最后一刻。🥗🥗🥗本节将为大家介绍GPT和BERT的原理,一起来学学叭。🍚🍚🍚
【人工智能】深入解析GPT、BERT与Transformer模型|从原理到应用的完整教程
在当今人工智能迅猛发展的时代,自然语言处理(NLP)领域涌现出许多强大的模型,其中GPT、BERT与Transformer无疑是最受关注的三大巨头。这些模型不仅在学术界引起了广泛讨论,也在工业界得到了
Java 开发面试题精选:Kafka 一篇全搞定
在Java开发工程师面试中,特别是涉及到Apache Kafka的部分,面试官可能会从基础知识、架构理解、实际应用、故障排查和性能优化等多个维度来考察您的能力。这篇文章会将一些大概率被问到的面试题目梳
大模型工程面试经典(八)—对比PPO和GRPO算法核心原理
本期分享详细介绍了PPO算法和GRPO算法的核心原理以及两者最大的区别。总的来说强化学习微调是新锐的大模型技术,也是面试官非常关注的问题,大家按模板回答一定是加分项!
强化学习—PPO(Proximal Policy Optimization)算法原理及实现
近端策略优化(PPO)算法是OpenAI在2017提出的一种强化学习算法,本文将从PPO算法的基础入手,理解从传统策略梯度算法直到PPO算法的演进过程,以及算法迭代过程中的优化细节。
强化学习(Reinforcement Learning)中的Q-Learning、DQN,面试看这篇就够了!
1. 什么是强化学习 其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcement Learning, RL)是在尝试的过程中学习到在特定的情境下选择哪种行动可以得到最大的回报。在很多场景中,当前的行动不仅会影响当前的rewards,还会影响之后的状态和一…
一文读懂强化学习:RL全面解析与Pytorch实战
> 在本篇文章中,我们全面而深入地探讨了强化学习(Reinforcement Learning)的基础概念、主流算法和实战步骤。从马尔可夫决策过程(MDP)到高级算法如PPO,文章旨在为读者提供一套
LangGraph实战项目:从零手搓DeepResearch(一)——DeepResearch应用体系详细介绍
本篇系统介绍了DeepResearch技术,阐述了其通过大规模检索与流程编排解决大模型幻觉和长文本生成难题的核心机制,详细梳理了四种主流架构模式及多家科技巨头的技术路线,同时总结当前面临的挑战与机遇。
深入浅出LangGraph AI Agent智能体开发教程(一)—全面认识LangGraph
本期分享从LangGraph与LangChain的对比出发,介绍了LangGraph的三层核心架构、完整生态工具,带大家全面认识最火热最全面的智能体开发框架LangGraph。
AI智能体开发框架LangChain & LangGraph快速入门实战(包含LangSmith)
最近乱七八糟的事太多,今天来点偏技术实战的,带大家用LangChain & LangGraph快速入门用编程创建智能体,用LangSmith进行追踪,Agent-Chat构建Agent UI。