首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
祝我好运
掘友等级
努力学习ing
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
27
文章 15
沸点 12
赞
27
返回
|
搜索文章
最新
热门
强化学习 6 :TD(λ) 和 Q 学习
在这篇文章中,我将使用一个简单的示例来帮助您理解 Q-learning 并回答以下问题: 什么是TD(λ) 以及如何使用它? Q-learning的经典off-policy 方法是如何工作的?
强化学习5 :蒙特卡洛和时间差分学习
现在我们已经介绍了 MDP,是时候讨论 Q-learning 了。为了增强我们对这个主题的认识,我们需要逐步了解: 动态规划 (DP): 在我们对 MDP 的讨论中介绍 蒙特卡洛 (MC) 学习: 在
强化学习 4 :使用 MDP 进行最优策略搜索
们已经学到了很多东西,所以让我们回顾一下到目前为止我们在我的强化学习系列中所涵盖的内容: 第 1 部分:强化学习基本介绍 第 2 部分:介绍马尔可夫过程 第 3 部分:马尔可夫决策过程 (MDP) 使
强化学习3 :马尔可夫决策过程
在本文中,我们将通过一个简单的例子来解释机器学习这一经典概念。 到最后,您将掌握以下基本知识: 如何定义马尔可夫决策过程; MDP是如何工作的,一个简单的例子; 为什么以及如何使用折扣奖励。 为什么我
强化学习2:介绍马尔可夫过程
在上一篇文章中,我 简要介绍了强化学习。今天,我将通过介绍马尔可夫过程来帮助您继续您的旅程,在讨论强化学习中使用的马尔可夫决策过程 (MDP) 之前,我们需要了解它。 到最后,您将掌握以下基本知识:
强化学习基本介绍
看完本篇文章,你将学到: 什么是强化学习; 如何将您的任务构建为 RL 问题; 强化学习与监督/无监督学习的关系; 使用 OpenAI Gym 通过简单的策略运行 RL 演示。 我们如何定义强化学习?
探索 GAN 的潜力:革新人工智能领域
生成对抗网络 (GAN) 是一种神经网络,可以根据训练数据集中的模式生成新数据。GAN 由两个神经网络组成:生成器和鉴别器。生成器接受一个随机输入并产生一个新的输出,该输出试图与训练数据相似,而鉴别器
通过深度学习识别阿尔茨海默病
阿尔茨海默病是一种退行性脑部疾病,影响着全世界数百万人。它是一种进行性疾病,会导致记忆力减退、认知能力下降,并最终导致无法执行基本任务。早期诊断和干预可以改善受疾病影响的人的生活质量。在本教程中,我们
使用深度学习生成音乐:在 Python + Keras 中使用 RNN
音乐生成是深度学习的一个迷人应用,我们可以教机器根据现有音乐的模式和结构创作新音乐。循环神经网络 (RNN) 和生成对抗网络 (GAN) 等深度学习模型已被用于音乐生成。 在本教程中,我们将使用 Py
使用风暴图像进行天气预测 3 :超参数调整和内核测试
高斯过程回归:拟合和预测 生成先验样本后,代码使用 gp1 的 fit() 函数拟合高斯过程。此函数在输入数据上训练高斯过程,以根据指定的内核生成预测。还打印了 GaussianProcessRegr
下一页
个人成就
文章被阅读
5,979
掘力值
194
关注了
24
关注者
1
收藏集
0
关注标签
0
加入于
2021-01-26