稀土掘金 稀土掘金
    • 首页
    • AI Coding
    • 数据标注 NEW
    • 沸点
    • 课程
    • 直播
    • 活动
    • APP
      插件
      • 搜索历史 清空
        • 写文章
        • 发沸点
        • 写笔记
        • 写代码
        • 草稿箱
        创作灵感 查看更多
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
0 /100
强化学习
订阅
avatar
笨蛋酱46049
更多收藏集

微信扫码分享

微信
新浪微博
QQ

3篇文章 · 0订阅
  • 强化学习的基本概念与代码实现
    神经网络造就了最近我们在计算机视觉、机器翻译和时间序列预测等领域上的突破—同时它也可以和强化学习算法结合来创建一些惊人的成果,例如 AlphaGo(参阅:无需人类知识,DeepMind 新一代围棋程序 AlphaGo Zero 再次登上 Nature)。 强化学习指的是面向目标…
    • 机器之心
    • 7年前
    • 1.2k
    • 13
    • 评论
    算法 游戏 神经网络
    强化学习的基本概念与代码实现
  • 强化学习
    监督学习是利用标记了的样本进行学习,无监督学习则是使用未标记的样本进行学习,这两个是我们最常见的。半监督学习则是样本中只有少量带标记的样本,多数样本都未标记,利用这些样本进行学习。强化学习则是很不同的一种学习方式,它没有规则的训练样本和标签,主要通过奖励和惩罚达到学习的目的。 …
    • 超人汪小建
    • 8年前
    • 1.3k
    • 10
    • 评论
    人工智能 机器学习 设计
    强化学习