首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Scc_hy
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
强化学习_03_表格方法总结
本文已参与「新人创作礼」活动,一起开启掘金创作之路。 一、monta carlo 迭代时间:一个回合结束后, 对每个动作进行迭代 回合内行动策略:探索+利用 迭代公式:当前状态行动带来的收益($Q_{
强化学习_03_表格方法实践(CartPole-v0 And MontoCarlo)
本文已参与「新人创作礼」活动,一起开启掘金创作之路。 已经学好全部的表格方法训练Agent,所以,自己拿一个游戏环境进行智能体的训练。 一、选取游戏 打开 gym官网文档 ,里面就是对CartPole
【论文解读】滴滴智能派单-KDD2018 Large-Scale Order Dispatch in On-Demand Ride-Hailing
本文已参与「新人创作礼」活动,一起开启掘金创作之路。 一、简介 基于大量历史数据,构建一个大Q表,用于订单的评估,满足乘客的需求的同时,兼顾平台的长期价值,最终提升平台的收入。 二、背景 从司机抢单到
机器学习_LGB调参汇总(开箱即食)
本文已参与「新人创作礼」活动,一起开启掘金创作之路。 在数据层面的一些正负采样,业务层面一些数据筛选,以及异常值的处理后。我们进行模型训练,同时需要对模型进行参数的调整,以提升模型的精度。笔者就一些现
PID原理及python简单实现与调参
本文已参与「新人创作礼」活动,一起开启掘金创作之路。 一、前言 近期在实际项目中使用到了PID控制算法,于是就该算法做一总结。 二、PID控制算法详解 2.1 比例控制算法 例子: 假设一个水缸,需要
个人成就
文章被点赞
2
文章被阅读
3,049
掘力值
115
关注了
0
关注者
2
收藏集
0
关注标签
5
加入于
2022-08-23