获得徽章 0
#青训营 x 字节后端训练营#
刚结束青训营的结营小测试,自我感觉还可以,希望以后能再多多参与这种线上训练营!
评论
#青训营 x 字节后端训练营#
也许人生总是会有遗憾的,平常心对待吧,加油!
评论
#青训营 x 字节后端训练营#
白天好好搬砖,拒绝深夜内耗!
评论
#青训营 x 字节后端训练营#
找数据找了半天,不得不说国内的基础数据集对科研人员真的不太友好,不过还好,今天顺带学了学神经网络的东西,发现它其实没有这么难以理解
评论
#青训营 x 字节后端训练营#
研究牲的一天,什么活儿都得干,就是不干自己的活儿[微笑]
评论
#青训营 x 字节后端训练营#
青训营马上结束了,今天继续看代码,然后刷刷算法题,开卷!
评论
#青训营 x 字节后端训练营#
今天也主要在搞爬虫的事情,发现使用对go的多线程使用还是不太清除,后面补补吧
评论
#青训营 x 字节后端训练营#
这两天在学习爬虫,算是对go语言的学以致用了,但奈何自己太菜了,只会爬最简单的数据[尬笑]
评论
#青训营 x 字节后端训练营#
近期刷题

2023.5.24

344. 反转字符串

541. 反转字符串 II

2023.5.25

剑指 Offer 05. 替换空格
展开
评论
#青训营 x 字节后端训练营#
PG

直接用神经网络去拟合策略函数

DPG

拟合的策略不是一个动作概率分布,而是一个确定性的策略

优势:在选取某状态下最优动作时,无需遍历所有动作,只需根据函数π(s)即可得到

DDPG

结合lDPG、DQN、和AC框架的思想,在用神经网络去拟合策略函数的基础上,再用神经网络去学习Q函数。因为AC框架包含两个部分,且DQN又是双网络的,故一共有4个网络:
展开
评论
#青训营 x 字节后端训练营#
今天好像一天都在忙,但又好像啥也没干,太秒了
评论
#青训营 x 字节后端训练营#
今天补了补最近落下的课程,把之前学到一半的git慢慢捡了起来,加油吧
评论
#青训营 x 字节后端训练营#
今天找了几篇论文,近期好好看看,加快进度!
评论
下一页
个人成就
文章被点赞 1
文章被阅读 1,480
掘力值 78
收藏集
1
关注标签
0
加入于