掘友等级
获得徽章 0
#青训营 x 字节后端训练营#
刚结束青训营的结营小测试,自我感觉还可以,希望以后能再多多参与这种线上训练营!
#青训营 x 字节后端训练营#
也许人生总是会有遗憾的,平常心对待吧,加油!
#青训营 x 字节后端训练营#
白天好好搬砖,拒绝深夜内耗!
#青训营 x 字节后端训练营#
找数据找了半天,不得不说国内的基础数据集对科研人员真的不太友好,不过还好,今天顺带学了学神经网络的东西,发现它其实没有这么难以理解
#青训营 x 字节后端训练营#
研究牲的一天,什么活儿都得干,就是不干自己的活儿
#青训营 x 字节后端训练营#
青训营马上结束了,今天继续看代码,然后刷刷算法题,开卷!
#青训营 x 字节后端训练营#
今天也主要在搞爬虫的事情,发现使用对go的多线程使用还是不太清除,后面补补吧
#青训营 x 字节后端训练营#
这两天在学习爬虫,算是对go语言的学以致用了,但奈何自己太菜了,只会爬最简单的数据
#青训营 x 字节后端训练营#
近期刷题
2023.5.24
344. 反转字符串
541. 反转字符串 II
2023.5.25
剑指 Offer 05. 替换空格
#青训营 x 字节后端训练营#
PG
直接用神经网络去拟合策略函数
DPG
拟合的策略不是一个动作概率分布,而是一个确定性的策略
优势:在选取某状态下最优动作时,无需遍历所有动作,只需根据函数π(s)即可得到
DDPG
结合lDPG、DQN、和AC框架的思想,在用神经网络去拟合策略函数的基础上,再用神经网络去学习Q函数。因为AC框架包含两个部分,且DQN又是双网络的,故一共有4个网络:
下一页