蒋炎岩 南京大学副教授,博士生导师
B站视频:
【[戒读] 绿导师读博那些事儿 (八年后回看版)】 www.bilibili.com/video/BV1oT…
【【优博之路】读博那些事儿】 www.bilibili.com/video/BV1ic…
文字版:
蒋老师个人主页:
蒋老师的知乎:
读博那些事儿: zhuanlan.zhihu.com/p/82579410
绿导师是怎样戴帽的:学术跃进运动的来龙去脉:zhuanlan.zhihu.com/p/198649483…
蒋老师的小红书:
Notes
-
数据就是知识,压缩就是智能。
-
预训练决定模型“学会了什么、会到什么程度、以及以什么方式组织知识”
-
有一个正确的Reward function
-
人类本质上还是Reward Hacker
- Long-term reward(更长远的reward) or short-term reward?
-
-
当你把你训练的所有东西都忘得差不多的时候,但你又能把它restruct出来的时候,然后我觉得我就成了一个Matured Problem Solver(成熟的问题解决者)。
-
当我把所有问题都忘掉的时候,我就真正理解了。
-
-
蒋老师提到的CS336, Percy Liang课程,第一说明蒋老师也在学习新知识(对于他来说),第二说明,这门课是真的好呀。
- CS336: Language Modeling from Scratch: cs336.stanford.edu/
-
对AI时代的反思
-
编程 = 翻译?你再仔细想想,什么工作不是“翻译”?
- 话说Transformer最初就是用来做翻译的。
-
在AI时代,不要给自己设限,去做一些你对其有兴趣的事、自己想要做的事、自己内心喜欢的事。
- 未来我可以做些什么?
-
B站视频部分截图: