大部分机器学习的课都关注于模型,包括了我们上半年的直播(李沐:动手学深度学习PyTorch篇直播总结 )。但在用机器学习解决实际问题的同学们都知道,模型只是整个故事里的一块。如果你是参加比赛,那么很重要的两块是调参和模型融合。如果你是将机器学习用进产品,那么你80%时间可能花在收集和清理数据上,剩下的时间大都用来监测线上模型质量,和维护定期上线新模型上。
数据科学家都在做什么(来源forbes,图侵删)
某一天公司老板突然提议说我们来开一门讲如何落地机器学习到产品中的课,关注在模型以外的技术。这一提议得到了家里领导的积极赞同(领导指示:疫情后日常的斯坦福遛娃活动被取消了,赶紧拿个证把活动重新搞起来)。所以9月开始,我将在两领导的带领下,开设《实用机器学习》
课程将分四部分,包括1)数据收集和处理,模型融合和评估,2)处理实际数据中遇到的各种偏移,和有结构的数据(时序,图),3)自动调参、模型蒸馏、多模块融合,4)性能、公平性、因果推理。
在斯坦福的同学9月1号可以在系统里选课,课号是 CS329P。我们也在同学校协商将课程视频免费放到网上。当然也有在考虑是不是推出一个中文版本。最后,课程主页在大家熟悉的d2l.ai: