机器学习难吗?到底该怎么快速入门?

677 阅读4分钟

极客时间公开课

直播亮点
如果你是一名学生,或者是刚毕业没几年的初级开发工程师,再或者是一名数据挖掘、数据分析工程师,那你可以考虑成为一名机器学习工程师。因为这个岗位,不仅工资高,而且发展前景也好。

如果你是一名工程师,你的目标是以后成为架构师或者技术总监,或者一家公司的CTO,那机器学习也应该成为你的必备技能。因为,未来只要营收超过5个亿的互联网公司,就需要具备机器学习的能力。

机器学习,不再是什么高深的技术,你要知道,所有互联网公司的业务模式里,都逃不出广告、推荐和搜索这几个场景,而这里面,机器学习都会充当重要角色。

但是,机器学习到底难吗?该怎么入门?行业到底需要怎么样的机器学习工程师?这次直播,我将会从我的角度,给你确定性的答案。

你将获得
机器学习工程师对数学、英语、学历的要求是什么?

从宏观上理解,机器学习到底是在做什么事情?

行业喜欢什么样的机器学习工程师?

快速入门、精通机器学习的最佳路径是什么?

机器学习算法工程师 入门之路

入门误区

  • 心态不佳
    • 没有免费的午餐
    • 入门的门槛不高
    • 高收入行业必然带来很多竞争
    • 做技术的人 要关注自身的提升
  • 广而不精
    • 算法傻瓜化 跑一个demo 入门容易 是人就能做的事情
    • 初级人才泛滥 中高级人才缺失
    • 转换领域 耗费大量时间, 不要浅尝辄止,不要频繁切换 要纵深化的学习
    • 正确方法 确定领域进行猛攻
  • 目标不明确
    • 跑通demo不等于入门 写几行代码就完成的事情 没有意义
    • 目标 做能干活的人
      • 独立完成项目
      • 不犯低级错误 有些问题可以提前看到的 但是没有提前解决 耗费一周去跑数据 这就是浪费时间
  • 实践缺乏
    • 数据科学领域只是很多是经验积累
    • 入门材料自身错误 容易造成错误理解
    • 动手遇到的困难 可能比看懂原理更有价值
      • 配置环境、内存爆掉小问题 看起来简单 实际可能耗费时间
      • 简单的事情、问题 不要慌
    • 等到"完全理解" 某个领域再去动手是不现实的
      • 数据是经验积累 行业会不断发现新的东西 不能等 先上车 跟着做
    • 正确方法 尽快动手实操 求精 求深 不求多
  • 能力和知识混淆
    • 知识不等于能力
    • 基本能力 解决问题的能力(上来就干) 只能考实践积累
    • 核心能力 编程 数据 数据科学 (SVM推导)
      • 需要进行长久的 有计划的提升
  • 入门难
  • 核心能力
    • 有价值的方向 加速学习
  • 编程能力
    • 至少掌握一门编程语言 python/R
    • 熟练掌握数据处理的各种方法和工具 pandas、pytorch
    • 高效实现机器学习算法
    • 能对模型和算法进行性能调优
  • 数学能力
    • 掌握概率 统计和最优理论基础
    • 掌握机器许学习
  • 数学科学相关能力
    • 系统的建模方法论
    • 掌握各类模型的准确度调优方法
    • 根据实际数据的情况 选择合适的建模方案
    • 研究前沿技术 解决实际问题
  • 能力提升的挑战
    • 能力不等于 知识储备 眼高手低惹人厌
    • 自己动手 比培训/课程材料好用
    • 市面上缺乏进阶材料
    • 自己动手的困境:从哪里动手遇到问题怎么办

一 编程基础

  • 数据处理和可视化
  • Pyhon语法糖
  • profiler

二 数学基础

  • 基本机器学习的概念
  • 极大似然估计
  • 手撸逻辑回归 和算法模型

三 数据科学能力

  • 模型
    • 常见模型
    • 模型调参
    • 模型集成
  • 数据
    • 根据业务衍生变量
    • 常见的encoder 变量选择策略
    • 如何根据探索性分析和bad case分析构建变量
  • 深度学习
    • 常见网络架构 实现
    • 深度学习炼丹的方法