TEST

162 阅读9分钟

注意事项

1、课前准备

1、安装好linux操作系统
        1、virtual-box虚拟机 下载地址:https://www.virtualbox.org/
        2、ubuntu图形化操作系统优麒麟,下载地址: https://www.ubuntukylin.com/downloads/  选择桌面版
        3、deepin,底层ubuntu系统 下载地址: https://www.deepin.org/download/
2、安装好Python3.6运行环境  
        参考安装文档:http://47.94.6.102/PythonandAITrainingCamp2/1-Lesson/blob/master/Linux%E4%B8%8BPython%E7%8E%AF%E5%A2%83%E5%AE%89%E8%A3%85%E6%96%87%E6%A1%A3
        如果安装了deepin这个系统,python就不用重新装了,要不然会出问题,deepin自带了python3.6
3、安装好Python IDE:pycharm
4、运行Hello World 成功
5、注册好博客园、CSDN等博客账号
6、注册好github账号(未来的作业,需要同步到这个gitlab上,并且同步到github上)

2、 作业提交方式

  • 创建自己的私有仓库即可,每一次作业都提交到自己的仓库上
  • 创建一个叫做homework的仓库,每一次作业对应的名称为 (课程次数)-homework。 作业会根据大家的情况进行难度提升

课程表:每周二四六 晚8:30-10:30(除法定节假日)

已讲内容

课次序号阶段日期主题大纲作业Deadline扩展材料
1Python基础阶段4月16日课程介绍、基本数据类型及循环控制1、课程介绍及使用环境说明
2、数字类型、数字的数学运算、注释、字符串操作
3、 初识linux
1、git使用
2、git操作文档
2Python基础阶段4月18日Python基础一1、逻辑控制(if与循环)、条件控制运算
2、数组数据类型
3、通过if/else及简单正则实现问答思路讲解
4、pycharm的基本使用
5、git的基本操作
6、排序算法冒泡排序的讲解
3Python基础阶段4月20日Python基础二1、set、dist、tuple类型
2、Python中自定义函数及函数的基本使用
递归的概念及应用
4Python基础阶段4月23日基于规则的聊天机器人项目(1)1、高级条件控制-循环的中断(break/continue)
2、函数的返回值
3、初识正则
4、AIML框架介绍
5、案例讲解:利用AIML写规则,并实现简单的问答系统
1、本地安装AIML框架
2、把v0.1 Bot的规则写入AIML框架
3、实现简单的对话
4、书写邮箱和手机号码匹配的正则
2019-04-25 15:00
5Python基础阶段4月25日基于规则的聊天机器人项目(2)1、正则表达式的高级应用
2、聊天中的上下文理解
3、AIML中的多层条件控制
4、AIML中的template高级教程
5、利用AIML实现多伦对话
6、中文分词技术
1、实现快速排序2019-04-27 15:00
6Python高级编程4月27日Python面向对象(1)1、面向对象的基本思想
2、Python的工程结构及命名规范
3、面向对象的类设计
4、快排的实现
2、对象的封装常见排序方法阅读
7Python高级编程5月07日Python面向对象(2)1、导包
2、面向对象三大特性
8Python高级编程5月09日Python函数式编程(1)1、闭包
2、装饰器(语法糖/注解)开发
3、时间复杂度
开发一个可以验证函数参数类型的装饰器python排序与时间复杂度
9Python高级编程5月11日Python函数式编程(2)1、lambda表达式与高阶函数的应用
2、yield生成器
3、三大推导式
4、异常
5、文件的操作
10Python高级编程5月14日Python的文件操作1、日志的作用与操作
2、(多)进程与(多)线程
0、多线程作业
1、阅读 更多日志配置格式 配置yaml格式的日志配置
0、日志配置格式说明
1、更多日志基本用法
2、更多日志高级用法
3、更多日志配置格式
11关系型数据库MySQL5月16日数据库(1)0、多线程作业讲解
1、MySQL 数据库的创建
12关系型数据库MySQL5月18日数据库(2)1、MySQL的增删改查
2、数据库、表、字段的字符集
3、数据库的5大约束
1、部门工资最高的员工
2、部门工资前三高的员工
13关系型数据库MySQL5月21日git的高级使用与Linux常用命令1、MySQL关联查询/慢查询/索引/存储引擎1、写一篇git操作的博客,并把博客地址给到班主任
2、预习vim命令
git中文官方教程
vim编辑器常用命令
Linux常用命令
MySQL事物隔离级别
慢查询结果说明
14Git使用进阶5月23日git的高级使用与Linux常用命令1、文件过滤/分支创建/合并
3、版本回退
4、提交历史
5、文件暂存
6、差异比对
7、标签
8、vim命令
9、虚拟环境的创建与实用
15爬虫5月25日selenium框架0、虚拟环境的创建与实用
1、Selenium的基本定位方法
2、Selenium的鼠标事件
3、Selenium的键盘事件
1、chrome driver谷歌下载地址 或者选择 chrome driver淘宝镜像下载地址选择对应版本。备注:如果下载不到找我要
2、环境安装:pip install selenium
3、Selenium driver官方API文档
4、Selenium官方教程
16爬虫5月28日selenium框架1、xpath定位
2、CSS选择器定位
3、js定位
4、requirements的作用与使用
cookies操作与截图方法封装
作业:定位京东商城-电脑-笔记本-销量最高的这一台笔记本的配置信息,并打印出来
17爬虫5月30日selenium框架1、京东商品信息抓取并写入文件
2、元素的等待
3、mysql数据库的连接
4、selenium的远程分布式启动
作业:以分布式的方式将京东商品信息写入数据库
18爬虫6月01日selenium框架1、python中的元类
2、面向对象思想的应用-PageObject模式
3、对象关系映射(ORM)
19爬虫6月04日scrapy框架1、Scrapy框架的工作流
2、使用Scrapy进行爬虫开发
20Web开发6月06日Flask框架1、Flask的基本使用
2、微服务的开发理念
requests库文档
Flask官方文档
21Web开发6月11日Flask框架1、restful风格的理解
2、Flask与Flask-RESTful的结合使用
3、uwsgi部署
Flask-RESTful官方文档
22数据处理6月13日数据计算1、anaconda环境安装
2、jupyter环境安装
3、NumPy的嵌套序列
4、定长数组
5、矢量化
6、花式索引
7、数组转置和轴对换
8、使用Numpy进行简单数据处理
23数据处理6月15日数据计算1、Pandas的使用

机器学习部分内容

课次序号阶段日期主题大纲材料
1第一周
直播
6月23日机器学习简介1、机器学习应用场景
2、机器学习工程化流程
3、监督学习与非监督学习一览
4、机器学习中的数据(训练数据与测试数据)
5、回归问题与分类问题
6、数据处理技巧
7、归一化处理
8、降维处理
PPT, 代码, 数据
2第一周
录播
TBDsklearn的学习与应用1、sklearn工具的安装
2、sklearn的使用
3第二周
录播
TBD机器学习必备数学知识(上)1、随机变量
2、条件概率与联合概率
3、贝叶斯定理
4、期望和方差
5、向量与矩阵
PPT
4第二周
直播
6月30日机器学习必备数学知识(下)6、导数的计算
7、最优化简介
8、凸优化简介
PPT
--第三周
录播
TBD线性回归模型1、线性回归模型介绍
2、线性回归模型推导
3、利用normal equation求解线性回归
4、特征之间的线性相关
--第三周
录播
TBD逻辑回归模型1、逻辑回归模型详解
2、梯度下降法
3、随机梯度下降法
4、精准率,召回率与F1-score
5、特征工程
--第三周
直播
TBD线性回归与逻辑回归项目实战1、股票预测案例讲解
2、银行电话营销效果预测案例讲解
--第四周
录播
TBD朴素贝叶斯模型1、朴素贝叶斯模型介绍
2、贝叶斯定理
3、垃圾邮件的过滤
4、朴素贝叶斯的MLE
5、log trick
--第四周
录播
TBD文本技术处理1、文本的表示
2、文本之间 的相似度计算
3、文本预处理技术
4、tf-idf向量化技术
5、语言模型
6、词向量技术
--第四周
直播
TBD朴素贝叶斯项目实战垃圾邮件过滤案例讲解
--第五周
录播
TBD情感分析项目实战掌握如何利用文本处理技术和分类算法来搭建情感分析系统
--第五周
录播
TBDKNN模型1、KNN模型介绍
2、KNN模型的实现
3、KD-tree介绍
4、KNN模型的缺点
--第五周
直播
TBDKNN模型项目实战二手车价格预测案例讲解
--第六周
录播
TBD支持向量机1、SVM介绍
2、SVM原理
3、拉格朗日惩罚项
4、Primal-Dual问题
--第六周
录播
TBD核函数1、核函数介绍
2、交叉验证
3、调参技术
--第六周
直播
TBDSVM模型项目实战Iris数据集实战SVM
--第七周
录播
TBD决策树1、决策树介绍
2、信息熵的介绍
3、决策树的构建
4、过拟合现象
--第七周
录播
TBD随机森林1、随机森林介绍
2、Bootstrap介绍
3、分支条件
4、集成模型的优势
--第七周
直播
TBD随机森林模型项目实战预测员工离职率
--第八周
录播
TBDGradient Boosting与XGBoost1、Gradient Boosting方法论
2、GBDT与随机森林区别
3、XGBoost介绍
--第八周
录播/直播
TBD综合项目实战人脸识别