七月在线-机器学习集训营 第九期

142 阅读6分钟

核心能力培养

构建完整知识体系:掌握机器学习从基础算法到深度学习的核心理论,理解模型原理、数学推导及适用场景

七月在线-机器学习集训营 第九期--- “夏のke” ---www.---bcwit.---top/1158/

强化工业级实战能力:通过 8 + 真实行业案例、5 个完整项目实战,实现从数据预处理到模型部署的全流程落地经验

掌握前沿技术工具:精通 PyTorch/TensorFlow/Pandas 等主流框架,熟悉 MLOps 流程及分布式训练技术

提升职业竞争力:产出可复用的项目作品集,掌握大厂算法岗面试核心考点,实现高薪就业或技术晋升

课程大纲(120 课时,5 个月系统学习)

第一阶段:机器学习基石(20 课时)

数学基础与 Python 强化

线性代数:矩阵运算、特征分解、奇异值分解(SVD)

概率论与数理统计:贝叶斯定理、参数估计、假设检验

Python 进阶:NumPy 矩阵运算优化、Pandas 数据处理技巧、面向对象编程实战

数据可视化:Matplotlib/Seaborn 绘图原理、交互式可视化工具 Plotly 应用

传统机器学习核心算法

监督学习:线性回归(正则化优化)、逻辑回归(多分类实现)、决策树(ID3/C4.5/CART 算法对比)

无监督学习:K-Means 聚类(优化策略与肘部法则)、PCA 降维(数学推导与工程实现)

集成学习:Bagging(随机森林)、Boosting(GBDT/XGBoost/LightGBM 原理对比)

模型评估:交叉验证、混淆矩阵、AUC-ROC 曲线、偏差 - 方差权衡

第二阶段:深度学习核心技术(35 课时)

神经网络基础

反向传播算法推导(计算图原理)

激活函数对比(ReLU/Sigmoid/Softmax 梯度问题分析)

优化器原理:SGD/Momentum/Adam 参数调优技巧

正则化方法:L1/L2 正则、Dropout、Batch Normalization 工程实现

主流框架与模型实战

PyTorch/TensorFlow 双框架核心 API 对比与项目选型

经典网络架构:LeNet/ResNet/VGG/Inception 图像分类实战

序列模型:RNN/LSTM/GRU 原理及 NLP 文本分类应用

注意力机制:Self-Attention/Transformer 架构推导与代码实现

计算机视觉专题

图像数据增强技术(数据扩充策略与代码实现)

目标检测:YOLO 系列(v3-v8)原理对比与模型训练

图像分割:U-Net/DeepLab 架构解析与医学影像处理实战

自然语言处理专题

文本预处理:词向量(Word2Vec/GloVe)、子词模型(BPE 算法)

预训练模型:BERT/ERNIE 结构分析与微调实战

序列标注:BiLSTM+CRF 命名实体识别(NER)项目落地

第三阶段:工业级项目实战(40 课时)

实战项目一:金融风控模型开发(信贷违约预测)

数据处理:缺失值填充策略、异常值检测(IQR/Z-score 方法)

特征工程:WOE 编码、信息价值(IV)计算、特征选择模型对比

模型优化:不平衡数据处理(SMOTE/XGBoost 参数调参)

部署环节:Flask 接口开发、Docker 容器化部署

实战项目二:电商用户行为分析(个性化推荐系统)

数据清洗:用户会话分割、时间序列特征构建

协同过滤:基于用户 / 物品的 CF 算法实现(矩阵分解优化)

深度学习推荐:Wide&Deep/DeepFM 模型对比与 AB 测试

冷启动问题:基于内容的推荐算法(TF-IDF/Word2Vec 融合)

实战项目三:医疗影像辅助诊断(肺癌 CT 图像分类)

医学图像预处理:DICOM 格式解析、ROI 区域提取

迁移学习:预训练模型参数冻结策略与微调技巧

多模态融合:CT 图像与电子病历数据特征融合方法

模型解释:Grad-CAM 可视化技术与临床报告生成

实战项目四:智能客服对话系统(多轮对话机器人)

意图识别:TextCNN/RoBERTa 模型对比与意图分类优化

对话管理:状态跟踪(DST)与策略生成(DPL)实现

回复生成:Seq2Seq+Attention 模型训练与 beam search 优化

性能优化:对话系统响应速度优化(模型量化与剪枝)

第四阶段:前沿技术与职业发展(25 课时)

高级专题

生成式 AI:Diffusion 模型(DDPM/Stable Diffusion)原理与图像生成实战

强化学习:DQN/PPO 算法推导及游戏 AI(Atari/Gym 环境)实战

大模型技术:LLaMA 架构分析、LoRA 参数高效微调(PEFT 库应用)

MLOps 实践:模型版本管理(MLflow)、自动化部署(CI/CD 流水线)

职业提升模块

大厂面试解析:算法岗高频考点(模型推导 / 项目深挖 / 场景题应答)

简历优化:技术亮点提炼、项目经历 STAR 法则包装

行业洞察:AI + 医疗 / 金融 / 零售等领域人才需求与技术落地痛点

课程特色

  1. 顶配师资阵容

主讲导师:前 Google 资深算法工程师(10 年 + 机器学习经验,主导过亿级用户推荐系统)

实战导师:字节跳动 AI Lab 算法专家(负责短视频内容理解模型,带过 30 + 学员入职大厂)

每周直播答疑:1v1 代码评审、模型调优手把手指导

  1. 全流程项目驱动

真实数据集:涵盖 Kaggle 竞赛级数据、企业级脱敏数据(金融 / 医疗 / 电商等领域)

完整项目交付:从需求分析到上线部署,产出可写入简历的高质量作品集

开源代码库:提供工业级代码模板(数据处理 / 模型训练 / 部署脚本)

  1. 专属学习保障

督学服务:班主任 1v1 学习规划,每周进度跟踪(避免拖延症)

社群资源:学员专属 GitHub 代码仓库、行业报告共享群、线下沙龙对接会

就业支持:内推通道(合作企业超 200 家)、模拟面试(技术 + HR 双面)

资料

内部教材:《机器学习算法推导手册》(含 200 + 公式详细推导)

工具礼包:Anaconda 环境配置脚本、常用算法可视化工具(Netron/TensorBoard)

数据集库:医疗影像(NIH Chest X-Ray)、金融数据(Home Credit Default Risk)等 10 + 真实数据集

平台支持

在线实验平台:预装 PyTorch/TensorFlow 环境,支持 Jupyter Notebook 实时调试

作业系统:自动代码查重、评分,提供错误定位与优化建议

回放机制:课程视频永久回放,重点片段支持 0.5-2 倍速调节