背景:目前做什么、为什么报课
之前做过大半年的 Python 大数据 ETL 开发,后来去了某 ICT 大厂做了一年多的 Java 螺丝钉。目前还在 GAP 转型阶段。
那我为什么会对 AI 大模型感兴趣,并且愿意投入精力、时间、金钱在这个方向呢?巴菲特曾说过,滚雪球要找到那条“又湿又长”的道,我觉得大模型赛道就是。吴恩达也说过 AI 在未来社会会像电力一样存在。曾经需要多少电力工程师,未来就会需要多少 AI 工程师,人才缺口很大。至于为什么报名这个课,主要是因为自己对 OpenAI ChatGPT 等一系列 LLM 比较感兴趣,想了解其背后机理,也是为了系统地学习一下大模型相关开发方法。比起自己学,一群人一起学可能更容易坚持。买之前也问了销售,课程是有项目作业安排的,觉得任务导向的学习效果会更好。
课程收获
首先是学习了大模型的历史与起源,有了一些框架和感性的认识。申请了 OpenAI 的 api-key,接着学习一些比较具体的方法比如词嵌入、OpenAI 的 Embeddings。然后实操了 OpenAI 的 Chat Completion 和 Text Completion 两种 API。
在 OpenAI-translator 项目的商业分析、设计、开发迭代中,熟悉了 Gradio 可视化框架和 LangChain 的使用,从命令行启动到有可视化界面、提供 API 服务。在销售机器人实战项目中,学会了使用 Chroma 向量数据库存储进行 QA Retrieval 的方法。
最后对国产的 GLM 模型有了了解,并掌握了本地部署模型进行调用推理的方法。
一些评价与小建议
彭老师的课程品质是蛮高的,PPT 讲义带有严谨学术的风格,录制的视频也很好。课程设计方面,理论与代码实践并行。班主任也很称职,经常会统计各个同学的进度做成图片在群里“晾晒”。
一点小建议是,日常开发遇到问题时,目前课程采用的是在微信群中@助教来解决。有些问题在消息的洪流中就会被刷走了,无法保证会被闭环解决。课程中一些共性的问题也会被重复问到,之前的解答消息无法被有效复用。而且要在一百多人的群里发消息,有些同学可能会觉得自己的问题会不会太简单而不好意思提问。这一点觉得可以借鉴另一个慕课平台慕课网的问答专区,或者直接用一个 Github repo 的 Issue 来问答也可以。