「时光不负,创作不停,本文正在参加2021年终总结征文大赛」
前言
稍纵即逝,转眼间2021己进入尾声,这是一个普通也不普通的一年。普通在于和往年相比,也没有什么不同之处,无非是忙碌工作,好好干饭;不普通在于这一年仍然有那么多令人难以忘怀的事情,值得我去铭记。
读书
整体来说,今年读的书籍不太多,而且大多是一些非技术类书籍。
还记得在抖音上面看到罗翔老师聊过关于读书的小视频,这让我对读书有了新的认识。他说,读书不是为了炫耀,读书,只是为了培养你的智慧。我们很多时候好读书,不求甚解。我们并不需要记住那些精彩的段落,我们只需要去读,慢慢地就成为了我们的养分。我们需要与人类伟大的灵魂去对话。
我很认同的一句话:读书是打开心灵的窗户,争取明年能够读够20本书。
对应的读书清单如下:
- 硅谷钢铁侠
- 如何阅读一本书
- Kubernetes In Action
- 贝蒂的色彩
- 关键对话
- 人人都是产品经理
- Python机器学习(完成度:50%)
- 低风险创业
- 价值-张磊
- 中国云原生AI中台白皮书
- Redis实战(完成度:20%)
- 百度大脑智能对话引擎白皮书
写作
今年一共完成57篇博客撰写,其中技术类共55篇,非技术类共2篇。总的来说,对今年的博文创作还是挺满意的,当然得感谢掘金,今年7月份发现了掘金这个技术社区,然后在掘金薅过不少的羊毛,具体如下:
- 参加8月更文挑战,共完成30篇,通过第四关。
- 参加”程序员必备小知识“创作活动,共完成16篇,达到砖石矿工。
- 参加11月更文挑战,共完成30篇,通过第四关。
通过参加掘金的活动,也促使了我去不断的学习一些新知识。
对应的写作清单如下:
技术类-55
人工智能工程化(MLOps)-10
- 开源机器学习工作流Ploomber
- 浅析数据工作流Prefect
- 浅析机器学习工作流Kubflow Pipelines
- 浅析自动机器学习(AutoML)工具NNI
- 人工智能系统(一):概述
- 人工智能系统(二):技术栈
- 【翻译】开源工作流工具调查(MLOps)
- 【翻译】可重复可复现的机器学习在生产中的12个要素
- 【翻译】正向数据工程和逆向数据工程(Prefect工作流)
- 【翻译】全球的MLOps和ML工具概览
人工智能实践-21
- 十分钟掌握分类算法的评估指标
- 十分钟掌握回归算法的评估指标
- 十分钟掌握聚类算法的评估指标
- sklearn中的文本特征提取方法
- 使用sklearn进行特征选择
- 机器学习可视化利器-Yellowbrick
- 数据缺失值可视化利器-missingno
- 浅析sklearn中的数据预处理方法
- 浅析命名实体识别(NER)的三种序列标注方法
- 多标签分类场景下的模型评估指标
- sklearn中多标签分类场景下的常见的模型评估指标
- 浅述几种文本和图像数据增强的方法
- 浅述解决数据不平衡的几种方案
- 浅析sklearn中的Pipeline
- 对离散特征进行数据预处理:独热编码、标签编码及二值化
- sklearn中针对不同分类场景模型评估指标函数概述
- 浅析特征数据离散化的几种方法
- sklearn中分类模型评估指标(一):准确率、Top准确率、平衡准确率
- sklearn中分类模型评估指标(二):Kappa系数、混淆矩阵、分类指标报告、汉明损失
- sklearn中分类模型评估指标(三):精确率、召回率、F值
- sklearn中分类模型评估指标(四):Jaccard相似系数、铰链损失、对数损失
Python后端技术实践-4
容器与云技术实践-7
- 浅析Kubernetes控制器
- Docker资源(CPU/内存/磁盘IO/GPU)限制与分配指南
- 纯干货!构建Dockfile镜像的十三个最佳实践点
- 纯干货!如何优雅的精简Docker镜像?
- Docker常用命令大全(持续更新)
- 纯干货!Docker Dockerfile指令大全
- Kubernetes常用命令大全(持续更新)
中间件技术-5
主要涉及消息队列(kafka)、搜索引擎(elasticsearch)、数据库(mysql)、缓存(redis)这几块的内容。
- 通过ECK在Kubernetes上部署ElasticSearch如何添加自定义用户名和密码?
- 图解缓存击穿、缓存穿透、缓存雪崩的区别
- 浅述Elasticsearch开发规范指南(持续更新)
- MySQL调优指南(持续更新)
- MySQL数据库SQL使用规范
数学与计算机科学-5
- 浅谈P、NP、NP-Complate和NP-Hard问题
- 浅析Linux中的五种IO模型
- 一文读懂计算机系统中常见的带宽
- 浅析磁盘常见的性能指标及观测IO性能指标的命令
- 一分钟明白IO密集型与CPU密集型的区别
其他-3
- 执行jobs命令查看不到任务的原因终于找到了
- 解决在Docker或者Kubernetes中使用PyTorch训练深度学习模型共享内存不足的问题
- 修改Git提交历史中的author,email和name等信息
非技术类-2
副业搞钱
工作了几年之后,我越来越觉得打造副业十分有毕业。首先,它能够重构自己收入模式(从单一的工资收入变成多渠道收入),更好的应对潜在风险。其次,它能够接触不同的圈层,看到更多的未来可能性。同时,也能够给我们身体和精神带来更多积极的变化,带来跟多的自信。
目前的副业收入为理财收入和创作收入。
理财收入
理财收入主要是通过合理的购买基金,其实,从2016年毕业到现在,我一直有购买基金,只不过前期,买了就是放到哪里,也没有花太多的时间去研究(当然最开始也买的不多),直到,去年年底才开始研究基金,了解行业,了解基金经理的往期业绩,以及琢磨自己的投资策略,投资基金的心态也慢慢变得成熟了起来。
总的来说,今年基金的收益很一般,整体是没有跑赢GDP,但是比同期的沪深300要好一些,分析了一下具体原因,主要有以下两点:
- A股整个大环境都不甚理想(去年白酒、新能源、医疗等行业涨的太多,今年在消化高估值)。
- 今年六月份,大幅加仓购买了互联网,以为能够抄底,结果抄在了半山腰,购买的互联网基金整体亏损大约25%。
创作收入
创作收入目前都来源于知乎,目前主要是通过好物推荐和知识付费来获得创作收入,这一块的收入今年还是蛮意外的,因为之前没想到自己还能够通过创作来挣钱。虽然挣得不多,但是还是比较开心。
调研
去年,由于部门组织架构调整,我从之前做智能客服变成了做AI中台。整个技术栈都发生了变化,无论是docker、kubernete还是ai,都不是我擅长的领域。其实不光是我,整个部门对这一块技术栈的了解都比较少。因此,引入相关的一些技术,我们都需要去做相应的技术调研。除此之外,像AI中台这类产品,完全靠产品经理来驱动产品的设计很难把它做好,因此,我们也需要以技术的角度来驱动产品设计。所以,我们也会做一些产品调研和竞品分析。
技术调研
今年主要做了两个方向的技术调研,一是机器学习流水线,二是数据版本管理。这两块都属于MLOps中的其中一环。
对应的技术调研清单如下:
机器学习流水线
- Airflow
- Prefect
- ZenML
- Kubenetes Pipeline
- Ploomber
数据版本管理
- DVC
- Git LFS
产品调研
今年主要做了智能对话引擎和AI中台(NLP平台、OCR平台)的产品调研。
对应的产品调研清单如下:
- 百度UNIT
- 百度EasyDL
- 阿里NLP平台
结语
总的来说,这一年学到了很多,承蒙时光不弃,成长不期而遇,2022如期而至。加油吧,干饭人!上天终将会眷顾那些在暴风雨中砥砺前行的人。
突然想起整理了一下从大学到现在学过的一些技术(当然还有一些影响不是很深刻的没在里面),学的真够杂,长路漫漫,与君共勉。
未来展望
其实,以前的年终总结,我总会喜欢给来年定打太多的目标,后面发现真的计划赶不上变化,回过头来发现很多都没有实现。比如说,定一个一年需要读多少本书,后来发现其实真的没必要,我们更应该注重读书的质量,有多少知识成为了我们成长的养分,而不应该太关注读书的数量。因此,关于来年,我其实不太想给自己设置过多的限制,立所谓的Flag,人生是一场马拉松,不必在意一时的输赢与得失或成长,努力过好每一天就好(用心甘情愿的态度,过随遇而安的生活)。不乱于心,不困于情,不惧将来,不念过往,如此,安好。