“「祷以恒切, 盼以喜乐,苦以坚忍,必有所得」”。
前言
也有段时间没有更新博客和文章了,主要是这几个月在学习机器学习方面的知识,这一部分的数学要求有点高,所以啃的比较艰难,很多时候都在补数学,技术能力有限,目前还没办法把这一部分知识输出成文章笔记了,说明自己还没融会贯通。
很可惜,上半年疫情在家办公,并没有把握好这一段难得的在家学习的时光。 下面总结一下今年的学习和工作
2020年总结
2020的学习情况
- Spark源码的学习
- 《Spark权威指南》
- Kafka实战(极客时间)
- Kafka源码(极客时间)
- Python入门
- 机器学习
- 数据结构与算法(极客时间)
- 深度学习
- 阿里天池的比赛
- Flink
- b站直播
Spark
spark源码主要是对三个大模块的源码理了一遍,深入了解spark的运行底层逻辑
《Spark权威指南》这本书比较入门,适合初学的时候看一遍了解整体,并且是使用Spark2的较新版本讲解的。
Kafka
Kafka的学习上,极客时间的这两门课都是挺不错的。
《Kafka实战》 我推荐有使用Kafka的小伙伴都去看一下。这一专栏的笔记已经完成80%了,整理完成后会发在掘金里。
《Kafka源码》 说实话有点难度,看的也是比较慢,来回反复的阅读。
python
python学习主要是为了机器学习方面的使用,因为有java的功底,学起来还是蛮快的,稍微了解了下语法,没有太深入。
机器学习&深度学习
这个几乎是下半年的重头戏了,从数学到基础机器学习算法,到深度学习的神经网络,以及推荐系统的相关算法。可以说是一步一个脚印,啃的很艰难了。
- ML
- LightGBM
- 协同过滤
- 拉格朗日乘子法
- 核函数(SVM,PCA,LDA)
- PCA、LDA 降维
- Xgboost/GBDT/决策树
- KNN
- K-means
- LR
- 随机森林
- FM排序
- SVM
- DL
- word2vec/transformer/bert/embedding
- wide&deep
- FFM/DeepFM
- dnn/cnn/rnn
阿里天池
公司上的项目业务有一点点的数据挖掘的需求,但是对于机器学习来说,是用不上的。所以我学习了机器学习的理论和代码之后,就在阿里天池上找了个新手赛练了一下手,从一开始的线性回归,到xgboost的baseline,到xgboost的参数调优,到神经网络,到特征工程调优后的神经网络。从毫无头绪东抄抄西抄抄,到对数据处理,特征工程处理有了一定的认识。看着自己的成绩一点一点的提高,最后挤进了前一百,还是蛮有成就感的。
写这篇文章时,已经变成了105名了
Flink
Flink属于大数据最热门的框架之一了,因为工作使用的是spark,所以对另一个流处理的Flink框架也是蛮感兴趣的,学习的视频是在b站上的尚硅谷2021最新Java版Flink,这套教学视频看完属于会用了,但是对底层的源码逻辑还是欠缺的。
作为一个大数据开发,不仅仅是只会spark就够了,多了解一下flink也是多多益善。对个人的提升,跳槽面试都有好处。
数据结构与算法
这个也是极客时间上的《数据结构与算法》专栏,讲的还是非常不错的,跟着学一遍能比较系统的学习数据结构与算法,而且学一遍不够,最好是跟着把课上的例子,课后的思考题也自己用代码写一遍。断断续续也做了一些笔记,剩下还有一部分在印象笔记中,还没整理为博客笔记。
比较可惜的是LeetCode的每日一题并没有坚持下来,断断续续才做了几十一百道题。
B站直播
年尾的时候在B站上开始做一个卑微的学习区小主播,主要就是直播我自己的学习画面,因为我发现这个直播学习能监督我更好的学习,少摸鱼。
毕竟用电脑学习的诱惑还是太多了,可以看看b站,刷刷综艺,驰骋一下召唤师峡谷。而如果直播学习的话,因为会能看到我的桌面显示,所以就不好摸鱼了,学习效率上也专心了很多。
12月的直播时长
与2019年的目标对比
回看2019年给2020年定的目标
Python的学习- 刷完LeetCode的easy和medium
- 设计模式的学习
spark源码的学习更加全面的了解公司的项目,尽量搞懂每一个模块的业务和技术栈- 计算机组成原理+操作系统+计算机网络
更广更精,不限于docker,netty,socket,linux shell,kafka,zk,ELK,数据库,nginx等
只能说,不及预期吧。个人反省还是上半年疫情期间,在家办公太舒服了,摸鱼太多了,没有抓紧时间学习,导致不少原定目标没有完成。2021加油吧!
2021目标
其实目前来说,现在公司的项目以及比较稳定了,所以很多新的需求大多上是业务的增删改查,对我个人的技术水平增长帮助不太大了,感觉在这家公司的天花板已经快要摸到了。
2021年我会在保持学习的前提下,会看一下外面的机会吧,是否有合适的,最主要是能提升自己的岗位。并且想尝试转岗算法岗,主要是推荐算法岗。如果有小伙伴有合适的岗位可以内推,可以评论DD一下我!
列一下2021年的目标吧:
- BI数仓学习
- zk源码、redis源码的学习
- 2-3个月一场阿里天池比赛
- 机器学习算法用python复现
- 刷完LeetCode的easy和medium!
- 能拿到一个满意的offer