大数据开发如何入门?
如果你百度下,知乎下,你会发现很多答案?那么应该采用那个答案呢?大数据开发的最优学习路径究竟如何呢?
其实这不仅仅是大数据开发从业人员的问题,而是对任何希望进入某一新领域的技术人员来说都会面临这个挑战?因为目前是一个信息过度的时代,理论上互联网上包含了人类以来的所有知识,浩如烟海。
但是这个问题对于大数据技术人员尤甚,因为大数据相关的技术可以说是蓬勃发展,百花齐放,对于初入者来说,一个一个响亮的名字,一个一个眼花缭乱的框架,之前刚熟悉了解了一个,马上很快又一个名字跳出来,正如白居易的《钱塘湖春行》所言,真的是“乱花渐欲迷人眼”。
这种现状是由于各种原因引起的,如社区的、商业的乃至私人的各种原因。
那么大数据从业者如何面对呢?初学者如何入门呢?初学者如何提取互联网上的信息为我所用呢? 技术的深度和广度如何把握呢? 深入到何种程度,涉猎到何种范围?
这是一个非常有意思的话题,个人在这里分享自己的学习经验和思考,供大家参考,也请大家多讨论交流。
个人认为,进入一个新技术领域包含大数据的入门:
第一、 要快速找到该领域的知识图谱
这里指的是真正的知识图谱,就是这个领域的知识大图;有了它就能按图索骥,有所学、有所不学,有所深入,有所了解,对于大数据来说,这个知识大图就是数据的整个大图;
第二、 在数据大图中找到你的锚点和定位
比如大数据这个领域,从角色划分来说分为:数据平台开发工程师、大数据开发工程师、数据分析师、算法工程师,从流程划分又分为数据采集传输、数据处理(离线处理、流式处理)、数据存储、数据应用(统计分析、数据挖掘、机器学习、深度学习等),每种角色、每个流程,对于大数据的具体技术掌握程度和侧重点完全不同(在真正的大数据项目和部门中,实际是由完全不同的团队来承担的),所以找到你的角色和定位才能有所侧重,也才能决定具体技术的深入程度;
第三、 深度挖掘和投入
有了第一和第二点,你就真正找到了你的锚点,再结合工作中涉及相关技术的内容和频次以及个人对未来的技术发展规划,具体深入的有关技术的各个领域,深度挖掘某项技术,由点及面,建立你大数据技能和职业生涯的的坚实基础。
对于技术人员来说,你的时间和精力花在什么地方,你就会成为什么样的人!人的时间和精力是有限的,所以请珍惜你的时间和精力分配,对于重点技术要重兵投入,对于其他技术要区分开来,有所涉猎,有所了解。
以上是我个人对于大数据和大数据开发入门的一些浅显认识和经验。大家有什么思考、经验、想法、问题,请大家聊一聊啊,精彩和走心的讨论有机会获得我最新出版一本大数据开发书籍《离线和实时大数据开发实战》的实物奖品哦(限量5本)!
顺便PR下,《离线和实时大数据开发实战》(机械工业出版社)这本书就是给大数据开发初学者和中级人员撰写的,这里你能找到数据的大图、数据的离线和实时架构、针对大数据开发这个锚点应该重点掌握的各种数据技术和理论的深入探讨,当然也包含了个人对于数据开发技术未来发展的认识。
个人觉得这可能是目前市场上第一本系统化讲述、同时又从项目实践角度出发,对数据开发的各种技术重点探讨的大数据书籍。