背景
前一段时间我参加了一个面试,具体就是做经济数据分析这样子,当时其实就是抱着试一试的态度去面试了,因为我还是一个大学生在学校虽然自己学习了一些数据分析的知识和技能,但是没有去做过具体的数据分析的项目或者工作。我把我的简历发过去和HR稍微聊了几句,确定了面试的时间,然后到了面试的时候那位HR姐姐好像很忙在车上就和我匆匆聊了几句,大概的意思是:你的简历我们觉得还是可以的,是符合我们的要求的,接着告诉我要做一个笔试,然后才能做最后决定。过了几天,他们发给我一份数据,要求根据这些数据做出一个行业的趋势判断,最后给一段结论。说实话我觉得做出一个趋势判断并不觉得很难,但是这份数据确实对于当时的我来说有点震惊,下面是我做的结果:
我当时是用fine bi做的这个图,但是结果没过。他们选择了另一个人,我并没有觉得不满或者怎么样,因为我知道当时的我确实实力不够,我抱着学习的态度像HR要了他的笔试结果,下面是他的结果:
他的报告有5页,这只是一部分。OK,我们来比较一下优缺点,首先我的可视化比他的好,这也是HR承认的一点,我用到是Fine Bi而他我猜应该就是用matplotlib画的,当然是有差距的。然后就到他了,他的分析思路更加有因果逻辑,井井有条,符合经济学逻辑,而我的呢其实没什么逻辑或者说我表现出来的就是东拼一块西凑一点,这是我确实不如人家的地方,还有一点是他这样的一份报告就很规范,而我只是画了张图没有想着去严谨的表达。总结来说,第一没有认真对待,人家写了5页的报告,你就画了一张图,这算什么认真,这不就被比下去了;第二分析的逻辑不到位,图与图之间也没有关联性,只做到了数据展示而不是有效展示。
基于以上的判断分析,我决定再做一次面试题取长补短,也给自己这个寒假所学所得有一个展示的地方,给自己一个交代。
分析
这次我选择了人工智能行业,主要分析沪深上市的跟人工智能有关的公司,我知道这种公司可能科创板比较多,但是没办法面试给的数据没有科创板的。
一.通过主营产品筛选的跟人工智能有关的公司:
二.人工智能行业发展趋势解读
- 从市场规模和营业基础看
- 从营业收入和利润来粗略判断 通过python将上述“人工智能”各公司的利润表中的营业总收入和利润总额项目合并,并画出二Y图。
从上图我们可以看出这些人工智能公司在2020年至2022年一季度营业收入稳步提高,每个季度同比收入都是提高的,每年的利润额也在12亿左右。以此推断人工智能产业营业基础稳定,并且市场获利规模逐步提高。
- 从技术的进步看
- 从研发投入来粗略判断 技术的进步离不开研发的投入,所以我们选择将上述“人工智能”各公司的利润表中的‘研发费用’合并,并画出柱状图。
从上图我们可以看到这些人工智能公司每年的研发费用都在40亿以上,并且还在不断提高投入。所以AI的发展是必然的,技术的进步是不会停止的,我们有理由相信他们会给我们带来惊喜。
- 从政策法规看
- 从中国政府网的政策发布粗略判断
近几年在人工智能方面政府不断出政策在支持,给各种优惠政策和方向指导,力求在全球人工智能领域取得领先地位,从上图我们可以看出在2017年和2022年给予了更大的支持。
- 从竞争格局看
- 在AI领域目前最强的两个国家应该就是美国和中国了,AI做为一个未来产业可以说掌握AI等于掌握未来。在目前中美对抗的大背景下,我们来看看两国在AI的竞争格局:两国的人工智能产业具有不同的优势。在中国,政府的支持、数据的丰富和劳动力成本相对较低是其人工智能产业的优势。中国政府正在大力支持人工智能产业,投入巨额资金用于人才培养、研发和推广应用。此外,中国有庞大的互联网用户和海量的数据,这为人工智能算法的训练和应用提供了优越的条件。中国的劳动力成本相对较低,这降低了企业在研发、生产和应用人工智能技术方面的成本。在美国,创新能力、企业文化和技术人才是其人工智能产业的优势。美国在人工智能领域具有世界领先的技术和研发实力,同时,美国企业文化鼓励创新和风险投资,这为新兴企业和初创公司提供了更好的发展机会。此外,美国拥有全球最优秀的技术人才和研究人员,这为其在人工智能领域的研发和创新提供了强大的支持。
因此我们应该正视差距同时了解优劣,才能更好的在竞争中获胜。
- 从消费者需求看
- 我们可以从消费者对AI的态度看出消费者需求,最直观的例子就是最近的ChatGPT了,2个月一个亿的用户,重新燃起人们对AI的好奇和讨论,也许我们会听到人们在担心这个担心那个,对于AI有一定的忧虑和对抗 ,但是大部分人是接纳和思考如何发挥他最大的作用或者说如何帮助自己。消费者的热情是汹涌的是渴望的。
总结
总的来说,我们可以将上面的分析总结为:市场稳步扩大,投入还在加码,政策给力支持,竞争仍在加剧,需求还未满足。在浩瀚的AI世界里我们敬畏并不断探索,稳步推进,不断加码,并期待曙光。
后记
这次重做也让我认识到了很多不足,比如我本来是想用seaborn画图的,但是后来要画的时候才发现我对数据的把握并不完整,我不知道我之前画的seaborn图的数据是怎么样的才画出那样的图,所以经过这次我会重新去看看我之前的数据Excel表格里是什么样的数据排列,第二个就是我怎么感觉这次更烂了呢,唉,对自己有点失望,我希望我的可视化可以更好,分析逻辑可以更清晰,第三就是本来寒假学了SPSS想用一下也没用上,有点可惜,第四我发现我整理数据的时间花的有点多,所以我重新把数据整理部分的东西汇总了一下,写了两段程序分别是自动化筛选Excel和自动化Excel数据的提取和合并,我把他们放到下面GitHub上了,有兴趣可以看看。
总的来说,寒假结束了。当我敲下这些字的时候我已经回到学校了,回想这个漫长的寒假我还是收获良多,试着去面试,在B站学SPSS,Python,做项目,做Kaggle竞赛,加入开源社区,成为彤学,开始认真写博客,开始思考开始准备开始规划,愿你我都能在这没有疫情的新年里,肆意芬芳。
GITHUB地址:HeteroCat-blog/Excel自动化处理 at main · HeteroCat/HeteroCat-blog (github.com)