你也想成为数据分析师么?数据分析师宝典拿走!

·  阅读 153

数据分析是 21 世纪最热门的工作之一。

但究竟什么是数据分析,数据分析师究竟在做什么?

在本文中,对数据分析进行了清晰的、以职业为中心的介绍。我将把数据分析师相关所有需要了解的知识分享给大家:

  1. 什么是数据分析?
  2. 数据分析师实际上是做什么的?
  3. 数据分析师遵循哪些任务和流程?
  4. 数据分析师需要哪些技能?
  5. 数据分析师使用哪些工具?
  6. 总结

1. 什么是数据分析?

以最简单的形式,数据分析是从无序信息中提取意义的过程

通过系统地探索数据的模式和关系,数据分析师寻求使用这些数据找到有用的见解。但是什么算作数据呢?

几乎任何你能想到的。

通常,数据是数字(定量数据),但是声音、图像、文字或其他任何可以以某种方式解释的东西也可以归类为数据(定性数据)。

分析师的工作始于所谓的“原始数据”。原始数据是无序的,而且没有上下文,基本上毫无意义。只有在混乱中恢复秩序后,我们才能从他们那里获得有用的信息。因此,收集、清理和组织数据都是数据分析过程的一部分。

更重要的是,有效的数据分析结合了许多技术来帮助这个过程。其中包括**统计、编程、可视化**等。幸运的是,为了简化流程,其中许多技术已实现自动化。有些甚至正在发展为自己的领域。但是,一名优秀的数据分析师至少会对它们有所了解。

为什么数据分析很重要?

数据分析之所以重要,有两个简单的原因。首先,它有助于决策。其次,它是基于证据的。将这两个属性结合起来,数据分析就成为一种强大的工具。根据经验信息做出决定(而不是依靠意见或“直觉”)是一种更科学的解决问题的方法。虽然这并不意味着数据分析总是 100% 准确,但它是迄今为止我们预测未来趋势和对过去事件得出结论的最佳工具。

数据分析在整个社会也有广泛的应用。在网上,经常会发现数据分析被吹捧为商业智能工具,例如预测未来销售或通知产品开发和营销支出。然而,数据分析远不止提高公司的底线。

2. 数据分析师实际上是做什么的?

现在我们知道了数据分析是什么,接下来让我们来看看数据分析师的角色实际上需要什么。

作为数据分析师,你有责任将原始数据转化为有意义的见解。在数据分析过程(将在下一节中介绍)之后,你将根据数据及其提供的见解解决特定问题或回答某些问题。然后,将获得这些见解并与关键利益相关者和决策者分享,他们可以相应地采取行动或规划未来。同时,数据分析师可能负责监督收集和存储数据的整体流程,以及制定数据质量指南。

衡量数据分析师日常实际工作的一个好方法是查看职位JD中通常列出的任务和职责。根据某招聘软件上发布的实际职位描述,以下是作为数据分析师的工作:

  • 开发和实施数据库和数据收集系统
  • 与管理层密切合作,确定关键指标和 KPI,并确定业务需求的优先级
  • 从主要或次要数据源收集数据
  • 过滤和清理数据
  • 识别、分析和解释复杂数据集中的趋势和模式
  • **可视化**并向主要利益相关者展示调查结果
  • 构建和自定义报告
  • 开发和维护仪表板
  • 创建和维护有关数据模型、度量和基础设施开发的文档

到目前为止,我们已经对数据分析师的工作进行了研究。现在让我们放大一些与数据分析过程相关的更具体的任务。

3. 数据分析师遵循哪些任务和流程?

作为数据分析师,你的工作是执行数据分析的每个步骤以识别和解决问题。随着职业发展,你可以选择专注于特定领域,例如**数据可视化**或数据工程。但是,作为初学者,学习整个过程很重要。

那么,数据分析师应该期望遵循的关键任务和流程是什么?虽然它不像直接一个接一个地执行任务那么简单,但主要任务包括:

  • 定义问题
  • 收集数据
  • 数据清洗
  • 进行分析
  • 交流结果

定义问题

首先,你需要定义你的目标。在某些方面,这是整个过程中最困难的部分。这是因为看似明显的问题可能并不总是触及问题的核心。

例如,假设你为一家想要增加收入的公司工作。高级管理层将通过推出一套新产品来实现这一目标。因此,需要花费大量时间和资源来分析要创建什么产品、将它们投放到哪个市场等等。然而,通过更多的前期探索,可能会发现公司现有的产品没有任何问题:只是销售流程不佳,导致客户满意度低,重复业务减少。有了这种洞察力,你可能会发现投资于销售培训会以更低的成本增加收入。

收集数据

一旦确定了问题,下一个任务就是找出最适合帮助你解决问题的数据。这可以是定量数据(例如营销数据)或定性数据(例如客户评论)。更具体地说,数据类型可以分为三类:第一方数据(由你或你的组织直接收集)、第二方数据(另一个组织的第一方数据)和第三方数据(聚合的来自第三方的众多来源)。

如果你还没有访问这些数据的权限,则必须制定收集它们的策略。这可能包括进行调查、社交媒体监控、网站分析、在线跟踪等。无论如何收集数据,一旦拥有触手可及的数据,就可以对其进行清理。

数据清洗

新收集的数据通常采用原始格式。这意味着它还存在错误等等。要使其进入适合分析的状态,数据需要清理。这涉及到各种工具和技术(例如自定义算法、通用软件和探索性分析)以使其进入更合适的状态。

数据清理任务包括删除错误、重复和异常值、消除不需要的数据、以更有用的方式构建数据、填补空白等。因此,数据清理被认为是一个迭代过程。收集和清理数据的组合过程有时称为数据整理。

进行分析

一旦你的数据集干净整洁,就可以进行分析了!数据分析有很多种类型,其中一部分挑战是确定哪种方法最适合手头的任务。为简单起见,我们将快速概述数据分析的四个主要类别。

第一个是描述性分析。这涉及总结(或描述)数据集的特征以更好地理解它。它通常不用于得出确切的结论,但它是决定如何进一步调查数据的有用的第一步。

接下来,诊断分析侧重于理解某事发生的原因(例如,通过探索数据集中值之间的相关性)。这有助于识别问题,通常用于数据分析的第一阶段,即定义问题。

最后,我们有预测分析(有助于根据过去的数据识别趋势)和规范分析(有助于决定未来的行动方案)。后者有时是使用机器学习技术进行的。

交流结果

进行了分析并得出了一些见解,最后一步就是将这些信息传达给最初委托他们的人。这通常涉及以某种方式可视化你的数据——例如下图「图源EasyV数据可视化」,创建图形和图表。它还可能涉及创建交互式仪表板、文档、报告或演示文稿。很容易忽略这一步的艺术性,但正确完成它非常重要。不仅需要正确解释你的发现,而且还需要以一种对非技术人员来说清晰的方式分享它们。这很重要,因为它确保任何决策都基于高质量、易于理解的见解。

4. 数据分析师需要哪些技能?

在某些方面,数据分析师需要的技能取决于他们的角色。

但是,在抓住第一个机会之前,有一组所有初学者数据分析师都需要的核心技能。我们可以将这些分为硬技能(或技术能力)和软技能(或有助于完成工作)。

数据分析师的技术技能

硬技能有时有一个学习曲线。数据分析师的关键硬技能包括:

  • 数学和统计学
  • **编程技能:**要创建或调整自动执行数据分析任务(如解析或重组大型数据集)的算法,编程知识的元素是不可避免的。Python 或 MATLAB 等脚本语言以及 R 和 SAS 等统计计算语言在数据分析中都很流行。
  • **数据库知识:**除了编程语言之外,还需要了解数据库仓库软件(例如 Hive)和分析引擎(例如 Spark)。还需要了解数据库查询语言,如 SQL。
  • **Excel 技能:**通常用于将原始数据转换为可读格式,或用于自动执行复杂计算,MS Excel 是任何数据分析师工具集的核心。
  • 可视化技能:数据分析的一个核心方面是使用图表和图形可视化数据的能力。这有助于我们识别模式、相关性和趋势,如EasyV等可视化工具

数据分析师的非技术技能

虽然软技能可以通过练习来磨练,但它们通常被认为是与生俱来的。需要具备以下方面的天赋:

  • **沟通:**沟通是任何工作的关键,尤其是在数据分析中。获得准确的见解是当务之急,但将这些有效地传达给更广泛的受众至关重要。
  • **批判性思维:**可以说是数据分析中最重要的技能,批判性思维是质疑你面前的事物以更好地理解它的能力。
  • 创造性解决问题

如果你是第一次涉足数据分析,请问问自己:这些技能是否适合你?如果没有,请不要担心,最重要的是对这个领域充满热情并愿意培养必要的技能。

5. 数据分析师使用哪些工具?

到目前为止,我们已经介绍了数据分析师所需的技能以及他们需要执行的高级流程和任务。作为初学者,这可能会让人感到有些不知所措。幸运的是,有大量的应用程序和软件可以帮助简化流程。

数据分析师常用的工具包括:

  • 微软Excel
  • Python
  • 数据可视化
  • 数据库和管理系统
  • SQL

用于数据分析的 MS Excel

任何数据分析师的必备工具是 MS Excel。Excel 允许您对数据进行排序,将其分解为更小的子集,并使用各种函数来更好地理解它。这些函数包括XLOOKUP和VLOOKUP等搜索函数、AVERAGE 函数和SUMIF函数。这些工具以及更多工具使 Excel 成为初学者和专家都非常宝贵的软件。

用于数据分析的 Python

通用编程语言 Python 已迅速成为数据分析师的首选编程工具。这部分是因为它的语法简单,学习起来又快又容易。Python 几乎可以用于数据分析过程的任何方面。

用于数据分析的 数据可视化平台

数据可视化作为让人们可以快速发现数据趋势,了解数据内容的手法,拥有众多可以选择的工具。通过图表的使用和UI设计介入,可以搭建业务看板,让数据灵动的展示在决策者的眼前。

例如下图通过EasyV数据可视化搭建的看板,通过柱状图、条形图、饼图的组合,可以快速了解业务信息,掌握业务趋势。

6. 总结

一旦掌握了所有这些技能,就可以灵活的应对数据分析师岗位的职责。无论你对电子商务、金融、医疗保健、政府、科学还是你选择的任何其他领域的数据分析感兴趣,该领域的一大优势就是其多功能性。有了一点经验,就可以涉足更广泛的数据科学领域,或者专注于数据工程、数据建模或机器学习等领域。

分类:
前端
分类:
前端