数据分析主要分成三大部分:
- 数据采集 它是我们的原材料,也是最“接地气”的部分,因为任何分析都要有数据源。
- 数据挖掘 它可以说是最“高大上”的部分,也是整个商业价值所在。之所以要进行数据分析,就是要找到其中的规律,来指导我们的业务。因此数据挖掘的核心是挖掘数据的商业价值,也就是我们所谈的商业智能 BI。
- 数据可视化 它可以说是数据领域中万金油的技能,可以让我们直观地了解到数据分析的结果。
数据挖掘的6 大部分
-
商业理解 数据挖掘不是我们的目的,我们的目的是更好地帮助业务,所以第一步我们要从商业的角度理解项目需求,在这个基础上,再对数据挖掘的目标进行定义。
-
数据理解 尝试收集部分数据,然后对数据进行探索,包括数据描述、数据质量验证等。这有助于你对收集的数据有个初步的认知。
-
数据准备 开始收集数据,对数据进行清洗、数据集成等操作,完成数据挖掘前的准备工作。
-
模型建立 选择和应用各种数据挖掘模型,并进行优化,以便得到更好的分类结果。
-
模型评估 对模型进行评估,并检查构建模型的每个步骤,确认模型是否实现了预定的商业目标。
-
上线发布 模型的作用是从数据中找到金矿,也就是我们所说的“知识”,获得的知识需要转化成用户可以使用的方式,呈现的形式可以是一份报告,也可以是实现一个比较复杂的、可重复的数据挖掘过程。数据挖掘结果如果是日常运营的一部分,那么后续的监控和维护就会变得重要。