数据收集。方法、定义、类型和工具

871 阅读18分钟

DZone>大数据专区>数据收集。方法、定义、类型和工具

数据收集。方法、定义、类型和工具

获得大数据并拥有足够的计算设施来有效地处理和分析大数据,通常会有更大的市场份额,并产生更多的收入。

Anastasiia Komendantova user avatar 通过

阿纳斯塔西娅-科曼托娃

-

5月。18, 22 - 大数据区 -评论

喜欢 (1)

评论

保存

鸣叫

2.52K浏览次数

加入DZone社区,获得完整的会员体验。

免费加入

获取信息给了一个独特的机会来更好地了解客户的兴趣和需求,甚至超越他们的期望。因此,这自然使得数据收集变得非常迫切,这是任何决策过程的第一步,也是最关键的一步。但在深入探讨这个话题之前,让我们先从一些基本定义开始。

什么是数据收集?

数据收集就是收集数据;它是为研究目的而进一步测量、处理、评估和分析。它是在既定的、经过验证的技术帮助下进行的,这使得回答研究问题、测试假设和评估最终结果成为可能。数据收集的主要目标是获得可靠的信息来源,为进一步分析提供数据,使数据驱动的决策成为可能。

收集的数据类型

收集的数据有两种主要类型。

  • 定性数据涉及的是无法计算的描述性信息,不通过数值表达。
  • 定量数据,表示可以计算的信息
  • 所选择的数据收集方法取决于主题和需要评估的信息是什么。

定性数据收集方法

当需要回答 "为什么?"而不是 "有多少/多少?"的问题时,定性数据收集方法就会进入人们的视线。这种类型的数据不那么具体,而且比定量数据更难衡量,因为它通常包含对某个特定主题的描述和意见。允许获取定性数据的方法包括访谈、观察、产品评论、对开放式问题的回答,以及其他。

定量数据的收集方法

定量数据是建立在数字、价值和数量之上的。它比定性数据更具体,并且可以很容易地被测量。这种类型的数据可以在不同的算法和数据管理平台(DMP)的帮助下收集,这些平台可以计算出可测量的参数,如购买了特定产品或离开购物车页面的用户数量,用户在网站上花费了多少时间,他们滚动了多远,等等。定量数据,作为数字,是一个完美的分析基础,因为它是客观和可靠的。数字不会说谎--它们能让你更好地了解你的受众,从而获得洞察力。

数据收集的重要性

现代世界正逐渐向数字空间发展,数据围绕着我们。那些学习如何使用它的人发现自己比那些在其他概念上建立他们的假设的人处于更有利的地位。此外,企业投入更多的资源,在后大环境下从数据收集和分析中获益。COVID-19强调,在数字时代,未被开发的数据可以提高复原力。在2022年及以后,该倡议仍将是企业重新思考文化和技术方面的优先事项。了解数据收集的重要性是有益的,因为有以下原因。

  • 数据驱动的决策对企业战略发展更有效。
  • 获取数据可以让我们在早期阶段发现问题。
  • 数据有助于在实施假设之前证明其正确与否。
  • 有数据支持的论点要准确得多。
  • 快速获取有组织的数据有助于节省时间。

这些只是有效数据管理的主要优势。还有很多领域可以通过数据收集来改善。

如何收集数据

数据可以在不同方法的帮助下收集。每种方法都有其特殊性。但无论选择哪种方法,数据收集者都要遵循五个基本阶段。

确定要收集什么信息

任何数据收集过程都是从了解应该收集什么类型的数据、涵盖什么主题、将使用什么来源、以及需要多少信息量开始的。这些问题的答案是根据之前设定的目标而给出的。例如,可能有必要收集某个网站上最受欢迎的内容的数据,这些内容是上个星期在网上做了特定动作的特定年龄段的访问者。

为收集数据的过程确立一个时间框架

数据收集的第二个阶段是设定其时间框架,因为不同的研究目标需要不同的评估期。例如,客户的金融行为通常需要更多的时间进行数据收集和评估。同时,一些特定的任务可能在时间上比较有限--特别是在数据很快就会过时的情况下。

确定将使用哪种数据收集的方法

数据收集方法是整个过程的核心。为了做出正确的选择,你必须考虑在研究结束时你需要完成什么,将收集和评估什么数据,以及时间框架有多长。此外,参数的数量可能是巨大的,使其配置耗费时间。

收集相关数据

当所有的数据收集过程方面都确定后,你就可以开始实施战略了。DMP是一个相当有用的工具,用于存储和组织收集的数据。然而,为了成功,你必须清楚地了解你在做什么,并遵循计划,同时在必要时进行修正。

启动数据分析和得出结论

一旦收集了数据,数据分析和组织阶段就开始了。这是一个关键的步骤,将原始信息转化为有用和有价值的见解--企业可以利用这些见解来加强他们的运营流程、营销策略和企业决策。大量的网络分析工具可以帮助你完成这个阶段。在过去十年中,当企业进行数字化转型时,数据的作用已经增加。数字化的步伐不会放缓,敦促企业保持对最近数字景观趋势的跟踪。以下是即将到来的一年中需要考虑的三个关键趋势。

供应链

这场大流行暴露了国家和国际中断的供应链的许多弱点。它导致了供应延误和生产放缓。因此,供应链分析成为任何非自给自足的商业过程中的一个基本要素。整个情况将导致供应商的多样化和多层次供应链的出现。

数据价值

企业管理层认识到了数据商业化的机会。那些设法成功的人更有可能吸引投资者。因此,企业数据库正在成为一种有价值的数字资产,在并购过程中发挥着非常重要的作用。

公司通过出售数据来创造收入,并将其整合到产品和服务中,在内部使用数据来创造价值流,在外部则为客户提供更多相关信息。

可持续性

环境、社会和治理(ESG)问题最近一直在上升,而且这一趋势可能会在企业领导层中获得进展。此外,客户开始更加关注公司创造了多少钱,以及通过什么方式获得的:无温室气体排放、无废物的生产过程、原料的零损失是效率估算的一些因素。

数据收集中的抽样方法

公司的目标受众可能由代表不同群体的许多客户组成。要解决每一个人的问题似乎是不可能的。抽样调查有助于确定反映整个群体所有主要特征的受众的特定子群体。这个过程可能很复杂,但一些统计方法可以确保一个子群体以最准确的方式代表整个群体。

这些抽样方法包括以下几种。

随机抽样

随机抽样是在没有任何模式或系统的情况下挑选受访者的过程。乍一看,这种方法似乎不科学,但它可能相当有价值,因为它只是摆脱了那些可能降低研究有效性的因素。不过,随机性还是需要一些系统。例如,如果我们考虑一个受欢迎的城市,并开始挑选星期六下午在主要街道上行走的人,我们将得到一个多样化的游客截面。但当地居民不会出现,因为他们通常倾向于避开这些地区,特别是在周末。计算机随机器可以成为解决这个问题的一个办法。

系统性抽样

系统抽样是建立在一些旨在创造规律性的规则之上的。例如,观察每五个顾客就会把订单交给流程。然而,在某些情况下,系统抽样可能是一种相对死板的方法,因为数据可能是不相关的,例如,当每五个顾客都变成了16岁以下的青少年。

便利抽样

方便抽样被认为是最简单的方法,但同时也是最不可靠的。因此,它适用于从最容易到达的地方收集的数据。一个例子是向一个部门的员工而不是整个公司的员工发送问卷,这可能很耗费精力。但在某些情况下,这种类型的抽样可能是有效的--例如,有必要获得关于产品第一印象的数据,而受访者和他们的多样性是不重要的。

集群抽样

集群抽样是针对子群体而不是个人的。集群通常是事先定义的;例如,它们可以包括参与某些研究的地区或区域。集群抽样有两种类型:单阶段(当集群的所有代表都包括在内时)和两阶段(当只选择特定的代表时)。这种方法的主要优点是,聚类已经明确定义,你不必自己去定义它。唯一的问题是,如果这个群组不能准确地代表整个社区,就可能出现问题。

分层抽样

分层抽样适用于具有类似特征的人群中的子群。例如,受访者可以按性别、年龄、教育和其他参数划分。当它们被确定后,偏见的风险就会减少。但当特征不明确时,收集到的数据可能不是很准确。集群抽样和分层抽样的主要区别在于,只有集群抽样在研究过程中包括特定的群组。相反,分层抽样只考虑每个群体中随机出现的个体。

数据收集工具。它是什么?

数据收集工具是一种软件、算法或其他一些收集数据的工具。这个过程的成功是由选择最合适的工具来确定的。这些工具是基于不同的数据收集方法。例如,有些包括有关客户偏好的直接问题,而另一些则监测客户在网页上做什么,或者他们如何与不同的在线或离线元素互动。

用于学术、意见和产品研究的最佳数据收集工具

文章的以下部分描述了学术、意见和产品研究的最佳数据收集方法。请进一步阅读以了解更多信息。

采访

访谈是两个人之间的个人对话,为研究目的收集信息。访谈可以是结构性的,半结构性的,或者非结构性的。

  • 结构化访谈只是口头问卷,这使得它们有点肤浅,而且不是很费时间。
  • 半结构性访谈包含几个关键问题,以更深入的方式涵盖研究主题。
  • 非结构性访谈是深入的,旨在尽可能多地收集有关该主题的信息。
  • 当涉及到沉浸的程度和时间消耗时,访谈提供了灵活性,但它们的组织费用可能相当昂贵。

所有的录音机,包括口述录音机和数码相机,都可以用来组织访谈。

问卷调查

问卷是一种数据收集工具,由一系列的问题组成,可以涵盖不同的主题,由目标受众回答。所有的问题都可以分为三大类:固定-替代性问题、尺度问题和开放式问题。问题的选择是由研究的目的和范围决定的。问卷是收集数据集的一种简单而经济的方法,有各种数据表示的选择。同时,受访者可能会在问卷中间失去兴趣或留下一些问题不回答。

数据报告

数据报告过程是基于收集信息并提交进一步分析。这种方法的关键因素是使用可靠的数据源,因为不准确的信息会导致错误的决定。尽管数据报告可以帮助决策,但结果可能有偏差,因为信息来源可能以主观的方式呈现,或者受访者可能没有给出详细的答案。数据报告的主要信息来源包括非政府组织、报纸和网站文章,甚至医院记录。

现有数据

这种方法将新的信息引入到现有数据中。从档案或研究期刊等现有来源获取数据可以是一个很好的例子。这种方法的主要优点是数据的准确性和它的易得性。但是,在数据评估和理解方面可能会出现一些问题。

观察法

从这种方法的名称可以看出,数据是通过对研究对象的观察收集的。观察者可以是观察者,也可以是参与者,或者两者都是。这种方法很容易组织,实际上到处都可以应用,而且被调查者事后不需要创建任何报告。另一方面,观察的缺点包括不可预知的有效性和昂贵的组织费用。遵守的主要工具包括检查表和直接观察。

焦点小组

当需要收集有关受访者的感受和意见的数据时,这种方法适用于对对象的定性分析。焦点小组提供开放式的问题,以获得反馈。这种方法具有成本效益,所收集的数据通常非常详细。但是可能会出现偏见,而且结果一般是不可控的。召集一个具有包容性的受访者群体的困难也是一个常见的事情。从焦点小组获得答案的最好工具是以下几种。

  • 双向的。在这种情况下,一个焦点小组回答问题,而第二个小组听他们的问题,并提出自己对问题的看法,以便在之后发起进一步的讨论。
  • 决斗式主持人。两个意见相反的主持人参与焦点小组内的讨论,以促进新的想法和观点。

组合式研究

这种数据收集方法应用了创新的方法,要求同时邀请个人和团体来收集相关的反应。当有必要通过其他方法收集敏感主题的定性数据时,就会使用这种研究。组合研究鼓励参与者在更深层次上进行合作,并丰富数据。但与上述所有的方法相比,它的成本更高,花费的时间也更多。

数据收集的最佳模板

不同的模板可以应用于各种客户调查。让我们来看看最佳做法。

客户满意度

评估客户满意度的模板可以收集诸如最受欢迎的产品或服务是什么、客户是否会推荐它、客户服务水平是否足够好等方面的数据。

人口统计学特征

评估一些顾客人口统计学特征的模板可以获得诸如性别、年龄范围和社会群体的细分信息。受访者有时也会被要求分享他们的个人信息或政治观点。

反馈意见

这个模板对于收集有关购买产品或服务细节的反馈是必要的。此外,它有助于评估产品本身和交付的满意程度,以及其他重要方面。

在线调查问卷

这些模板用于收集有关受访者的大量数据,如性别、年龄、种族、教育背景等。

收集定性数据的最佳方法

收集定性数据的最佳方法是组合研究,它依赖于受访者的感受、观点和信仰。其主要原因是,这种方法依赖于访谈和焦点小组,对于无法用数字衡量的敏感数据来说,这种方法最有用。

收集定量数据的最佳方法

收集定量数据的最佳方法是问卷调查,因为它可以在有大量受访者参与的情况下具有成本效益。收集到的数据集可能是大量的,但统一的模板使它们易于组织、可视化和分析。问卷的另一个好处是,它可以将当前数据与之前收集的信息进行比较。

数据收集和线索生成

数据收集和线索生成是紧密相连的。根据线索生成的定义,它是将客户对产品或服务的兴趣转化为销售的过程。这个概念意味着通过营销中的特定网络表格收集个人联系数据(一个 "线索")。线索是一个公司活动的基础。

信息是在不同手段的帮助下产生的,数据收集是其中之一。然而,随着越来越多的销售在互联网上完成,在线线索生成已成为最有效的方法之一。

公司通过使用不同的在线表格或让访问者在网站上注册来收集个人信息,如姓名、电子邮件地址和偏好。然后,人们被提供一些有价值的东西来换取这些数据,如高级账户或折扣。因此,有必要为访问者提供积极的客户体验,使他们更顺利地进一步转化为真正的客户。

有门槛的内容是另一个使获取个人信息更容易的工具。它只有在访客留下一些联系信息时才会展示。如果没有内容门,用户可以在没有任何注册事件通知的情况下浏览网页,这将对销售产生不利影响。

在可下载内容的在线表格的帮助下,一个可控的线索生成过程是提高线索质量的有效途径。但在这种情况下,出现了获得不准确数据的风险,因为现在很多人都有单独的广告和垃圾邮件的电子邮件。

为了应对这种情况,公司可以使用CAPTCHA进行电子邮件验证,或者使用互联网协议限制来限制来自特定IP地址的可用下载数量。

公司还可以将社交媒体和搜索引擎优化(SEO)引入其营销战略,以产生更多的线索。社交媒体有助于更有效地与潜在和现有客户接触,而搜索引擎优化将有助于在搜索引擎结果页面(SERP)推广网站。结合以上描述的方法是产生线索的最有效方法。

数据收集 数据(计算)

经Anastasiia Komendantova许可发表于DZone。点击这里查看原文。

DZone贡献者所表达的观点属于他们自己。

在DZone上受欢迎


评论

大数据 合作伙伴资源