【译】你如何知道你的数据是否足够好?

96 阅读4分钟

当然,可能有少数例外,但我们大多数从事数据工作的人都是为了使人们能够做出好的决定。我们采取了数以百万计的不同途径来实现一个共同的目标:每次都能更好地了解这个世界,一个小的(甚至是很小的)片段。Rama Ramakrishnan的 "从预测到行动 "系列将使我们达到这一目标的过程分解成有时很棘手的部分;最近的部分侧重于为我们要解决的问题组建正确的数据集这一关键步骤。(当你在这里的时候,可以重温一下第一部分)。)

照片:Diego GarcíaonUnsplash

界定要看的正确数据,然后创建一个流程,从中得出可操作的见解,这是凯特-加洛作为产品分析师的核心工作。与一些更常见的以数据为中心的工作描述相比,这个角色仍然鲜为人知,而凯特耐心地带领我们了解其内涵和外延。对她来说,产品分析师是一个与多个合作伙伴一起工作的人,是用户的代言人:这个人的作用是 "确保用户享受并从产品中获得价值",并通过对精心选择的指标进行深思熟虑的分析来做到这一点。

Rama和Kate的文章通过商业决策的角度来探讨数据有效性的话题,但要知道我们是否在看正确的数据--我们有足够的数据吗?它可靠吗?它是否准确地代表了这个世界?正如Aidan Peppin在他的第一篇TDS文章中写道,使观察到的现象变得可测量的过程需要多种形式的还原--"没有考虑到数据化的这种还原性是许多算法伤害和失败的根本原因"。对于艾丹来说,如果我们想避免这些最糟糕的危险,精心设计和关注我们在途中做出的选择都是必要的。

观察、收集、表示和利用数据的方法有很多--如果你想在本周探索其他几个方向,我们已经为你准备好了(一如既往!)。

我们希望您喜欢本周的阅读--感谢您花时间与我们和我们的工作在一起,感谢您的支持使所有这些成为可能。

直到下一个变量
,TDS编辑们

最近添加到我们策划的主题中。

入门

实践教程

深入研究

思考与理论


你如何知道你的数据是否足够好?原文发表在Medium上的Towards Data Science,人们通过强调和回应这个故事继续对话。