当然,可能有少数例外,但我们大多数从事数据工作的人都是为了使人们能够做出好的决定。我们采取了数以百万计的不同途径来实现一个共同的目标:每次都能更好地了解这个世界,一个小的(甚至是很小的)片段。Rama Ramakrishnan的 "从预测到行动 "系列将使我们达到这一目标的过程分解成有时很棘手的部分;最近的部分侧重于为我们要解决的问题组建正确的数据集这一关键步骤。(当你在这里的时候,你也可以重温一下第一部分)。)
照片:Diego GarcíaonUnsplash
界定要看的正确数据,然后创建一个流程,从中得出可操作的见解,这是凯特-加洛作为产品分析师的核心工作。与一些更常见的以数据为中心的工作描述相比,这个角色仍然鲜为人知,而凯特耐心地带领我们了解其内涵和外延。对她来说,产品分析师是一个与多个合作伙伴一起工作的人,是用户的代言人:这个人的作用是 "确保用户享受并从产品中获得价值",并通过对精心选择的指标进行深思熟虑的分析来做到这一点。
Rama和Kate的文章通过商业决策的角度来探讨数据有效性的话题,但要知道我们是否在看正确的数据--我们有足够的数据吗?它可靠吗?它是否准确地代表了这个世界?正如Aidan Peppin在他的第一篇TDS文章中写道,使观察到的现象变得可测量的过程需要多种形式的还原--"没有考虑到数据化的这种还原性是许多算法伤害和失败的根本原因"。对于艾丹来说,如果我们想避免这些最糟糕的危险,精心设计和关注我们在途中做出的选择都是必要的。
观察、收集、表示和利用数据的方法有很多--如果你想在本周探索其他几个方向,我们已经为你准备好了(一如既往!)。
- 发现结构方程模型的力量.Laura Castro-Schilo分享了关于SEM的有用而全面的介绍,并解释了为什么这种方法已经成为这么多行为和社会科学家的最爱。
- 了解最新的深度学习研究. 罗伯特-兰格备受期待的8月版学术论文推荐来了!这一期充满了从视觉变形器到深度学习优化器基准等主题的丰盛读物。
- 了解人工智能的转变范式.最 近围绕人工智能的对话往往归结为简单的人类合作与人类对抗的二元对立。在最新的TDS播客节目中,Jeremie Harris和嘉宾Divya Siddarth探讨了人工智能的其他想法和应用,并探讨了政府可能在该技术的下一章中发挥积极作用的方式。
我们希望您喜欢本周的阅读--感谢您花时间与我们和我们的工作在一起,感谢您的支持使所有这些成为可能。
直到下一个变量
,TDS编辑们
最近添加到我们策划的主题中。
入门
- 在扩大你的数据团队时需要注意什么》 作者:Sheel Choksi
- 数据可视化中色彩的力量作者:Marie Lefevre
- 数据科学家的GitHub桌面作者:Drew Seewald
实践教程
- 构建2021年营销组合模型的完整指南作者:Terence Shin
- 4个预提交插件实现Python中代码审查和格式化的自动化 作者:Khuyen Tran
- 用Pandas快速生成假数据作者:Juan Luis Ruiz-Tagle
深入研究
思考与理论
你如何知道你的数据是否足够好?原文发表在Medium上的Towards Data Science,人们通过强调和回应这个故事继续对话。