Meta 因在未经用户同意的情况下使用面部识别技术向德克萨斯州支付 14 亿美元

36 阅读10分钟

Meta 因在未经用户同意的情况下使用面部识别技术向德克萨斯州支付 14 亿美元

  • Meta 支付 14 亿美元: Facebook 的母公司 Meta 已同意向德克萨斯州支付 14 亿美元,以解决指控滥用面部识别技术的诉讼。
  • • **诉讼:**德克萨斯州总检察长肯·帕克斯顿 (Ken Paxton) 于 2022 年提起诉讼,声称 Meta 通过其“标签建议”功能在未经德克萨斯州人同意的情况下使用了他们的生物特征数据(面部扫描)。此功能会自动识别上传到 Facebook 的照片中的人物。
  • 和解协议要点:
    • • 这是迄今为止单个州因侵犯隐私权而达成的最大和解协议。
    • • Meta 否认有任何不当行为,但同意和解以避免进一步的法律纠纷。
    • • 这笔钱很可能会流入德克萨斯州国库。
  • • **德克萨斯州法律和数据隐私:**此案凸显了德克萨斯州对数据隐私的日益关注。一项新法律《德克萨斯州数据隐私和安全法案》赋予消费者对其个人信息的更多控制权。
  • Meta 的法律挑战历史:
    • • 这并不是 Meta 第一次因数据隐私问题卷入法律纠纷。伊利诺伊州和亚利桑那州也曾发生过类似的诉讼,最终双方达成了巨额和解。
    • • 德克萨斯州还参与了针对谷歌的反垄断诉讼,并支持 Epic Games 对苹果的诉讼,进一步表明了其对科技巨头做法的立场。
  • • **透明度和资金:**文章强调了《德克萨斯论坛报》对独立新闻和透明度的承诺,并指出财务支持者不会影响编辑决策。

www.texastribune.org/2024/07/30/…

Porffor:一个从头开始实验的超前 JS 引擎

这些数据似乎正在跟踪 JavaScript 引擎实施项目的进度,可能基于 ECMAScript 一致性的 Test262 测试套件。

具体如下:

  • • **进度跟踪:**条目显示测试通过率随时间推移的百分比增长,表明项目进展情况。“+0.25”格式表示与上一个条目相比的百分比变化。
  • • **提交消息:**每个条目都包含一条简明的提交消息,描述推动进度的代码更改。这些消息突出显示了正在实现的关键功能:
    • • **核心语言特性:**该项目正在解决基本的 JavaScript 概念,例如异步函数(codegen: very basic async funcs)、Promises(builtins/promise: impl Promise.all, Promise.resolve...)和for...in具有不可枚举属性的循环(codegen: fix for..in using non-enumerables)。
    • 内置对象: 正在努力实现标准 JavaScript 对象,如ArrayBufferNumberObject。这涉及确保它们的行为符合 ECMAScript 规范。
    • • **测试套件增强功能:**该项目正在积极改进其测试基础设施,包括更新 Test262(test262: update clonetest262: bump timeout to 3s...)并添加对异步测试的支持(test262/runner: update hacks)。
  • • **时间范围:**条目带有时间戳,让您可以了解项目的开发速度。数据跨越大约三个月的时间。
  • • **性能可视化:**最后的图表可能可视化一段时间内的总体进度,可能按测试类型分类(例如,运行时错误、编译错误)。

**总体而言:**此快照表明 JavaScript 引擎实现项目正在积极开发中,重点关注核心语言功能和内置对象,同时改进其测试方法。

porffor.dev/

Apple 为隐私保护应用程序开源同态加密的 Swift 实现

  • • 苹果宣布推出一个名为“swift-homomorphic-encryption”的用于同态加密(HE)的新开源 Swift 包。
  • • **什么是同态加密?**同态加密允许对加密数据进行计算而无需解密。这意味着服务器可以处理客户端发送的数据,而无需查看实际的未加密信息。
  • • **苹果的用例:**苹果在 iOS 18 的实时来电显示查询功能中使用了这项技术。此功能可让用户识别来电并阻止垃圾电话,而无需向服务器透露电话号码。
  • 工作原理(简化):
    1. 1. 客户端加密其数据(例如电话号码)。
    2. 2. 加密数据被发送到服务器。
    3. 3. 服务器对加密数据进行计算。
    4. 4. 服务器将结果以加密形式发送回客户端。
    5. 5. 客户端对结果进行解密,得到最终答案。
  • • **私人信息检索 (PIR):**实时来电显示查询依赖于 PIR,这是一种允许客户端从数据库检索信息而不泄露其所需信息的技术。Swift 实现使用 HE 来高效处理大型数据库和频繁更新。
  • 技术细节:
    • • 该软件包实现了 Brakerski-Fan-Vercauteren (BFV) HE 方案,该方案基于带错环学习 (RLWE) 问题并且被认为具有量子抗性。
    • • 选择 BFV 参数来提供 128 位安全性,防止经典攻击和未来的量子攻击。
  • 优势和未来的应用: Apple 认为这个软件包对于各种隐私保护应用程序都很有价值:
    • • 私有集合交集
    • • 安全聚合
    • • 对加密数据进行操作的机器学习模型

www.swift.org/blog/announ…

DARPA 的 TRACTOR 程序旨在将遗留的 C 代码自动转换为内存安全的 Rust 代码

  • • 国防高级研究计划局 (DARPA) 启动了一项名为 TRACTOR(将所有 C 语言转换为 Rust)的项目,旨在将遗留的 C 代码自动转换为安全的 Rust 代码。
  • • 该计划旨在解决 C 和 C++ 代码中长期存在的内存安全漏洞问题,这些漏洞容易受到安全攻击。
  • • 目标是实现与熟练的 Rust 开发人员相同的质量和风格,从而有效消除一整类内存安全问题。
  • • TRACTOR 可以利用静态和动态分析等软件分析技术以及大型语言模型等机器学习方法的组合。
  • • 该计划凸显了 DARPA 通过解决基础软件安全挑战来推进网络安全的承诺。

www.darpa.mil/program/tra…

蝴蝶和飞蛾的静电通过吸引花粉穿过气隙来提高授粉效率

  • • **蝴蝶和飞蛾在飞行时会产生大量静电。**这可能是由于与空气的摩擦造成的。
  • 这种静电荷实际上可以吸引花朵上的花粉粒,即使穿过很小的缝隙也是如此。 研究人员认为,这种静电吸引力使这些昆虫成为更高效的传粉者。
  • • **不同种类的蝴蝶和飞蛾携带的静电量各不相同。**研究发现,电荷量与昆虫是否采花、其栖息地(热带还是非热带)以及其活动时间是白天还是晚上等因素之间存在相关性。
  • • **这表明积累静电的能力是一种进化特征。**自然选择可能会青睐那些电荷水平较高的昆虫,从而提高授粉成功率。
  • • **这项研究涉及五大洲 11 个物种的 269 种蝴蝶和飞蛾。**样本量如此之大,可以对不同的生态位进行比较。
  • 这一发现具有实际意义。 研究人员建议,可以开发技术来人工增加传粉者或花粉的静电荷,从而有可能提高自然和农业环境中的授粉率。

www.bristol.ac.uk/news/2024/j…

Transformer 模型的训练成本随架构和超参数的不同而有很大差异,最高可达 5.42e24 FLOPs 和 1290 万美元

  • • 本文探讨了与训练大型语言模型(LLM)相关的各种实验的计算成本。
  • 实验类型: 讨论了不同的实验类型,每种类型都侧重于 LLM 培训的特定方面:
    • • **Gamma 实验:**这些实验研究了三个 Gamma 超参数对模型性能的影响。它们涉及 3D 超参数搜索,估计耗费约 1.354E+24 FLOP。
    • • **权重衰减实验:**这些实验检查权重衰减对训练的影响,涉及四个参数化和跨所有模型维度的学习率扫描。估计成本约为 1.331E+23 FLOP。
    • Adafactor 实验: 这些实验主要关注 Adafactor 优化器,但文中没有指定计算成本。它只提到计算 12 个模型维度中的前 11 个。
  • • **成本估算公式:**提供了一个公式来估算这些实验的 FLOP:36 * 每个实验的标记数 * (800 * M(1024) + 每行点数 * sum(M(d) for d in D)),其中 M(d) 表示在维度 d 的模型上进行单次前向和后向传递所需的 FLOP。
  • • **实验结果:**本文展示了各种实验的结果,包括:
    • table_e1eps_variants, 和eps_heatmaps
    • • 提供了每个实验的总 FLOP(例如 5.421E+24)。
    • • 预计成本为 1290 万美元,可能代表了运行所有实验的成本。
  • • **硬件要求:**实验大约需要 746.96 H100 节点月才能完成。
  • 模型大小和缩放: 文本包括有关模型大小和缩放效率的信息:
    • • 列出了不同模型架构的尺寸(D)。
    • • 提供了数十亿个参数的相应模型大小。
    • • 提到了指标“M/6P”,可能代表与基线相比的内存使用情况。
  • • **环境比较:**这些实验的计算成本(5.42e24 FLOPs)与训练 Llama 3 的计算成本进行了比较,强调它不到 Llama 3 计算要求的 15%。

152334h.github.io/blog/scalin…

为什么建议不起作用?

  • • **建议的悖论:**作者首先承认,人们普遍会收到一些似乎毫无帮助甚至无法遵循的建议。他们以自己在电子邮件管理方面遇到的困难为例,强调由于存在潜在问题,留出时间处理电子邮件等简单解决方案似乎遥不可及。
  • 理解建议为何失败:
    • • 这篇文章暗示,那些不断给出无用建议的人可能忽略了有关情况的一些关键信息。
    • • 它还提出,盲目听从建议可能会有益,特别是在某人曾经做出过错误决定的领域(比如恋爱关系)。
  • 给建议者的建议:
    • • 作者鼓励建议者抱有现实的期望,并认识到大多数建议都会被忽视。
    • • 他们强调提供易于遵循的建议以达到最大影响的重要性。
    • • 这篇文章指出了一类更容易被采纳的特定建议:关于花钱的建议。
  • 消费建议的吸引力:
    • • 作者推测,有关花钱的建议之所以有吸引力,是因为它提供了一种“隐藏的秘密”或改进捷径的错觉。
    • • 与个人成长选择看似有限相比,消费者选择的广阔性可能是造成这种偏好的原因之一。

dynomight.substack.com/p/advice

数据可视化杰作《Dark Sky》的悼词

  • • 作者对 Dark Sky 的停产表示悲伤,这款天气应用以其准确的预测和用户友好的界面而闻名。
  • • 他们强调“图表”功能特别有价值,它可以让用户预测降雨并制定相应的计划。
  • • 作者认为,虽然数据丰富,但我们需要能够将其应用于实际的软件体验。
  • • Dark Sky 就是一个例子,展示了如何通过周到的设计和工程将原始数据转化为可操作的见解。
  • • 他们鼓励信息软件开发人员从 Dark Sky 的成功中汲取灵感,使复杂的天气数据变得易于获取和有用。
  • • 作者强调需要更多利用数据来改善我们生活的各个方面,例如财务管理和睡眠质量。

nightingaledvs.com/dark-sky-we…