DeepMind 推出 AlphaProof:一种用于数学自动定理证明的人工智能系统

209 阅读9分钟

DeepMind 推出 AlphaProof:一种用于数学自动定理证明的人工智能系统

image.png

  • AlphaProof:一种能够证明数学定理的突破性人工智能系统。
    • • AlphaProof 由 Google DeepMind 团队开发,利用了几何推理(AlphaGeometry 2)和自然语言理解方面的进步。
  • • **AlphaGeometry 2:**此组件擅长解决复杂的几何问题,展现出奥林匹克级别的熟练程度。
    • • 由 Trieu Trinh 和 Yuri Chervonyi 领导,Mirek Olšák、Xiaomeng Yang、Hoang Nguyen、Junehyuk Jung、Dawsen Hwang 和 Marcelo Menegali 做出了重要贡献。
  • • **自然语言推理系统:**该组件将数学语句转换为 AlphaGeometry 2 可以理解的格式。
    • • 由 Golnaz Ghiasi、Garrett Bingham 和 YaGuang Li 领导,贡献者包括 Swaroop Mishra、Nigamaa Nayakanti、Sidharth Mudgal、Qijun Tan、Junehyuk Jung、Hoang Nguyen、Alex Zhai、Dawsen Hwang、Mingyang Deng、Clara Huiyi Hu、Jarrod Kahn、Maciej库拉和科斯莫·杜。
  • 合作与支持:
    • • David Silver、Quoc Le、Demis Hassabis 和 Pushmeet Kohli 负责该项目。
    • • 许多人对该系统的性能评估做出了贡献。
    • • 国际海事组织理事会的 Gregor Dolinar 教授和 Geoff Smith MBE 博士提供了支持和合作。
  • 利用现有工具: AlphaProof 建立在 Lean 定理证明器和 Mathlib 库之上,突出了开源工具在 AI 开发中的威力。

deepmind.google/discover/bl…

本逆向工程教程集涵盖 x86、x64、ARM32 和 ARM64 架构,适合初学者和中级学习者

  • • 本教程集旨在让每个人都能进行逆向工程,无论他们之前是否有经验。
  • • 逆向工程的定义是解构人造物体(如软件)以了解其设计、架构、代码或从中提取知识。它类似于科学研究,但侧重于人造物体而非自然现象。
  • • 这些教程涵盖了一系列的架构:
    • • x86
    • • x64
    • • 32 位 ARM
    • • 64 位 ARM
  • • 本套课程适合初学者和希望复习知识的人。课程将指导初学者从基础知识到中级水平的逆向工程知识,这是网络安全的一项关键技能。经验丰富的人员可以使用侧边栏导航重新查看特定主题。
  • • 教程可以 PDF 和 MOBI 格式下载,确保在不同设备上均可访问。这些电子书版本将随着新内容的添加而自动更新。

0xinfection.github.io/reversing/

使用爬山法生成数独谜题需要从有效的数独开始,以避免无限的成本函数回报

  • • 本文提出了一种数独谜题生成算法,使用爬山法来实现所需的调用次数(谜题难度的衡量标准)。
  • • 该算法从初始有效的数独谜题开始,这至关重要,因为无效的配置会导致无限的成本。
  • • 成本函数测量当前谜题的调用计数与所需难度级别的目标调用计数之间的差异。
  • • 爬山过程涉及随机修改数独网格中的单个元素(添加、删除或更改数字)。
  • • 每次修改后,都会重新计算成本函数。如果成本较低,则接受更改;否则,则撤销更改。
  • • 这个迭代过程持续到找到成本接近于零的谜题,表明调用次数与所需的难度级别相匹配。
  • • 作者承认,由于修改的随机性,他们的算法可能会很慢。他们建议根据所需的准确度和难度级别数量将“接近度”定义为零。

tn1ck.com/blog/how-to…

Node.js 通过集成 Amaro WASM 模块进行转译,添加了实验性的 TypeScript 支持

  • • **Node.js 中添加了 TypeScript 支持:**此拉取请求将 TypeScript 支持引入 Node.js,对于喜欢使用 TypeScript 进行类型安全性和改进的代码可维护性的开发人员来说,这是一个重大改进。
  • • **Amaro 集成:**核心功能依赖于 Amaro,这是一个 WebAssembly (Wasm) 模块,可能处理 Node.js 运行时中的 TypeScript 编译和执行。
  • Wasm 二进制文件的 Base64 编码: Amaro Wasm 二进制文件以 Base64 编码字符串的形式直接嵌入到 Node.js 代码库中。这种方法简化了分发,但会导致文件大小较大(2.47MB)。
  • • **提出的安全问题:**开发人员对嵌入式 Wasm 二进制文件中可能存在后门表示担忧,并强调了包含大型不透明二进制组件所带来的风险。
  • • **透明度和构建过程:**拉取请求的作者澄清说,Amaro Wasm 模块是在 Node.js 存储库本身内构建的(github.com/nodejs/amar…
  • 社区参与: 讨论涉及众多 Node.js 贡献者、审阅者和感兴趣的开发人员的积极参与,表明需要共同努力来完善和改进此功能。

github.com/nodejs/node…

萨姆·奥特曼主张以民主的方式发展人工智能,以对抗潜在的独裁者对该技术的滥用

  • • **风险:**人工智能的快速发展使人类面临着一个关键的选择:我们是应该开发一种让所有人受益的民主人工智能,还是独裁政权会为了自己的利益而控制这种强大的技术?
  • • **威胁:**奥特曼警告说,如果中国这样的专制国家在人工智能发展方面占据主导地位,他们可能会利用它来压制异议,操纵信息,并推进他们的地缘政治利益。
  • • **美国的优势:**美国目前在人工智能创新方面处于领先地位,这得益于其开放的社会,它促进了研究人员、企业家和学者之间的合作和创造力。
  • • **构建民主的人工智能未来:**奥特曼提出了几项策略,以确保人工智能发展符合民主价值观:
    • • **国际合作:**创建一个类似于国际原子能机构 (IAEA) 的全球机构,为人工智能发展制定安全标准和道德准则。这可能涉及整合现有的人工智能安全机构,并设立投资基金来支持致力于民主人工智能原则的国家。
    • • **开源模型:**让全球开发人员可以随时使用开源 AI 模型,为塑造 AI 的未来提供更广泛的声音和观点。
    • 输出价值观: 不仅要促进人工智能技术的输出,还要促进支撑其发展的民主价值观的输出。这包括透明度、问责制和尊重人权。
  • • **行动的紧迫性:**奥尔特曼强调时间至关重要。美国必须采取果断行动,利用其当前优势,建立一个致力于负责任和合乎道德地开发人工智能的全球联盟。如果不这样做,可能会给全世界的民主和自由带来可怕的后果

www.washingtonpost.com/opinions/20…

黑猩猩在数字回忆任务上的工作记忆表现与年轻人相当,但比成年人的能力差

  • • 2012年,一只名叫Ayumu的黑猩猩给很多人留下了深刻的印象,它能够记住屏幕上短暂闪现的数字顺序,似乎比人类表现得更好。
  • • 这导致有人声称黑猩猩比人类拥有更出色的工作记忆。
  • • 然而,这些说法都是基于有缺陷的方法论。Ayumu 在这项任务上进行了大量的练习,而与他相比的人类却没有。
  • • 后续研究表明,人类只需适度练习,就能达到 Ayumu 的表现。
  • • 研究人员 Cook 和 Wilson (2010) 通过训练大学生超越 Ayumu 的记忆能力证明了这一点。
  • • Read 等人 (2022) 最近的一篇文献综述表明,黑猩猩的工作记忆与 4-5 岁的人类相当,但在处理两位以上的数字时却不如成年人的表现。
  • • 这篇评论还质疑用于评估 Ayumu 记忆的任务是否真的是工作记忆的测试。

从本质上讲,由于方法论上的缺陷以及后续研究表明人类通过练习可以取得类似甚至更好的表现,黑猩猩工作记忆更优越的最初说法已经被揭穿。

www.jasoncollins.blog/posts/human…

基于 SQL 的有限状态机实现,具有对订单处理的版本控制和弃用支持

这篇博文详细介绍了使用 SQL 函数、聚合和触发器在 PostgreSQL 数据库中实现有限状态机 (FSM) 的方法。

以下是该方法的详细说明:

  • 定义状态和转换: FSM 由存储状态 ( order_state)、事件 ( order_event) 以及它们之间的转换 ( order_events_transitions) 的表表示。转换具有版本控制,允许更新和弃用旧的 FSM 逻辑。
  • • **转换逻辑的 SQL 函数:**该_events_transition函数根据当前状态、事件和版本确定下一个状态。它查询表order_events_transitions以查找匹配的转换规则并返回next_state。如果未找到匹配项,则默认为“错误”状态。
  • • **事件排序的聚合函数:**聚合函数order_events_fsm处理一系列事件(order_event)和版本(integer)。它使用该_events_transition函数计算每个事件后的下一个状态,有效地模拟 FSM 的进展。
  • • **版本控制和验证的触发器:**触发器order_events_trigger_func强制执行版本控制并验证转换:
    • • 它检查表中指定版本的状态order_fsm_versions。如果版本为“已弃用”或“已过时”,则会分别引发警告或异常。
    • • 它查询给定订单的所有事件(包括插入的新事件)并使用order_events_fsm聚合函数确定结果状态。
    • • 如果最终状态是“错误”,则会引发异常,表示事件序列无效。

这种方法可以实现:

  • 版本控制 FSM 逻辑: 可以引入、弃用或标记为过时的 FSM 新版本。触发器可确保仅使用有效版本进行转换。
  • 动态事件处理: FSM 可以根据预定义的规则处理各种事件并实现状态之间的转换。
  • • **数据库原生实现:**整个 FSM 逻辑驻留在数据库中,无需外部应用程序或服务。

raphael.medaer.me/2019/06/12/…