OpenAI API 更新支持结构化数据输出,以改进控制和格式化

296 阅读12分钟

OpenAI API 更新支持结构化数据输出,以改进控制和格式化

  • 结构化输出:处理 GPT 响应的强大工具

OpenAI 的结构化输出功能可让您以预定义格式(如 JSON)从 GPT 模型获取响应。这非常有用,因为它让您可以更轻松地在自己的应用程序中使用模型的输出。可以将其想象为给模型一个模板并要求它填写空白。

  • 工作原理:使用 JSON 模式

您可以通过提供 JSON 架构来告诉 GPT 模型您想要什么样的响应。此架构就像一个蓝图,定义您期望的数据结构。例如,如果您希望模型比较两个数字并返回哪个数字较大,您的架构可能如下所示: json { "comparison": { "number1": "9.11", "number2": "9.9", "largerNumber": "" } }

然后,模型会尽力largerNumber根据您输入的数字在字段中填写正确的答案。

  • 安全与拒绝:保持负责任

OpenAI 非常重视安全。如果请求被视为不安全,模型将拒绝处理它并返回设置为“true”的“拒绝”标志。这有助于防止技术被滥用。

请记住,虽然结构化输出功能强大,但它并不完美。模型可能并不总是完全遵循架构,特别是当它遇到诸如令牌限制或其他停止条件之类的限制时。

  • 限制:了解界限

结构化输出无法保证生成的 JSON 值 100% 准确。例如,复杂的数学计算可能仍会出现轻微错误。为了提高准确性,您可以在说明中提供清晰的示例,或将复杂的任务分解为较小的步骤。

另外需要记住的是,结构化输出与并行函数调用不兼容。如果您需要结构化输出,请确保禁用并行函数调用(parallel_tool_calls: false)。

  • 可用性和响应格式:选择正确的模型

gpt-4o大多数 GPT 模型(包括、gpt-4o-mini和)都可以gpt-3.5-turbo通过各种 API(如聊天完成、助手和批处理 API)提供具有函数调用的结构化输出。它还适用于视觉输入。

有些型号,例如gpt-4o-minigpt-4o-2024-08-06,通过“带响应格式的结构化输出”提供对输出结构的更多控制。此外,gpt-4o-2024-08-06与旧型号相比,切换到 可以为您节省资金。

openai.com/index/intro…

1fps.video 通过端到端加密和 WebSocket 光标跟踪实现安全、低带宽的屏幕共享

  • 1fps.video 是一款专为注重效率和隐私的开发人员和其他专业人士设计的屏幕共享工具。
  • • **它的工作原理是低帧率 (1 FPS) 视频共享通常足以完成代码审查和调试等协作任务。**这种方法大大减少了资源消耗,非常适合较旧的笔记本电脑或带宽有限的情况。
  • • **该工具强调无会议文化,无需音频。**相反,它使用基于 WebSocket 的光标跟踪来提供流畅的近 30 FPS 指针移动,以实现精确的演示。
  • 安全和隐私至关重要:
    • • 所有数据都经过端到端加密。
    • • 加密密钥在客户端生成,不会发送到服务器。
    • • 加密密钥是可共享 URL 的一部分(# 符号之后),确保只有拥有完整链接的人才能访问共享屏幕。
  • 开发人员正在积极致力于加密光标坐标,以获得更高的隐私性。
  • 1fps.video 旨在成为一种多功能解决方案,可与现有的团队聊天应用程序无缝集成。

1fps.video/

本文详细介绍了使用 Playwright 和 Concourse CI/CD 进行价格跟踪的基于 Python 的网络抓取管道的技术实现

  • 目标: 跟踪超市价格随时间的变化,了解其如何波动。
  • • **工具:**开发人员使用 Python 和 Playwright 库进行网页抓取,并使用 Concourse 进行自动部署。他们将抓取的数据存储在 Cloudflare 的 R2 对象存储中。
  • 处理网站变更:
    • • 网站频繁改变其结构,这可能会导致抓取工具崩溃。
    • • 开发人员依靠严格的数据转换规则来尽早捕获这些变化。例如,如果价格格式发生变化(例如,使用标签从 1.99 欧元变为 199 欧元),抓取工具会将其标记为问题。
  • 可靠性和优化:
    • • 当发生故障时会设置电子邮件警报。
    • • 启发式方法可以检测抓取数据时产生的异常产品数量,从而预示着潜在的问题。
    • • 超时和重试机制可防止刮板卡住。
  • 性能助推器:
    • • 升级到更强大的服务器(8 个 vCPU、16GB RAM)可将抓取时间缩短约 20%。
    • • 使用 Playwright 的路由功能阻止图像下载显著加快了该过程并节省了带宽。
  • 费用明细:
    • • 服务器费用:31 台服务器 4.94 欧元。
    • • IP 地址:31 个 IPv4 地址 0.09 欧元。
    • • 数据存储:Cloudflare 的 R2 10GB 层内免费。

www.sakisv.net/2024/08/tra…

X 关闭旧金山总部,将员工迁至南湾办公室

  • • **X 正在关闭其旧金山总部。**首席执行官 Linda Yaccarino 在一封内部电子邮件中宣布了关闭的消息,并表示员工将迁往南湾。
  • 工程人员将搬到帕洛阿尔托,与埃隆·马斯克旗下的另一家公司 xAI 共用办公室。
  • 其他 X 员工将被转移到位于圣何塞桑塔纳街的现有办公室。
  • 该公司在经过多轮裁员后宣布关闭,总部大楼很大一部分仍处于空置状态。
  • 马斯克最初威胁要将 X 迁往德克萨斯州奥斯汀,因为他反对加州的跨性别保护法。然而,亚卡里诺的电子邮件中没有提到这一搬迁事宜。
  • • **X 在其 Market Street 大楼内占地约 80 万平方英尺。**该公司的租约将于 2026 年和 2028 年到期。
  • 文章讨论了 Twitter 于 2011 年迁至旧金山中市场街区的历史
    • • 该市提供税收减免来吸引科技公司入驻该地区,希望振兴该地区。
    • • Twitter 被视为这一努力的关键参与者,它的出现激发了其他科技公司纷纷效仿。
  • 文章指出,税收减免已于 2019 年到期,转向远程工作对社区的活力产生了重大影响。
  • X 的离开被视为对 Mid-Market 的重大打击,进一步凸显了旧金山市中心所面临的挑战。

sfstandard.com/2024/08/05/…

ScholArxiv 是一款开源移动应用程序,可以搜索、阅读、收藏、共享、下载和音频摘要来自 arXiv 的学术论文

  • • ScholArxiv 是一款开源移动应用程序,旨在让用户轻松访问 arXiv 存储库中的学术论文。
  • 主要特征:
    • • **论文阅读:**用户可以直接在应用程序内阅读完整的学术论文。
    • • **书签:**该应用程序允许用户保存自己喜欢的论文,以便以后方便访问。
    • 摘要: ScholArxiv 提供论文的文本和音频摘要,让您更容易快速掌握关键概念。
    • • **搜索功能:**用户可以使用关键词、标题、作者或摘要搜索论文。如果没有提供关键词,该应用程序会推荐热门论文。
    • • **下载与分享:**可下载论文以供离线阅读,并通过文档链接与他人分享。
  • 技术依赖性: ScholArxiv 利用多个软件包来运行:
    • • **dio:**处理从 arXiv 获取论文数据的 HTTP 请求。
    • • **xml2json:**将 XML 数据(arXiv 使用的格式)转换为 JSON,以便在应用程序内更轻松地处理。
    • • **url_launcher:**打开外部 URL,例如 arXiv 网站上的完整论文链接。
    • • **permission_handler:**管理应用程序所需的权限,例如下载论文的存储访问。
    • • **path_provider:**提供用于存储下载论文的文件系统路径的访问。
    • • **liquid_pull_to_refresh:**实现下拉刷新功能,用于更新搜索结果和论文列表。
    • ionicons: 提供一组在应用程序用户界面中使用的图标。
  • • **贡献:**该项目欢迎开发人员的贡献:
    • • 分叉存储库,进行更改,记录下来,然后提交拉取请求。
  • 许可: ScholArxiv 是在 GNU 通用公共许可证 (GPL-3.0) 下发布的,这意味着只要任何衍生作品也是开源的,就可以自由使用、修改和分发。
  • • **致谢:**该项目感谢 arXiv 提供对其学术论文库的开放访问。

github.com/dagmawibabi…

前网络公司首席执行官在麦当劳工作,以了解低薪工作和企业文化

  • • **动机:**海弗曼曾担任互联网公司的首席执行官,在科技行业工作多年后,他想重新与“现实世界”建立联系。他觉得自己与日常生活脱节,希望获得扎实的体验。他还想亲眼看看像麦当劳这样的大型成功企业是如何运作的。
  • 获得工作: Heiferman 只是走进一家麦当劳,填写了申请表,然后接受了面试。他诚实地介绍了自己的背景,但轻描淡写,当被问及他作为 i-Traffic 主席的角色时,他说“这是互联网上的事情”。
  • 观察结果:
    • • **一美元菜单的成功:**海弗曼注意到麦当劳一美元菜单的受欢迎程度,并将其成功归因于菜单的简单性和感知价值。他将一美元菜单与“一美元商店”使用的策略进行了比较,表明即使是大公司也会从规模较小、名气较小的企业那里借鉴策略。
    • 低工资: 海弗曼每小时挣 5.75 美元,这凸显了许多服务业工人的低工资。这段经历让他对那些从事高要求工作却只挣最低工资的人产生了新的敬意。
    • • **缺乏对客户服务的重视:**尽管麦当劳的品牌强调客户满意度,但海弗曼发现他的同事经常对客户粗鲁无礼。当他试图表现得友好时,却收到奇怪的眼神,这表明公司信息与实际情况脱节。
    • 缺乏感激: Heiferman 觉得自己的辛勤工作没有得到赏识。尽管工作要求很高,但没有人认可他的努力。这次经历强调了向员工表达感激之情的重要性,即使是在看似平凡的岗位上。
    • 同事的技能和效率: Heiferman 认可同事的技能和效率,他们善于处理快节奏的环境。
  • 媒体关注: Heiferman 的故事引起了媒体的关注,《克莱恩纽约商业》杂志 (Crain's New York Business) 刊登了一篇关于收购后互联网 CEO 的文章。一些人认为他在麦当劳的工作是一种宣传噱头,但 Heiferman 对此予以驳斥。

web.archive.org/web/2004061…

Kubernetes PVController 管理 PersistentVolume 声明并将其绑定到合适的 PersistentVolumes

此代码定义了一个 Kubernetes 控制器,负责管理持久卷 (PV) 并将其绑定到持久卷声明 (PVC)。以下是其主要功能的细分:

  • • **初始化:**该pvController结构使用必要的组件初始化控制器,例如用于与 Kubernetes API 交互的客户端集、用于监视 PV 和 PVC 事件的通知器工厂以及用于处理 PV 绑定请求的工作队列。
  • PV 声明绑定逻辑: 核心逻辑位于syncHandler函数中。它从 Informer 缓存中检索 PV 和 PVC,并尝试根据特定标准绑定它们:
    • • **PVC 匹配:**控制器搜索尚未与 PV 绑定的 PVC。
    • • **PV 选择:**然后,它会迭代可用的 PV,考虑容量、访问模式(ReadWriteOnce、ReadWriteMany、ReadOnlyMany)和存储类匹配等因素。
    • • **绑定:**如果找到合适的 PV,控制器会创建一个绑定对象,将 PVC 链接到所选 PV。然后,此绑定将保留在 Kubernetes API 中。
  • • **错误处理和重试:**代码包含强大的错误处理机制。如果绑定尝试失败(例如,由于 PV 容量不足或声明冲突),控制器会记录错误,标记 PVC 以进行重试,并安排在指定的延迟后重新处理。
  • • **后台协调:**该run函数启动一个 goroutine,持续处理工作队列中的项目。这可确保绑定请求在后台异步处理,从而防止阻塞操作。
  • 附加功能:
    • • **卷插件集成:**代码与卷插件交互(此摘录中未显示)以收集有关可用 PV 及其功能的信息。
    • • **事件报告:**控制器发出事件,通知用户 PV 绑定成功、失败和其他相关状态变化。

github.com/kubernetes/…

西部数据在 2024 FMS 上宣布推出 128TB 企业级 SSD、8TB SD 卡和 16TB 外置 SSD

  • • **企业级 SSD 巨头:**西部数据推出了一款突破性的 128TB 企业级 SSD,该款 SSD 采用了第八代 BiCS8 NAND 技术和 QLC(每单元四位)。这款大容量硬盘旨在满足 AI、机器学习和大型语言模型对数据的要求。
  • 数据中心扩展: WD 并不止步于 128TB SSD。他们还展示了用于大规模存储的 32TB ePMR SMR HDD 和用于需要高性能和高容量的应用程序的全新 64TB eSSD。
  • 更快的连接: WD 正在演示一种 RapidFlex 插入器,可将 PCIe SSD 信号转换为以太网,从而实现与 OpenFlex Data24 4200 NVMe-oF 存储平台的无缝集成。
  • 消费级 SSD 获得提升: WD 将在 FMS 2024 上展示 BiCS8 性能和主流 PCIe 5.0 NVMe SSD。这些演示将重点介绍这些驱动器如何增强 AI PC、游戏装备、工作站、笔记本电脑等。
  • 创纪录的 SD 卡: WD 正在通过全球首款 SanDisk 8TB SDUC UHS-I 卡和新款 SanDisk 4TB microSDUC UHS-I 卡突破可移动存储的界限。这些高容量卡将是需要充足存储空间的智能手机、无人机和相机用户的理想选择。
  • 便携式 SSD 容量越来越大: WD 正在展示概念验证的 16TB SanDisk Desk Drive,旨在成为市场上第一个拥有如此大容量便携式 SSD 的产品。

www.tomshardware.com/pc-componen…