刚刚,ChatGPT 的深度研究可以连接 GitHub 了!网友:这是真 ·RAG

167 阅读3分钟

ChatGPT 在深夜又更新了一波大的——

深度研究(Deep Research)功能,现在可以直接连接到 GitHub 了!

那么效果又是怎样的呢?

例如我们在点击 “深度研究” 的同时,提出一个需求:

我最近加入了团队,并接到一项任务要求熟悉我们的 GitHub 代码库。请提供一份简要报告,内容包括:项目目的与架构、关键模块、技术栈、值得关注的开源问题 / 合并请求,以及两项可执行的代码质量改进建议。

在发送问题之后,输入框底部就会出现 “GitHub” 的选项;之后我们可以在 “Search repos” 框中输入想要的内容,例如“codex”:

然后,ChatGPT 就会直接连接到 GitHub 中的 18 个相关 repos,基于此来生成答案:

网友们看罢,纷纷认为这是利好开发者的一次功能更新,更有人直呼:

这是真 ·RAG。

据了解,目前这个功能仍旧处于测试阶段,全球范围内的 Team 用户可用,并将陆续对 Plus、Pro 用户开放。

具体是如何跟 GitHub 联动的?

对于这个新功能,也有网友提出了不少问题。

而 OpenAI 也同步上线了一个 Q&A 文档,详细地回答了 ChatGPT 具体是如何与 GitHub 联动的。

在使用方面,正如我们刚才所展示的,当你把 GitHub 和深度研究连接后,ChatGPT 就能直接从你的代码库(包括代码、README 文件和其他文档)中获取实时数据,并即时分析处理。

你只需要完成连接,提出问题,深度研究就会自动读取、分析你的 GitHub 内容,并直接引用相关片段来解答。

而除了像刚才的操作方式之外,你也可以进入 ChatGPT 设置,选择 “已连接应用”(Connected apps),找到“连接器”(Connectors)选项,然后点击 GitHub 旁边的“连接” 按钮。

如果之后需要调整该连接器能访问的代码库范围,只需在设置中点击 GitHub 旁边的齿轮图标,即可跳转至 GitHub 连接器的配置页面。

当你在已连接的 GitHub 代码库中提问时,ChatGPT 会根据你的问题自动生成搜索关键词来查找相关内容。

比如你问:“能告诉我后端处理文件上传的代码在哪里吗?”

ChatGPT 可能会用 “file upload handler backend” 这样的关键词进行搜索。

如果有需要,它还会尝试多种不同的搜索方式,确保找到最相关的代码或文件。

除此之外,网友问得比较多的一个问题就是:OpenAI 会使用 GitHub 的内容来训练其模型吗?

对此,OpenAI 的回答是:

对于企业级产品(如 ChatGPT Team、Enterprise、Edu 和 API 服务),默认情况下用户发送的内容不会用于改进我们的模型。

若您使用的是个人版服务(如 ChatGPT 免费版、Plus 和 Pro 版),当开启 “为所有人改进模型” 选项时,我们可能会使用您的内容来训练模型

最后,还有几个注意事项:

  • 代码库需要约 5 分钟时间才会出现在深度研究的 GitHub 连接器中

  • 只能搜索 GitHub 仓库的名称,不支持搜索特定的文件名

强化微调也正式发布

而除了 “GitHub 连接器” 之外,OpenAI 在凌晨还发布了一个新功能——

强化微调(Reinforcement fine-tuning,RFT)

没错,正是 OpenAI 在去年 12 月预览过的那个功能,今天它可以正式在 o4-mini 中使用了!

具体来说,RFT 使用思维链推理和任务特定评分来提高模型性能,特别适用于复杂领域。

以 AccordanceAI 这家公司为例,它便使用 RFT 微调了一个在税务和会计方面达到顶尖水平的模型,具体效果如下:

视频详情

那么对于 OpenAI 上新的这两个功能,你有什么看法呢?欢迎在评论区留言讨论~

参考链接:
[1]x.com/OpenAIDevs/…
[2]x.com/TheRealAdam…
[3]help.openai.com/en/articles…
[4]x.com/OpenAIDevs/…

—  —