2023 年 AI/ML 值得关注的 15 个 Github 开源库

2,654 阅读4分钟

随着技术世界继续以极快的速度发展,跟上最新的趋势、技术和工具可能会让人望而生畏,如近期的人工智能。而作为全球领先的软件开发平台 GitHub 是掌握科技行业脉搏的最佳资源之一。在这篇文章中,将重点介绍 2023 年每个技术爱好者都应关注的一些顶级 GitHub 存储库。无论是经验丰富的开发人员还是有抱负的技术爱好者,这些存储库都能提供丰富的信息、资源和灵感。

在继续名单之前,先把一些常见的排除在外:

  1. ChatGPT Retrieval Plugin:ChatGPT 检索插件可以通过使用自然语言提问轻松找到个人或工作文档。

  2. Triton:Triton 语言和编译器的开发存储库

  3. BabyAGI:这个 Python 脚本是一个以人工智能为动力的任务管理系统的示例。该系统使用 OpenAI 和矢量数据库(如 Chroma 或 Weaviate)来创建、优先排序和执行任务。该系统的主要思想是基于先前任务的结果和预定义目标来创建任务。然后,脚本使用 OpenAI 的自然语言处理(NLP)功能基于目标创建新的任务,并使用 Chroma/Weaviate 来存储和检索任务结果以获取上下文信息。

  4. Auto-GPT:一项使 GPT-4 完全自主的实验性开源尝试。

  5. Evals:一个用于评估 LLM 和 LLM 系统的框架,也是一个开源的基准注册中心。

在这方面取得进展的创新项目有很多,以下是精选的一些项目(无特定顺序),它们在机器学习和人工智能领域蓬勃发展。

privateGPT

在没有网络连接的情况下,使用LLMs的强大功能,对文档进行提问。100%私密性,任何时候都没有数据离开执行环境。可以在没有网络连接的情况下导入文档并提问!

GitHub:github.com/imartinez/p…

Stable Diffusion web UI

基于用于 Stable Diffusion 的 Gradio 库的浏览器界面,它提供了一个用户友好的图形界面,用于与 Stable Diffusion 进行交互。

WechatIMG1814.jpeg

GitHub:github.com/AUTOMATIC11…

Local AI

LocalAI 是一种直接替代 REST API,与用于本地推理的 OpenAI API 规范兼容。它允许使用消费级硬件在本地或本地运行模型,支持与 ggml 格式兼容的多个模型系列(llama.cpp、alpaca.cpp、gpt4all.cpp、rwkv.cpp、whisper.cpp、vicuna、koala、gpt4all-j、cerebras)。

GitHub:github.com/go-skynet/L…

ChatGPT Next Web

一键式在 Vercel 上部署精心设计的 ChatGPT WEB用户界面。

GitHub:github.com/Yidadaa/Cha…

DB-GPT

使用本地 GPT 与您的数据和环境交互,无数据泄露,100% 私密,100% 安全。

GitHub:github.com/csunny/DB-G…

Marvin

一个包含电池的库,用于构建 AI 驱动的软件。 Marvin 的工作是将 AI 直接集成到您的代码库中,使其看起来和感觉起来与任何其他功能一样。

Pandora

Pandora 实现了网页版 ChatGPT 的主要操作,后端优化,绕过Cloudflare,速度喜人。

GitHub:github.com/pengzhile/p…

doc-GPT

文档聊天机器人——多个文件、主题、聊天窗口和聊天历史。由 GPT 提供支持。

GitHub:github.com/dissorial/d…

Prompt Engineering Guide

使用大型语言模型(如 OpenAI 的 GPT-4)的提示和技巧。

GitHub:github.com/brexhq/prom…

Rasa Open Source

Rasa 是一个开源机器学习框架,用于自动化基于文本和语音的对话。

GitHub:github.com/RasaHQ/rasa

JINA AI

Jina 是一个 MLOps 框架,用于构建用 Python 编写的基于多模式 AI 微服务的应用程序,这些应用程序可以通过 gRPC、HTTP 和 WebSocket 协议进行通信。

GitHub:github.com/jina-ai/jin…

TVM:开放深度学习编译器栈

Apache TVM 是一个用于深度学习系统的编译器堆栈。它旨在缩小以生产力为中心的深度学习框架与以性能和效率为中心的硬件后端之间的差距。

GitHub:github.com/apache/tvm

TensorFlow Quantum

TFQ 是一个用于混合量子经典机器学习的 Python 框架,主要侧重于对量子数据进行建模。

GitHub:github.com/tensorflow/…

GPTCache

为 LLM 查询创建语义缓存的库。

GitHub:github.com/zilliztech/…

Agent-LLM

Agent-LLM 是一个人工智能自动化平台,旨在为跨多个供应商的高效人工智能指令管理提供支持。

GitHub:github.com/Josh-XT/Age…

总结

在一个日益数字化的世界中,跟上最新的技术发展比以往任何时候都更加重要。GitHub 开源库对于任何希望学习、成长和随时了解科技行业最新趋势和工具的人来说都是极好的资源。