2024 年 11 月第 2 周 GitHub 十大热门存储库
欢迎阅读我们每周汇总的2024 年 11 月 13 日第二周十大热门 GitHub 存储库。无论您是开发人员、数据科学家还是技术爱好者,这些存储库本周在 GitHub 上都引起了极大关注。让我们深入了解这些项目脱颖而出的原因!****
1. DS4SD/文档
描述: 为 gen AI 准备好您的文档
存储库链接: 访问存储库
DS4SD / 文档
为人工智能做好准备
多克林
Docling 可以轻松、快速地解析文档并将其导出为所需的格式。
特征
- 🗂️ 读取流行的文档格式(PDF、DOCX、PPTX、图像、HTML、AsciiDoc、Markdown)并导出为 Markdown 和 JSON
- 📑 高级 PDF 文档理解,包括页面布局、阅读顺序和表格结构
- 🧩 统一、富有表现力的DoclingDocument表示格式
- 🤖 轻松与 LlamaIndex 🦙 和 LangChain 🦜🔗 集成,打造强大的 RAG / QA 应用程序
- 🔍 支持扫描 PDF 的 OCR
- 💻 简单方便的 CLI
探索文档以发现大量示例并释放 Docling 的全部功能!
即将推出
- ♾️ 方程式和代码提取
- 📝 元数据提取,包括标题、作者、参考文献和语言
- 🦜🔗 原生 LangChain 扩展
安装
要使用 Docling,只需docling从包管理器安装,例如 pip:
pip install docling
适用于 macOS、Linux 和 Windows 环境。x86_64 和 arm64 架构。
更详细的安装说明请参阅文档。
…
2.Dockur /Windows
描述: 在 Docker 容器内运行 Windows
存储库链接: 访问存储库
dockur / windows
Docker 容器内的 Windows。
Docker 容器内的 Windows。
特点✨
- ISO 下载器
- KVM加速
- 基于 Web 的查看器
视频📺
用法🐳
通过 Docker Compose:
services:
windows:
image: dockurr/windows
container_name: windows
environment:
VERSION: "11"
devices:
- /dev/kvm
cap_add:
- NET_ADMIN
ports:
- 8006:8006
- 3389:3389/tcp
- 3389:3389/udp
stop_grace_period: 2m
通过 Docker CLI:
docker run -it --rm -p 8006:8006 --device=/dev/kvm --cap-add NET_ADMIN --stop-timeout 120 dockurr/windows
通过 Kubernetes:
kubectl apply -f https://raw.githubusercontent.com/dockur/windows/refs/heads/master/kubernetes.yml
兼容性⚙️
| 产品 | 平台 | |
|---|---|---|
| Docker 引擎 | Linux | ✅ |
| Docker 桌面 | Linux | ❌ |
| Docker 桌面 | macOS | ❌ |
| Docker 桌面 | Windows 11 | ✅ |
| Docker 桌面 | Windows 10 | ❌ |
常见问题解答💬
我如何使用它?
非常简单!步骤如下:
- 启动容器并使用您的 Web 浏览器连接到端口 8006 。
- 当奇迹发生时,您可以坐下来放松,整个安装过程将完全自动完成。
- 一旦你看到桌面...
3.All -Hands-AI/OpenHands
描述: 🙌 OpenHands:少写代码,多做事
链接至存储库: 访问存储库
All-Hands-AI / OpenHands
🙌 OpenHands:少写代码,多做事
OpenHands:少编码,多创造
欢迎来到 OpenHands(以前称为 OpenDevin),这是一个由 AI 驱动的软件开发代理平台。
OpenHands 代理可以执行人类开发人员可以执行的任何操作:修改代码、运行命令、浏览 Web 调用 API,甚至从 StackOverflow 复制代码片段。
在docs.all-hands.dev上了解更多信息,或跳至快速入门。
⚡ 快速入门
运行 OpenHands 最简单的方法是使用 Docker。请参阅安装指南以了解系统要求和更多信息。
docker pull docker.all-hands.dev/all-hands-ai/runtime:0.13-nikolaik
docker run -it --pull=always \
-e SANDBOX_RUNTIME_CONTAINER_IMAGE=docker.all-hands.dev/all-hands-ai/runtime:0.13-nikolaik \
-v /var/run/docker.sock:/var/run/docker.sock \
-p 3000:3000 \
-e LOG_ALL_EVENTS=true \
--add-host host.docker.internal:host-gateway \
--name openhands-app \
docker.all-hands.dev/all-hands-ai/openhands:0.13
您会发现 OpenHands 正在http://localhost:3000运行!
最后,您需要一个模型提供商和 API 密钥。Anthropic 的 Claude 3.5 Sonnet ( anthropic/claude-3-5-sonnet-20241022) 效果最好,但您还有很多选择。
您还可以将 OpenHands 连接到本地文件系统, 在...中运行 OpenHands。
4.Getmaxun /Maxun
描述: 免费、开源、无代码的 Web 数据提取平台。构建自定义机器人以自动执行数据抓取 [测试版]。
存储库链接: 访问存储库
getmaxun / maxun
✨ 免费、开源、无代码的网络数据提取平台 ✨ [测试中]
马迅开源无代码 Web 数据提取平台
Maxun 可让您在 2 分钟内训练机器人并自动抓取网页数据。网页数据提取再简单不过了
网站| Discord | Twitter | 加入 Maxun Cloud | 观看教程
本地设置
Docker 组成
git clone https://github.com/getmaxun/maxun
docker-compose up -d --build
没有Docker
- 确保您的系统上安装了 Node.js、PostgreSQL、MinIO 和 Redis。
- 运行以下命令
git clone https://github.com/getmaxun/maxun
# change directory to the project root
cd maxun
# install dependencies
npm install
# change directory to maxun-core to install dependencies
cd maxun-core
npm install
# start frontend and backend together
npm run start
您可以通过http://localhost:5173/访问前端,通过http://localhost:8080/访问后端
环境变量
-
.env在项目根文件夹中创建一个名为 -
示例环境文件可在此处查看。
| 多变的 | 强制的 | 描述 | 如果未设置 |
|---|---|---|---|
BACKEND_URL | 是的 |
…
5.Mingrammer /图表
描述: 🎨 用于原型云系统架构的图表即代码
存储库链接: 访问存储库
mingrammer / 图表
🎨 用于原型云系统架构的图表即代码
图表
图表作为代码。
Diagrams 可让您使用 Python 代码绘制云系统架构。它诞生的目的是无需任何设计工具即可对新系统架构设计进行原型设计。您还可以描述或可视化现有系统架构。Diagrams 目前支持的主要提供商包括:、、、、、等...AWS它还支持节点以及主要框架和语言。Azure``GCP``Kubernetes``Alibaba Cloud``Oracle Cloud``On-Premises``SaaS``Programming
图表即代码还允许您在任何版本控制系统中 跟踪架构图的变化。****
注意:它不控制任何实际的云资源,也不生成云形成或地形代码。它仅用于绘制云系统架构图。
提供者
入门
它需要Python 3.7或更高版本,请先检查你的 Python 版本。
它使用Graphviz来渲染图表,因此您需要安装 Graphviz才能使用……
6.CodePhiliaX /Chat2DB
描述: AI 驱动的数据库工具和 SQL 客户端,支持多种数据库,包括 MySQL、Oracle、PostgreSQL 等。
存储库链接: 访问存储库
CodePhiliaX / Chat2DB
🔥🔥🔥AI 驱动的数据库工具和 SQL 客户端,最热门的 GUI 客户端,支持 MySQL、Oracle、PostgreSQL、DB2、SQL Server、DB2、SQLite、H2、ClickHouse 等。
Chat2DB
离线版本即将于 10.25 推出,请在 Product Hunt 上获取通知!
下载并安装 Chat2DB(Pro)
下载 软件包双击安装
AI驱动的智能SQL开发
人工智能驱动的智能报告
人工智能驱动的数据探索
我们还开源了我们的第一个 GLM,Chat2DB-SQL-7B。您可以从以下链接中了解更多详细信息。
- github: Chat2DB-SQL-7B
- huggingface🤗:Chat2DB-SQL-7B
- 模型范围:Chat2DB-SQL-7B
在 Chat2DB 上部署 InternLM 模型
感谢InternLM对本项目的大力支持,本项目的自定义模型中可以集成来自 InternLM 的多个模型权重,更多详情可参考chat2db-internlm-deploy
支持的数据库
Chat2DB Pro 支持以下所有数据库,包括最需要的 Redis 功能。
- MySQL
- PostgreSQL
- 氢气
- 甲骨文
- SQL服务器
- SQLite
- 玛拉雅数据库
- ClickHouse
- 糖尿病
- 普雷斯托
- DB2
- OceanBase
- 蜂巢
- 金贝
- MongoDB
- Redis
- 雪花
使用Chat2DB
请参阅快速入门指南来开始使用 Chat2DB。
贡献
…
7.霍吉艾/霍吉
描述: 您的 AI 第二大脑。可自托管,支持自定义代理、自动化以及与 GPT、Claude、Gemini 等在线或本地 LLM 集成。
存储库链接: 访问存储库
科杰艾
您的 AI 第二大脑。可自行托管。从网络或文档中获取答案。构建自定义代理、安排自动化、进行深入研究。将任何在线或本地 LLM 转变为您的个人自主 AI(例如 gpt、claude、gemini、llama、qwen、mistral)。
你的人工智能第二大脑
📑 文档 • 🌐 网页 • 🔥 应用程序 • 💬 Discord • ✍🏽 博客
Khoj是一款个人 AI 应用,可帮助您扩展能力。它可从设备上的个人 AI 顺利扩展到云级企业 AI。
- 与任何本地或在线 LLM 聊天(例如 llama3、qwen、gemma、mistral、gpt、claude、gemini)。
- 从互联网和您的文档(包括图像、pdf、markdown、org-mode、word、notion 文件)获取答案。
- 从您的浏览器、Obsidian、Emacs、桌面、电话或 Whatsapp 访问它。
- 创建具有自定义知识、角色、聊天模型和工具的代理来承担任何角色。
- 自动完成重复性研究。将个人新闻通讯和智能通知发送到您的收件箱。
- 使用我们先进的语义搜索快速轻松地找到相关文档。
- 生成图像、大声说话、播放您的信息。
- Khoj 是开源的,可自行托管。始终如此。
- 在您的计算机上私下运行它或在我们的云应用程序上尝试它……
8. Abi/截图转代码
描述: 放入屏幕截图并将其转换为干净的代码(HTML / Tailwind / React / Vue)
链接到存储库: 访问存储库
abi / 屏幕截图到代码
放入屏幕截图并将其转换为干净的代码(HTML / Tailwind / React / Vue)
截图转代码
一款使用 AI 将屏幕截图、模型和 Figma 设计转换为干净、实用的代码的简单工具。现在支持 Claude Sonnet 3.5 和 GPT-4o!
Youtube.克隆.mp4
支持的堆栈:
- HTML + Tailwind
- HTML + CSS
- React + Tailwind
- Vue + Tailwind
- 引导
- Ionic + Tailwind
- SVG
支持的 AI 模型:
- Claude Sonnet 3.5-最佳模型!
- GPT-4o——也推荐!
- DALL-E 3 或 Flux Schnell(使用 Replicate)用于图像生成
请参阅下面的示例部分以获取更多演示。
我们还刚刚添加了实验性支持,对网站运行时的视频/屏幕进行录制并将其转变为功能原型。
🌍 托管版本
在托管版本(付费)上实时试用。如果您是大型或中型企业(50 名以上员工),请预约会议以探索定制企业计划。
🛠 入门
该应用程序有一个 React/Vite 前端……
9.Vercel /AI聊天机器人
描述: 由 Vercel 构建的功能齐全、可破解的 Next.js AI 聊天机器人
存储库链接: 访问存储库
vercel / ai-chatbot
Vercel 构建的功能齐全、可破解的 Next.js AI 聊天机器人
Next.js AI 聊天机器人
Vercel 使用 Next.js 和 AI SDK 构建的开源 AI 聊天机器人模板
特征
-
Next.js应用路由器
- 高级路由可实现无缝导航和性能
- React 服务器组件 (RSC) 和服务器操作用于服务器端渲染和提高性能
-
- 使用 LLM 生成文本、结构化对象和工具调用的统一 API
- 用于构建动态聊天和生成用户界面的钩子
- 支持 OpenAI(默认)、Anthropic、Cohere 和其他模型提供商
-
- 使用Tailwind CSS进行样式设置
- Radix UI的组件原语可实现可访问性和灵活性
-
数据持久性
- 由 Neon 提供支持的 Vercel Postgres用于保存聊天记录和用户数据
- Vercel Blob用于高效文件存储
-
- 简单、安全的身份验证
模型提供者
gpt-4o此模板默认附带 OpenAI 。但是,使用AI SDK,您可以将 LLM 提供商切换为OpenAI、Anthropic ……
10.本地发送
描述: AirDrop 的开源跨平台替代品
存储库链接: 访问存储库
本地发送 / 本地发送
AirDrop 的开源跨平台替代品
本地发送
主页• Discord • GitHub • Codeberg
英语•中文•日本语• ภาษาไทย •菲律宾语•波兰语•西班牙语• Tiếng Việt •葡萄牙语 巴西语•意大利语•印度尼西亚语• ភាសាខ្មែរ •法语• فאрсе •土耳其语
LocalSend 是一款免费的开源应用程序,可让您通过本地网络与附近的设备安全地共享文件和消息,而无需互联网连接。
关于
LocalSend 是一款跨平台应用,可使用 REST API 和 HTTPS 加密实现设备之间的安全通信。与其他依赖外部服务器的消息传递应用不同,LocalSend 不需要互联网连接或第三方服务器,因此是一种快速可靠的本地通信解决方案。
截图
下载
建议从应用商店或...下载该应用程序。
荣誉提名
以下是一些未进入前 10 名但值得本周提及的存储库:
- Webpack / Webpack – JavaScript 等的捆绑器,支持代码拆分和模块加载。
- Exo-explore / Exo – 使用日常设备在家中运行您自己的 AI 集群。
- Twentyhq / Twenty——由社区提供支持的 Salesforce 现代替代品。
- Stirling-Tools / Stirling-PDF – 用于对 PDF 文件执行各种操作的本地网络应用程序。
- Danielmiessler / Fabric——使用模块化解决问题的方法利用人工智能增强人类能力的开源框架。
结论
这就是我们2024 年 11 月第 2 周GitHub十大热门存储库的总结!请务必探索这些项目,尽可能做出贡献,并继续关注下周的热门存储库汇总。
作何:Ismael Garcia
【智答专家】您身边免费的GPT4.0人工智能Ai助手,文本生成,问答,多语言支持, 个 性化建议,图片生成,代码纠正等等。