GitHub 一周热点汇总第24期(2024/05/19-05/25) ,本周内容包括了桌面版ChatGPT,低代码平台,可视爬虫,网页一键转LLM数据和改良版VIM。一起来看具体内容吧。
#1 ChatGPT
- 项目名称:ChatGPT - 桌面版ChatGPT
- GitHub 链接:github.com/lencx/ChatG…
- 上周 Star 数:2600+
本项目的内容很直接就是ChatGPT的桌面版,支持Mac, Windows 和 Linux。
当然啦现在OpenAI已经出了官方版的客户端,所以也迫使本项目从实用价值转为了学习价值。目前来说还有一些窗口期,因为目前官方客户端只有Mac,window的用户还是可以使用本项目的。
项目使用rust和TS开发,用Tauri来做跨平台客户端。所以对于想研究相关技术的同学,可以好好学习下本项目。另外本项目的作者也在网上做过不少分享,可以搜一下。
说实话现在很多围绕OpenAI的创业者的现状,感觉就是在走钢丝,虽然他们找到的点可能确实非常的好,但是一旦OpenAI决定自己做这件事,那就一下没活路了。所以每次OpenAI的DevDay一来,就有好多的创业公司倒下。
#2 nocobase
- 项目名称:nocobase - 低代码平台
- GitHub 链接:github.com/nocobase/no…
- 上周 Star 数:2100+
NocoBase 是一个极易扩展的开源无代码开发平台。 不必投入几年时间、数百万资金研发,花几分钟时间部署 NocoBase,马上拥有一个私有、可控、极易扩展的无代码开发平台。
之前项目作者写了一篇文章在网上非常伙,详细介绍了做低代码平台nocobase的起因、经过、思路以及现状。目前已经收入超过200多万,长期的开源坚持,到今天的开花结果,值得所有开源从业者借鉴和思考。
NocoBase的与众不同之处:
- 数据模型驱动。NocoBase 采用数据结构与使用界面分离的设计思路,可以为数据表创建任意数量、任意形态的区块(数据视图),每个区块里可以定义不同的样式、文案、操作。这样既兼顾了无代码的简单操作,又具备了原生开发的灵活性。
- 所见即所得
NocoBase 可以开发复杂和有特色的业务系统,但这并不意味着需要复杂和专业的操作。只需一次点击,就可以在使用界面上显示出配置选项,具备系统配置权限的管理员可以用所见即所得的操作方式,直接配置用户的使用界面。
- 一切皆插件
NocoBase 采用插件化架构,所有新功能都可以通过开发和安装插件来实现,扩展功能就像在手机上安装 APP 一样简单。
#3 EasySpider
- 项目名称:EasySpider - 可视爬虫
- GitHub 链接:github.com/NaiboWang/E…
- 上周 Star 数:2000 +
EasySpider是一个可视化浏览器自动化测试/数据采集/爬虫软件,可以使用图形化界面,无代码可视化的设计和执行任务。只需要在网页上选择自己想要操作的内容并根据提示框操作即可完成任务的设计和执行。同时软件还可以单独以命令行的方式进行执行,从而可以很方便的嵌入到其他系统中。
支持多种数据格式的输出,如 CSV、JSON、Excel 等,方便后续的数据分析和处理。
项目开源免费无广告、跨平台支持,还有很多非常不错的特性如下。
为了更直观的理解可以在什么情况下使用本项目,下面是两个示例场景。
示例1
(右键)选中一个大商品块 -> 软件自动检测到同类型商品块 -> 点击“选中全部”选项 -> 点击“选中子元素”选项 -> 点击“采集数据”选项,即可采集到所有商品的所有信息,并分成不同字段保存。
示例2
(右键)选中一个商品标题,同类型标题会被自动匹配,点击“选中全部”选项 -> 点击“采集数据”选项,即可采集到所有商品的标题信息。
同时,选中全部后如果选择“循环点击每个元素”选项,即可自动打开每个商品的详情页,然后可以再继续设置采集详情页的信息。
#4 firecrawl
- 项目名称:firecrawl - 网页转LLM数据
- GitHub 链接:github.com/mendableai/…
- 上周 Star 数:1400+
FireCrawl是一款创新的爬虫工具,它能够无需站点地图,抓取任何网站的所有可访问子页面。与传统爬虫工具相比,FireCrawl特别擅长处理使用JavaScript动态生成内容的网站。此外,它还提供了一个易于使用的API,让开发者能够轻松实现内容的爬取和转换。
本项目除了爬取内容外,更多的是关注在将数据转换为LLM-ready的数据,对于大模型来说,如何快速消化和处理互联网上海量的信息,是模型内容质量的关键。尤其是最近的一段时间,在这个话题上有不少项目都很突出,比如Jina AI 的Reader API。其实他们俩个是非常非常相似的,思路基本上是一样的。
现在项目还是非常早的阶段,还不太适合自部署。在使用上除了API外,还提供了Python和Node的SDK,以及Langchain Integration 、 Llama Index Integration 。
如果直接用在线服务的话,使用方式非常简单,只需要简单两步
- 输入目标网站的URL
- 点击Run
然后就可以在下面以markdown格式呈现的返回结果。页面右面还有接口可以查看网络爬虫任务执行中的状态,选择对应的接口就行。
#5 neovim
- 项目名称:neovim - 改良版VIM
- GitHub 链接:github.com/neovim/neov…
- 上周 Star 数:1300+
Vim 是一款功能强大的文本编辑器,拥有庞大且不断发展的社区。这款编辑器已有 20 年历史,我觉得对于Linux的用户,没人会不知道Vim。而且有非常多的人是vim的拥趸,非常喜欢使用它进行各种任务。
但是 Vim 二十多年的发展历程中,它积累了大约 30 万行可怕的 C89 代码,很少有人能看懂或有勇气去弄乱这些代码,而它的维护者实际只有一个人。这些沉重的负担,让Vim 根本无法跟上其插件生态系统的发展速度。
而neovim就是希望通过重构Vim,来实现一个更良性的社区,从而为所有用户改进编辑器。
neovim支持的特性包括:
- 现代的GUI
- 通过任何语言访问 API
- ,包括 C/C++、C#、Clojure、D、Elixir、Go、Haskell、Java/Kotlin、JavaScript/Node.js、Julia、Lisp、Lua、Perl、Python、Racket、Ruby、Rust
- 嵌入式、可编写脚本的终端仿真器
- 异步作业控制
- 多个编辑器实例之间的共享数据(shada)
- XDG 基础目录支持
- 与大多数 Vim 插件兼容,包括 Ruby 和 Python 插件
如果你也喜欢使用vim,并且想找一个更加现代化的版本,那么我觉得可以试试neovim。