大家好,又见面了。本期内容为大家带来6个GitHub项目,包括1个最近超火的大语言模型,4个实用有趣的AI工具,和1个高阶AI助手。
1 DeepSeek-V3 通用大语言模型的当红辣子鸡
1.1 简介
DeepSeek-V3是一个强大的混合专家(MoE)语言模型,具有671B的总参数,每个token都激活了37B参数。
1.2 功能
deepseek-V3不用过多介绍,是近几周AI界的顶流,其主要特点是:
-
知识问答:在 MMLU、GPQA 等知识类任务中,DeepSeek-V3 的表现接近 Claude-3.5-Sonnet-1022(国际顶尖模型)。
-
长文本处理:在 DROP、LongBench v2 等长文本测评中,DeepSeek-V3 的平均表现超越了其他模型。
-
代码生成:在算法类代码场景(如 Codeforces)中,DeepSeek-V3 远远领先于其他开源模型。
-
数学能力:在美国数学竞赛(AIME 2024)和中国高中数学联赛(CNMO 2024)中,DeepSeek-V3 的表现超过了所有开源和闭源模型。
-
生成速度:60TPS(每秒生成 60个token)
-
价格便宜:
- 输入 tokens:每百万 tokens 仅需 0.5 元(缓存命中)或 2 元(缓存未命中)。
- 输出 tokens:每百万 tokens 仅需 8 元。
-
开源,支持本地部署
1.3 适用
适合所有对AI感兴趣的读者,即使你不感兴趣,也建议下载其官方客户端进行体验。
1.4 点评
直接让NVIDIA股价大跌超过12%,市值蒸发超4000亿美元,干翻一众美国拥有先天圣体(训练显卡)的大模型的价格屠夫。
2 AI Comic Factory 开源免费的AI漫画生成器
2.1 简介
假如你梦想成为一名漫画家,但缺乏一项重要技能——绘画能力,可能导致你痛失梦想。今天开始,你不用气馁了,AI Comic Factory可以帮你实现这些梦想,它可以基于你提供的描述(Prompt)为你完成一本漫画书。
2.2 功能
AI Comic Factory是一个免费开源的在线AI漫画生成工具,使用LLM和SDXL开发。用户只需输入文字描述提示词,就能生成排版后的精美漫画作品,而且支持用户设计漫画书的页面,让每个人都可以轻松创作出独一无二的漫画风格图片。与其他AI项目不同,这个项目实现了科技与艺术的融合,为漫画爱好者和喜欢尝试新技术的人提供了创作平台。其功能包括:
- 自定义场景和故事描述
- 漫画样式自定义
- 漫画布局选择
- 漫画对白设置
- 漫画页面生成
- 创建连续漫画
- 生成漫画书
2.3 适用
职业漫画家或对创作漫画感兴趣的读者。
2.4 点评
这可能是我的第一个专栏项目,毕竟它点燃了我心中的一团火😀。
3 DeOldify 老照片上色工具
3.1 简介
DeOldify是一款开源且免费的图像着色器。
3.2 功能
该项目基于深度学习实现了对黑白图像和视频进行着色的功能,主要功能或特点如下:
- 可以同时消除照片中丢失的部分
- 上色自然,比如逼真的皮肤效果
- 更详细和逼真的渲染
- 避免其他工具产生的“蓝色偏差”
- 支持视频
- NoGAN-一个新奇但非常有效的方法做GAN训练
3.3 适用
适合需要对黑白照片进行上色的读者和需要进行相关研究的读者。不适合追求新算法的读者,作者于2024年10月19日开始停止维护,他认为该技术稍微过时。
3.4 点评
早期的深度学习成功案例,依旧实用。
4 openai-edge-tts 免费文本转语音工具
4.1 简介
一个使用ege-tts的支持本地、与OpenAI兼容的语音合成(text-to-speech TTS)API,它模拟OpenAI TTS端点(/v1/audio/speech),使用户能够像使用OpenAI API一样从具有各种语音选项和播放速度的文本中生成语音。
4.2 功能
ede-tts无需安装Microsoft Edge浏览器、不依赖Windows操作系统和API密钥,就能利用微软Edge提供的在线文本转语音功能。该项目是直接调用微软Edge浏览器的文本朗读有关API实现的文本转语音功能,不需要本地部署模型,使用简单,声音效果好。主要功能或特点为:
- 使用Microsoft Edge的在线语音合成服务,完全免费
- OpenAI兼容端点:具有相似请求结构和行为的 /v1/audio/speech
- 支持的声音:将OpenAI声音(合金、回声、寓言、玛瑙、nova、微光)映射到边缘tts等价物
- 灵活的格式:支持多种音频格式(mp3、opus、aac、flac、wav、pcm)
- 可调速度:可以修改播放速度(0.25倍至4.0倍)
- 可选的Direct Ege-TTS语音选择:使用OpenAI语音映射或直接指定任何ege-tts语音
4.3 适用
需要进行文字转语音的读者,特别是对OpenAI TTS API有需要又不想付费的读者,比如不厌其烦给小朋友讲述同一个幼稚故事的爸爸。
4.4 点评
免费好用的工具,效果不错。
5 AnimatedDrawings 卡通形象的动画化AI库
5.1 简介
让自己绘制的小人偶(或更加高级的人物)实现指定的动作,甚至形成动画。
5.2 功能
这是一个功能简单但是很有意思的库,能让你的画动起来。无论是小朋友画的粗糙小人,还是专业绘画师绘制的高水平卡通人物,它都能让它们跟着你一起做动作。这也是亲子娱乐的一个很好的载体,比如父母和小朋友一起实现一部专属的动画短片。
5.3 适用
拥有有趣灵魂的我们。
5.4 点评
不得不说,非常喜欢这种有意思的小项目。
6 screenpipe 全天候录制屏幕的 AI 助手
6.1 简介
ScreenPipe是一个开源工具,可以24小时不停地录制你的屏幕和麦克风,结合大模型成为高阶AI助手。
6.2 功能
ScreenPipe连续屏幕捕获和文字识别、自动录音与会议转录,收集生活中的各种信息、结合 LLMs 的能力,实现自动记录、上下文感知的 AI 助手,其主要功能是:
- 捕获采集自动化
- 支持中文 OCR
- 数据本地存储,确保用户完全掌控自己的信息
- 跨平台:支持Mac、Windows和Linux等
- 支持个人知识管理、生产力优化和智能助手等多种应用,能与Ollama、OpenAI、Obsidian等工具无缝集成
由于其特性,根据使用的不同存在的一些问题:
- 接入互联网后监控面克风和屏幕的隐私性问题
- 数据存储的大小空间问题 ;
6.3 适用
对AI助手感兴趣的高阶玩家。
6.4 点评
随着技术的发展,Jarvis一定会到来,相信本项目一定在这个发展历程中占有一席之地。
本期内容就到这里,如果你更好的推荐或者对哪个项目特别感兴趣,欢迎在评论区给我留言,我将根据情况进行收录,并将大家喜欢的项目加入专栏,进行更加详细的介绍。我们下期再见!