复现系列

复现系列

复现系列

复现一些有趣的小项目，纠正各种tutorial中的纰漏

等 3 人订阅共33篇文章创建于2022-12-01

Tokmon -- 监控 Claude Code 自己的 Token 消耗

我用 Claude Code 写了一个 macOS 原生 App，来监控 Claude Code 自己的 Token 消耗起因最近重度使用 Claude Code 做开发，每天的 token 消耗

1月前
545
1
1

Tokmon -- 监控 Claude Code 自己的 Token 消耗

直呼太强了！国产模型遇上国产算力

随着大模型应用进入加速落地阶段，如何以更低门槛、更高效率获得稳定算力，成为团队与开发者的共识需求。模力方舟近期上线的「算力市场」，提供即开即用、灵活计费的国产 GPU 实例，现已全面支持沐曦 C5

6月前
300
1
评论

直呼太强了！国产模型遇上国产算力

腾讯云CloudStudio让我省了9千块钱！原来程序员的第一生产力是薅羊毛？

我的MacBook，比拖拉机还慢的"生产力工具" 我的老MacBook Pro，是2018年入手的丐中丐版。当年以为自己是"极简主义"，结果现在打开VSCode都能烫到煎鸡蛋。每次编译代码时风扇狂转的

1年前
289
1
评论

腾讯云CloudStudio让我省了9千块钱！原来程序员的第一生产力是薅羊毛？

还在手动写正则解析GPT的返回内容么，试试Pydantic吧少年

在开发过程中，我们经常需要与GPT等大模型进行交互，并解析其返回的内容。传统的做法可能是手动编写正则表达式来提取所需的信息，但这种方式不仅繁琐，还容易出错。今天，我将介绍一种更优雅、更高效的方式——使

1年前
370
1
评论

当GPT遇到Music

在网上冲浪的时候，发现一个很好玩的项目，MusicGPT，这个项目有趣的点，除了是把Music和GPT结合，还有一点，是使用Rust开发的大模型应用项目，跟通常用python开发的应用截然不同。前端使

1年前
181
点赞
评论

千问VL72B从下载到调用

目标：使用vllm来部署千问VL 72B模型，并使用curl来完成调用。参考这篇教程来准备docker镜像也可以直接使用vllm的官方docker镜像，但启动的时候我遇到了一些问题，没有深入去

1年前
404
点赞
评论

Mochi1 -- 文生视频卷的飞起了！

Mochi 1 预览版作为一个先进的视频生成模型目前处于开放状态。在对其进行初步评估时发现，该模型具备高保真度的动态效果以及强大的指令遵循性，它的出现极大地缩减了封闭和开放视频生成系统之间的差距。先

1年前
474
1
评论

Mochi1 -- 文生视频卷的飞起了！

DeepSeek新作多模态大模型Janus重磅发布

Janus 是一种新颖的自回归框架，它统一了多模态理解和生成。它通过将视觉编码解耦为独立的路径来解决先前方法的局限性，同时仍然使用单一、统一的 Transformer 架构进行处理。这种解耦不仅减轻了

1年前
314
点赞
评论

DeepSeek新作多模态大模型Janus重磅发布

RestAPI的统一大模型推理服务LocalAI

LocalAI是 OpenAI（Anthropic 等）的免费开源替代方案，可作为本地推理的即插即用替代 REST API。它允许你在本地或本地环境中使用消费级硬件运行大语言模型（LLMs）、生成图像

1年前
553
点赞
评论

RestAPI的统一大模型推理服务LocalAI

在服务器上装一台MacOS

代码仓库： https://github.com/sickcodes/Docker-OSX 编译镜像：运行命令：注意这里的几个参数： https_proxy 需要指向一个能够连接到github的代

1年前
348
点赞
评论

通义千问2VL大模型上手体验

千问的github仓库被清空了，不知道具体是什么个情况环境准备直接使用docker来准备基础环境，可以参考教程需要注意，在容器内，把torch版本升级到最新以避免一些torch相关的问题 tra

1年前
733
点赞
评论

快速尝试FLUX的人像摄影微调模型AWPortrait

AWPortrait-FL 是在 FLUX.1-dev 上使用 AWPortrait-XL 的训练集和近 2000 张具有极高美学品质的时尚摄影照片进行微调的。它在构图和细节方面有显著改进，皮肤和纹理

1年前
520
点赞
评论

快速尝试FLUX的人像摄影微调模型AWPortrait

SEED-Story尝鲜

腾讯开源推出了 SEED-Story，这是一种基于SEED-X的多模态大型语言模型，能够生成由丰富且连贯的叙事文本以及在角色和风格上保持一致的图像组成的多模态长篇故事。他们还发布了 StoryStre

1年前
379
点赞
评论

文生视频再添强者！智谱CogVideoX开源版极速上手

项目地址：https://github.com/THUDM/CogVideo/tree/main 真的是一个炸裂的消息。智谱开源了文生视频大模型！赶紧上手试验一把！ 1. 准备环境使用docker

1年前
439
点赞
评论

文生视频再添强者！智谱CogVideoX开源版极速上手

部署一个omniparse一共需要几步

OmniParse是一个平台，可将任何非结构化数据提取并解析为针对GenAI（LLM）应用程序优化的结构化、可操作数据。无论您是在处理文档、表格、图像、视频、音频文件还是网页，OmniParse都可以

1年前
1.2k
1
评论

部署一个omniparse一共需要几步

我愿称之为最强开源语音模型（二）

上一篇讲过SenseVoice语音识别项目，这次我们来看一下TTS项目CosyVoice。效果实在是过于炸裂，赶紧上手。安装下载所需模型这里有一个ttsfrd包，只能在Linux系统里使用，M

1年前
1.3k
点赞
评论

我愿称之为最强开源语音模型（二）

快手开源的大模型能打么

Kolors是由快手Kolors团队开发的基于潜在扩散的大规模文本到图像生成模型。经过数十亿个文本-图像对的训练，Kolors在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面都比开源和专有模型具

1年前
190
点赞
评论

我愿称之为最强开源语音模型

在WAIC大会举办的那几天，就发现了这个开源项目！经过了这几天的使用，确实很强，在语音相关的领域，真的是一骑绝尘的存在。语音识别 SenseVoice-Small是一种仅编码器的语音基础模型，专为快

1年前
504
点赞
评论

字节送你的服务器和编程助手MarsCode，快来抢

昨天看到字节发布了MarsCode，感觉好厉害的样子，于是就迫不及待的试一下！快速尝鲜首先可以使用掘金账号登录，或者手机号登录，很容易。 UI设计的很优雅，是字节的风格，稳重又清晰。也符合程序员的

1年前
282
2
评论

字节送你的服务器和编程助手MarsCode，快来抢

让千问和deepseek同时给我干活

1. 安装dify 2. 自定义调整docker-compose.yaml文件这里我们只需要调整一下nginx的端口号，并使用宿主机的nginx来做反向代理，指向服务容器nginx即可。然后就可以

2年前
527
点赞
评论

让千问和deepseek同时给我干活