首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
复现系列
大橙子打游戏
创建于2022-12-01
订阅专栏
复现一些有趣的小项目,纠正各种tutorial中的纰漏
等 3 人订阅
共33篇文章
创建于2022-12-01
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Tokmon -- 监控 Claude Code 自己的 Token 消耗
我用 Claude Code 写了一个 macOS 原生 App,来监控 Claude Code 自己的 Token 消耗 起因 最近重度使用 Claude Code 做开发,每天的 token 消耗
直呼太强了!国产模型遇上国产算力
随着大模型应用进入加速落地阶段,如何以更低门槛、更高效率获得稳定算力,成为团队与开发者的共识需求。 模力方舟近期上线的「算力市场」,提供即开即用、灵活计费的国产 GPU 实例,现已全面支持 沐曦 C5
腾讯云CloudStudio让我省了9千块钱!原来程序员的第一生产力是薅羊毛?
我的MacBook,比拖拉机还慢的"生产力工具" 我的老MacBook Pro,是2018年入手的丐中丐版。当年以为自己是"极简主义",结果现在打开VSCode都能烫到煎鸡蛋。每次编译代码时风扇狂转的
还在手动写正则解析GPT的返回内容么,试试Pydantic吧少年
在开发过程中,我们经常需要与GPT等大模型进行交互,并解析其返回的内容。传统的做法可能是手动编写正则表达式来提取所需的信息,但这种方式不仅繁琐,还容易出错。今天,我将介绍一种更优雅、更高效的方式——使
当GPT遇到Music
在网上冲浪的时候,发现一个很好玩的项目,MusicGPT,这个项目有趣的点,除了是把Music和GPT结合,还有一点,是使用Rust开发的大模型应用项目,跟通常用python开发的应用截然不同。前端使
千问VL72B从下载到调用
目标:使用vllm来部署千问VL 72B模型,并使用curl来完成调用。 参考 这篇教程 来准备docker镜像 也可以直接使用vllm的官方docker镜像,但启动的时候我遇到了一些问题,没有深入去
Mochi1 -- 文生视频卷的飞起了!
Mochi 1 预览版作为一个先进的视频生成模型目前处于开放状态。在对其进行初步评估时发现,该模型具备高保真度的动态效果以及强大的指令遵循性,它的出现极大地缩减了封闭和开放视频生成系统之间的差距。 先
DeepSeek新作多模态大模型Janus重磅发布
Janus 是一种新颖的自回归框架,它统一了多模态理解和生成。它通过将视觉编码解耦为独立的路径来解决先前方法的局限性,同时仍然使用单一、统一的 Transformer 架构进行处理。这种解耦不仅减轻了
RestAPI的统一大模型推理服务LocalAI
LocalAI是 OpenAI(Anthropic 等)的免费开源替代方案,可作为本地推理的即插即用替代 REST API。它允许你在本地或本地环境中使用消费级硬件运行大语言模型(LLMs)、生成图像
在服务器上装一台MacOS
代码仓库: https://github.com/sickcodes/Docker-OSX 编译镜像: 运行命令: 注意这里的几个参数: https_proxy 需要指向一个能够连接到github的代
通义千问2VL大模型上手体验
千问的github仓库被清空了,不知道具体是什么个情况 环境准备 直接使用docker来准备基础环境,可以参考教程 需要注意,在容器内,把torch版本升级到最新以避免一些torch相关的问题 tra
快速尝试FLUX的人像摄影微调模型AWPortrait
AWPortrait-FL 是在 FLUX.1-dev 上使用 AWPortrait-XL 的训练集和近 2000 张具有极高美学品质的时尚摄影照片进行微调的。它在构图和细节方面有显著改进,皮肤和纹理
SEED-Story尝鲜
腾讯开源推出了 SEED-Story,这是一种基于SEED-X的多模态大型语言模型,能够生成由丰富且连贯的叙事文本以及在角色和风格上保持一致的图像组成的多模态长篇故事。他们还发布了 StoryStre
文生视频再添强者!智谱CogVideoX开源版极速上手
项目地址:https://github.com/THUDM/CogVideo/tree/main 真的是一个炸裂的消息。智谱开源了文生视频大模型! 赶紧上手试验一把! 1. 准备环境 使用docker
部署一个omniparse一共需要几步
OmniParse是一个平台,可将任何非结构化数据提取并解析为针对GenAI(LLM)应用程序优化的结构化、可操作数据。无论您是在处理文档、表格、图像、视频、音频文件还是网页,OmniParse都可以
我愿称之为最强开源语音模型(二)
上一篇讲过SenseVoice语音识别项目,这次我们来看一下TTS项目CosyVoice。 效果实在是过于炸裂,赶紧上手。 安装 下载所需模型 这里有一个ttsfrd包,只能在Linux系统里使用,M
快手开源的大模型能打么
Kolors是由快手Kolors团队开发的基于潜在扩散的大规模文本到图像生成模型。经过数十亿个文本-图像对的训练,Kolors在视觉质量、复杂语义准确性以及中英文字符的文本渲染方面都比开源和专有模型具
我愿称之为最强开源语音模型
在WAIC大会举办的那几天,就发现了这个开源项目!经过了这几天的使用,确实很强,在语音相关的领域,真的是一骑绝尘的存在。 语音识别 SenseVoice-Small是一种仅编码器的语音基础模型,专为快
字节送你的服务器和编程助手MarsCode,快来抢
昨天看到字节发布了MarsCode,感觉好厉害的样子,于是就迫不及待的试一下! 快速尝鲜 首先可以使用掘金账号登录,或者手机号登录,很容易。 UI设计的很优雅,是字节的风格,稳重又清晰。也符合程序员的
让千问和deepseek同时给我干活
1. 安装dify 2. 自定义调整docker-compose.yaml文件 这里我们只需要调整一下nginx的端口号,并使用宿主机的nginx来做反向代理,指向服务容器nginx即可。 然后就可以
下一页