获得徽章 0
- #大模型日报# 预告的 CogVideoX-5B 现在正式发布!同样还是一次生成 6 秒,该模型比 2B 生成的质量更高,视觉效果也更好,INT8 精度下只需 12G 显存即可运行。需要注意的是,如果要商业用途,须登记后使用,UV 100w 之后还要额外购买。
官方还提供了一个 5B 模型的在线演示:THUDM/CogVideoX-5B-Space
此外,之前发布的 CogVideoX-2B 现在的开源协议更新成 Apache 2.0 了,这意味着可以拿来商用了!展开评论点赞 - #每日快讯# 谷歌发布了 Gemini 1.5 的 3 个新模型:
更小的 Gemini 1.5 Flash-8B,与 llama-3-70b 水平相当
更强的 Gemini 1.5 Pro(0827),编程、数学和复杂任务表现上超越 gpt4o,重回榜二
改进的 Gemini 1.5 Flash(0827),表现提升巨大,从第 23 名攀升到第 6
现在就能在 aistudio.google.com 免费试用这几个模型。展开评论点赞 - #每日快讯# xAI 官方发布新更新,需要下载 𝕏 10.56 (iOS):
图片生成提示建议
改进的模型选择器
长按编辑提示
长按 Grok 响应选择文本
新功能同样只对 Premium 和 Premium+订阅用户开放。展开评论点赞 - #大模型日报# 智谱官推宣布 CogVideoX-5B 即将开源(大概率今天),diffusers 框架已经提前完成了适配。评论点赞
- #大模型日报# InstantX 团队做的多合一的 Flux ControlNet 现在开始和 ShakkerAI 合作并推出了:Shakker-Labs/FLUX.1-dev-ControlNet-Union-Pro
该模型支持 7 种控制模式,包括 canny (0), tile (1), depth (2), blur (3), pose (4), gray (5) 和 low quality (6),并且还能和其他 ControlNet 一起使用。展开评论点赞 - #每天一个知识点# Anthropic 在他们的最新文档里的更新日志里新增了一个“系统提示词”模块,用于记录网页和客户端的默认提示词的更新。
以 Claude 3.5 Sonnet 为例,用到了非常多的提示工程技巧:
角色与背景设定:明确身份、知识范围和能力,确保用户对其期望合理。
指令清晰化:通过限制行为(如不道歉、不执行超出能力的任务)来确保输出的精准性。
分步推理:在处理复杂任务时,进行逐步思考,以减少错误。
响应适应性:根据问题的复杂性调整回答长度,以提高效率。
错误意识:提醒用户 Claude 可能出现的“幻觉”错误,增强透明度。
其他的 Opus 和 Haiku 的完整提示词都在链接里头,这里就不贴代码块了。展开评论点赞 - [undefined#undefined#] Nous Research 发布了 DisTrO(分布式互联网训练)的初步报告,这或许会成为一个革命性的系统,它旨在实现使用世界上所有的计算能力来训练共享的开源 AI 模型
DisTrO 大幅减少了 GPU 之间的通信需求,减少幅度达到 1000 倍至 10000 倍,即使在网络较慢的情况下也是如此,并且不影响收敛速度。展开赞过12 - #挑战每日一条沸点# 曾号称最好的二次元模型 Kohaku 现已开源全新版本 Zeta,该版本从 Kohaku-XL-Epsilon rev2 改进而来,主要特性如下:
出图更稳定,并且不再需要长提示词。
支持更多风格
对自然语言有更好的支持
训练集约 846 万张图片展开评论点赞 - #人工智能创作者签约季# 我们知道 Cursor 有非常方便的 Chat 和 CMD+k 功能,对于不同技术栈的项目还可以通过 .cursorrules 文件指定其 “AI 规则”。
有人整理了适用于 Cursor 的不同语言和项目的 Rules,非常方便的复制粘贴到 .cursorrules 文件中即可。展开评论点赞 - #每日快讯# ReHiFace-S 又一个实时换脸项目,只需一张照片就能将视频中的人脸实时替换。
官方宣称无需高性能显卡,只需要 GTX 1080Ti 就能进行高保真的实时换脸。所有需要的模型加起来 842MB,内置 Gradio 界面,还非常贴心的提供了百度云的下载地址...
不过似乎真实运行效果一般,Readme 提供的 Demo 更像是 deepfacelive 出来的效果,但官方没人回应。展开评论点赞