获得徽章 0
- #挑战每日一条沸点# 【人声音效调得又准又快!DiffVox 来了!】想让一段普通人声秒变「专业混音棚」质感?DiffVox 是索尼与伦敦玛丽女王大学联合打造的人声效果小工具,它能根据你的参考音色,自动把干声转成更贴近目标风格的高级听感——亮度、空间感、厚度都能聪明调整。你只需给它一段声音,它就像你的「声效造型师」,帮你完成风格迁移与细节打磨。无需音频工程背景,DiffVox 让复杂的人声处理变得轻松又有趣。
准备探索声音的更多可能吗?「DiffVox: 声音区分效果模型」现已上线至 OpenBayes 公共教程板块,快来试试吧!go.openbayes.com
展开评论点赞 - #挑战每日一条沸点# 【AI 也能看懂你的小情绪?Facial Emotion Recognition 数据集来了!】有没有这种时刻:对方一句话没说,你就能感觉到 TA 有点不开心?情绪这种东西,人都不一定看得准,更别说模型了。为了让 AI 也学会「看脸色」,Facial Emotion Recognition 数据集正式登场!它收录了开心、愤怒、厌恶、悲伤、惊讶、恐惧、中性共 7 类常见情绪,图像来自 FER2013 与 RAF-DB,并经过严格的人脸筛选、去噪和质量增强处理,甚至将原本的灰度图统一转换为 RGB,让数据更干净、更一致、更适合模型训练。
想让你的模型不仅会认人,还会认情绪?「Facial Emotion Recognition 面部情感识别数据集」现已上线至 OpenBayes 公共数据集板块,快来试试吧!go.openbayes.com
展开评论点赞 - #挑战每日一条沸点# 【TCR 研究也能很轻松!DeepTCR 上线!】搞不懂 TCR 序列?分不清哪个 T 细胞认哪个抗原?DeepTCR 是 Johns Hopkins 团队打造的 TCR 分析小工具,专为看懂这些序列而生。它就像你的「免疫翻译官」,把序列交给它,就能预测 TCR 认不认某个肽,还能自动把相似的 TCR 分成小团体,并用各种可视化清晰呈现。无需深度学习背景,DeepTCR 让复杂的免疫信息变得简单又好玩。
想看看 TCR 世界的「隐藏剧情」?「DeepTCR:深度学习预测 TCR-肽亲和力-5090」现已上线至 OpenBayes 公共教程板块,快来试试吧!go.openbayes.com
展开评论点赞 - #挑战每日一条沸点# 【目标检测再进化!YOLOv13 来了!】还在为检测速度和精度难两全发愁?YOLO 家族的新成员 YOLOv13 给出了答案!由清华大学、太原理工大学和西安交通大学联合推出,它在延续 YOLO 系列实时检测优势的基础上,引入了超图增强、高阶语义建模和轻量化结构重构等创新机制,让模型更聪明、更轻、更快!在 MS COCO 和 Pascal VOC 等主流数据集上,YOLOv13 实现了全面领先的检测性能,不仅识别更准,还能轻松部署到边缘设备。
想体验什么叫「速度与精度的平衡艺术」?「一键部署 Yolov13」现已上线至 OpenBayes 公共教程板块,快来试试吧!go.openbayes.com
展开评论点赞 - #挑战每日一条沸点# 【复杂文档不怕多!MonkeyOCR 来了!】报告太长、表格太乱、公式一堆?别慌——MonkeyOCR 来帮你理清一切!它由华中科技大学联合金山办公推出,它能自动识别文档中的文字、表格、公式和图片,并还原清晰结构,让复杂文档瞬间可读。基于创新的结构–识别–关系(SRR)范式,在表格和公式解析上分别提升 8.6% 和 15%,多页处理速度高达每秒 0.84 页。支持中英双语、适配多种文档类型,是数字化文档解析的高效利器!
想让 AI 帮你「看懂」复杂文档?「MonkeyOCR:基于结构-识别-关系三元组范式的文档解析」现已上线至 OpenBayes 公共教程板块,快来试试吧!展开赞过评论1 - #挑战每日一条沸点# 【看病记录太长?交给 MedGemma!】病历动辄几十页、检查报告术语一堆、患者描述又含糊不清?医生每天光「读文本」就能忙到怀疑人生。冷静一下——MedGemma-27B-text-it 来了!它是 Google 专为医疗文本场景打造的大模型,能够快速理解病历内容、提取关键信息,并为分诊与临床决策提供辅助参考。无论是主诉、现病史还是实验室指标异常点,都可以一键抽取,甚至还能给出具有临床逻辑的初步判断方向。不需要额外标注,也不必手动整理,信息将以清晰结构直接呈现,让诊疗流程更高效、更省时。
想真正把病历处理变成「高效可读」?「一键部署 MedGemma-27B-Text-IT 医学推理大模型」现已上线至 OpenBayes 公共教程板块,快来试试吧!go.openbayes.com
展开评论点赞 - #挑战每日一条沸点# 【长文也能「压缩成图」?DeepSeek-OCR 来了!】还在为长文档占满 token、模型记不住上下文发愁?DeepSeek 团队提出了一个更聪明的做法——把长文本先变成图像,再用视觉模型进行高效压缩与还原。核心引擎 DeepEncoder 能在高分辨率下保持低计算开销,把成千上万字的信息压成少量视觉 token:压缩比 < 10× 时可达到 97% 还原精度,甚至在 20× 压缩下依然保有可读内容。这意味着长篇 PDF、论文、档案、古籍扫描件,都能「不切片、不降质」地被模型整体理解。长文再长,也能一次读完、一次记住。
想让大模型真的「看得下去」「记得住」长文?「DeepSeek-OCR:『视觉压缩』替代传统字符识别」现已上线至 OpenBayes 公共教程板块,快来试试吧!go.openbayes.com
展开评论点赞 - #挑战每日一条沸点# 【3D 模型也能像乐高一样拆?Hunyuan3D-Part 来了!】做 3D 的时候,是不是一想改细节,就发现整模型是「一坨」,根本拆不开?想单独动一下轮子、车门、翅膀、附件——结果一改就全形变?腾讯混元团队这次直接给出新解法:Hunyuan3D-Part,可以把一个完整 3D 模型自动分解成结构清晰、可控制的独立部件!它由 P3–SAM 和 X–Part 两大核心模型组成,可将整体 3D 模型自动分解为结构清晰、可编辑的独立部件,支持 50+ 组件生成。像汽车模型这样,车身、轮胎、车灯都能一键拆开,直接用于绑定、替换、重组或 3D 打印。
想真正把 3D 模型变成「可控资产」?「Hunyuan3D-Part:组件式 3D 生成模型」现已上线至 OpenBayes 公共教程板块,快来试试吧!go.openbayes.com
展开赞过评论2 - #挑战每日一条沸点# 【AI 也会「画画倒带」?Paints-Undo 来了!】lllyasviel 于 2024 年推出的 Paints-Undo,可以模拟人类真实绘画过程,让一张完成的作品「回到」最初下笔的那一刻。你只需输入一张最终图,它就能像按下 Ctrl+Z 一样往回撤绘制步骤,从上色、阴影、线稿到草稿与空白画布都能复原;同时还支持多帧插值,让绘画阶段之间的过渡更加平滑顺畅。项目包含单帧模型和多帧模型:前者负责生成关键绘画节点,后者负责在节点之间补齐连贯过程,组合使用即可得到逼真的绘画演示视频。无论是用来学习绘画、制作可视化教学,还是单纯想看看「艺术是怎么一步步被画出来」,PaintsUndo 都能让你清晰看到创作背后的思考与构图变化。
想亲眼见证一幅画是如何诞生的吗?「Paints-Undo 一张图生成绘画全过程 Demo」现已上线至 OpenBayes 公共教程板块,快来试试吧!go.openbayes.com
展开评论点赞 - #挑战每日一条沸点# 「Bald Classification Dataset 秃头分类数据集已上线!你的发际线,AI来审判」
Bald Classification Dataset 秃头分类数据集内含 20 万张「强者」发型图,精准分为「Bald」与「NotBald」两派。从此,识别人群中那颗最亮的星,不再依靠肉眼。本项目既可用于模型训练,亦可辅助计算团队「含秃率」。致敬每一位为代码献上头发的大佬!你的头发,还好吗?
「Bald Classification Dataset 秃头分类数据集」现已上线至 OpenBayes 公共数据集板块,快来看看身边的人是否符合「强者」发型!go.openbayes.com
展开评论点赞