首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
OpenBayes贝式计算
掘友等级
人工智能、云计算服务提供商
|
贝式计算
OpenBayes贝式计算是中国领先的高性能计算服务提供商,通过为新一代异构芯片嫁接经典软件生态及机器学习模型,向工业企业及高效科研院所提供更加快速、易用的数据科学计算产品。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
1
文章 1
沸点 0
赞
1
返回
|
搜索文章
最新
热门
OpenBayes 一周速览丨OmniGen2「双轨架构」实现文本/图像分工协作,效果直逼GPT-4O;OCRBench文本识别基准数据集发布,含1K问答对
公共资源速递 4 个公共数据集: ReasonMed 医学推理数据集 Miriad-5.8M 医学问答数据集 WebClick 网页理解基准数据集 OCRBench 文本识别基准数据集 2 个公共模型
OpenBayes 一周速览丨Nanonets-OCR-s深度语义理解,精准结构化转换;HLE人类问题推理基准上线,含2.5k题目,助力封闭式评估体系构建
公共资源速递 5 个公共数据集: * Brain Tumor 脑肿瘤数据集 * HLE 人类问题推理基准数据集 * OpenThoughts3-1.2M 推理数据集 * Nemotron-Person
OpenBayes 在线教程丨狂揽 2.6k stars,MonkeyOCR-3B 在英文文档解析任务上超越 72B 模型,性能达 SOTA
如今,OCR(光学字符识别)技术早已不再局限于文字识别,而正逐步演化为更复杂的文档解析系统。从最初的简单字符提取,到近年来兴起的多模态大模型,OCR 已融入了版面理解、语义识别与结构还原等任务,在文档
OpenBayes 一周速览丨中文理解能力登顶!「小红书味」超重的大模型 dots.llm1 开源;单图重建三维场景,UniDepthV2 助力3D场景设计
公共资源速递 6 个公共数据集: LEXam 法律推理基准数据集 Llamg-Nemotron 推理数据集 DeepTheorem 定理证明数据集 Eye Detection 眼睛检测数据集
OpenBayes 一周速览丨对标GPT-4o! BAGEL统一处理多模态数据理解和生成任务; 专为软件工程任务设计, Devstral自主处理复杂工程问题
公共资源速递 2 个公共模型: BAGEL-7B-MoT Qwen3 Embedding-0.6B & Reranker-0.6B 13 个公共教程: 大模型 * 2 AI for Science *
OpenBayes 教程上新丨刷新TTS模型SOTA,OpenAudio S1基于200万小时音频数据训练,深刻理解情感及语音细节
近年来,TTS(Text-to-Speech,文本转语音)模型经历了从拼接式语音合成到统计参数合成,再到神经网络 TTS(Neural TTS)的迭代,在技术层面呈现出端到端、模块融合的趋势,在应用层
OpenBayes 一周速览|TransPixeler 实现透明化文本到视频生成;统一图像定制框架 DreamO 上线,一键处理多种图像生成任务
TransPixeler 实现透明化文本到视频生成;统一图像定制框架 DreamO 上线,一键处理多种图像生成任务
OpenBayes 教程上新丨新加坡国立大学 Show Lab 发布 OmniConsistency 模型,实现即插即用的图像风格迁移
OmniConsistency 显著提升了视觉连贯性和美学质量,实现了与 GPT-4o 相当的性能,填补了开源模型与商业模型在风格一致性上的性能差距
OpenBayes 教程上新丨谷歌发布 MedGemma,基于 Gemma 3 构建,专攻医学文本与图像理解
MedGemma 系列模型基于 Gemma 3 构建,包含谷歌在医学文本与图像理解方面最强大的开源模型,提供 2 个版本,分别为 40 亿参数的多模态版本,以及 270 亿参数的纯文本版本。
OpenBayes 一周速览|基于 LLM,Kimi-Audio 更能识别情感的语音模型;Orpheus-TTS 零样本克隆语音,实现自定义语音对话
基于 LLM,Kimi-Audio 更能识别情感的语音模型;Orpheus-TTS 零样本克隆语音,实现自定义语音对话
下一页
个人成就
文章被点赞
2
文章被阅读
9,901
掘力值
1,244
关注了
1
关注者
2
收藏集
0
关注标签
17
加入于
2023-01-09