首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
数据堂
掘友等级
数据堂(北京)科技股份有限公司,成立于2011年(股票代码:831428),专业的人工智能数据服务提供商,致力于为全球人工智能企业提供数据获取、处理及数据产品服务。
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
TTS走向拟人化时代:数据堂高质量语音资源全面支撑模型升级
TTS语音合成技术趋势 · 个性化表达需求增强 语音合成不再局限于基本的信息传递功能,而是逐步向“拟人性”演进。用户期望语音能够表现出不同的性格特征,如温柔、干练、幽默或权威感。这对TTS模型提出了更
破局多语之邦,如何让AI听懂印度方言?
印度,一个拥有14亿人口的国家,不仅是全球增长最快的数字经济体之一,更是一座“语言的博物馆”——22种官方语言以及众多方言汇聚于此。随着印度经济快速发展和数字化转型深入推进,人工智能技术正加速渗透至印
具身智能的下一步:如何构建跨场景通用训练数据集?
具身智能“大脑”的训练高度依赖于从真实物理环境中获取的多模态交互数据。如何解决物理世界数据匮乏问题,已成为当前具身智能技术演进过程中亟待突破的关键瓶颈。
千万级成品数据集:OCR全能选手的“硬核底座”
近期,谷歌发布的新一代推理模型Gemini 2.5 Pro,堪称AI领域的最强选手,尤其在OCR(光学字符识别)领域上更是展现出超强能力,无论是复杂的手写字体、古籍文献,还是多语言混杂的票据,其近乎“
CoT 数据集如何让大模型学会「一步一步思考」?
CoT 的核心在于要求模型在输出最终答案之前,显式输出中间逐步的推理步骤,这种机制显著提高了模型的准确性与可解释性。
全双工分轨语音数据集:让AI实现无缝对话
全双工语音交互是一种允许设备在接收语音的同时并行处理和响应的技术。在传统半双工模式下,用户需要说完一句话后等待系统响应,交互效率低且体验不自然;而全双工交互支持边听边说、实时打断和无效语音拒识等。
【技术人必看】INTERSPEECH2025-MLC-SLM挑战赛:1500小时多语种语音数据集+双任务赛制,全面解锁语音AI新边界!
由数据堂主办,中国移动、Meta、Google、 Samsung、Naver联合赞助的INTERSPEECH2025多语种对话语音语言模型(MLC-SLM)研讨会正式对外发布!
完全自动驾驶车辆何时才能成为现实
尽管没有具体答案,但鉴于近年来的大量创新,自动驾驶仍处于一个令人兴奋的时代。其中许多发明来自波士顿,包括Analog Garage致力于技术工作的工程师。在Analog Garage,我与多位专家讨论
视觉系统对自动驾驶至关重要|数据堂
自动驾驶汽车(AV)的承诺是,其将比人为控制的车辆安全得多,并大幅减少事故的发生。它需要众多技术的支持,才能在没有驾驶员驾驶的情况下运行,这些技术包括摄像头、激光雷达、雷达、超声波、车辆对一切(V2X
挖掘中国方言语音数据的重要性与应用
中国是一个语言文化多样的国家,拥有丰富多样的方言。方言是中国语言宝库中的一颗璀璨明珠,记录着各地区的独特文化和语言特点。在数字化时代,挖掘和利用中国方言语音数据具有重要的意义。本文将探讨中国方言语音数
下一页
个人成就
文章被阅读
22,131
掘力值
927
关注了
0
关注者
2
收藏集
0
关注标签
4
加入于
2023-04-10