引言
From Data to AGI,数据是不可或缺的燃料。我们坚信对个人和组织来说,过度追求通用能力更强的基础大模型是没有意义的,只有结合自己的场景做出一系列的子任务数据集,进行Task Fine Tune才能更好地落地LLM。
为了让更多从业者意识到任务级别的数据集的重要性,我们在医疗、金融、心理、电商等多个关键领域,设计了适应不同业务需求的十余种子任务并全部开源,可以选择使用这些数据集来训练模型,让模型特定地具备这方面的能力。
我们随后的产品DataTager会帮助人们更好的制造任务级别的数据集,更详细的测评和介绍也会在随后的论文AnyTaskTune中展现。
概览
我们精心准备的数据集涵盖多个领域,每个领域都针对特定的子任务,确保数据集的实用性和针对性,详细链接请在此处访问 huggingface.co/PandaVT
数据样例
简历评估
医疗咨询增强
心理健康风险评估
酒店评论分析
呼吁
我们鼓励全球开发者、研究者及行业专家下载并使用这些数据集,基于此进行更多的创新研究和产品开发。所有数据集均可在我们的官方网站免费下载,您的参与将共同推动技术的进步和行业的革新。
我们相信,通过社区的共同努力,可以不断推动科技向前发展,解锁AI在各行各业中的潜力。
获取更多信息
欲了解更多详情或参与我们的项目,请关注我们的微信公众号或邮件panda@datatager.com
期待您的加入,与我们一同开创智能化的未来!