AI大模型的兴起,各种智能体的出现,最近就一直在忙碌收集一些关于各个行业的数据集,希望能在搭建智能体的时候有所帮助,因为我们想做一个垂直类的智能体的时候,除了结合通用大模型已外,我们还可以通过给智能体准备一些垂直类的知识点,提高智能体的专业性。这样可以让自己搭建的智能体更牛逼。
今天就分享一个 收集来的 中文对联数据集(对对子)数据集。
数据特点
结构标准清晰:每条数据包含一组对联,分别由“上联”和“下联”组成,格式整洁,便于程序读取与训练使用。
✍️ 语言工整规范:数据内容严格遵循传统对联创作原则,具有高度对仗性和平衡性,是训练中文生成和语言对仗能力的优质语料。
文化底蕴浓厚:内容涵盖历史典故、自然风光、节庆祝福、哲理诗意等多个文化主题,展现中华语言艺术之美。
格式统一,易处理:Excel格式,每行一对联,字段清晰,便于导入AI模型训练或前后端系统使用。
数据集已整理为excel格式,需要的可获取~ www.wwwoop.com/home/Index/…