【AI2的C4大规模多语言数据集,包括101种不同语言(加上“未被发现的”语言)近27tb 的干净数据】“The C4 Multilingual Dataset” https:// github.com/allenai/allennlp/discussions/5265
爱可可爱生活于2021-06-18 02:30发布的图片
评论