#每天一个知识点# upstash 团队发布了一个超大的、预处理的高质量维基百科数据集 Upstash/wikipedia-2024-06-bge-m3 ,包含 11 种语言(含中文),该数据集总共包含约 1.44 亿个向量嵌入,完全免费和开源。
评论