llama-index
把数据和模型整合在一起。
sententence
如何选择enbeding 模型。
词 向量。只要保持相对正确的就可以了。起到查询和匹配的就可以。对RAG的影响不是很大。只要是正确的即可。基本上能开源出来的都可以。
emmbeding模型是大模型自带的。
大模型是大脑角色。是产生在查询的过程。RAG是构建的阶段。构建索引时就需要Embeddings。离线构建。
AI是处理信息的,信息可以以不同的形态存在,如文本,图像,声音,向量。只要信息完整,什么形态都可以。因为是等价的。
向量数据库是存放向量,不是生成向量。
GPU,运算,矩阵的乘法运算。