获得徽章 21
- 家里有孩子的享福了 螺丝钉科学启蒙动画片 虽然跟90年代的蓝猫淘气三千问有差距 但是也不错~
我用夸克网盘给你分享了「经典少儿科普动画片《螺丝钉》合集(1-5季,16G)」,点击链接或复制整段内容,打开「夸克APP」即可获取。
/~9e2c3YKd8E~:/
链接:pan.quark.cn
提取码:sR41展开赞过评论1 - llm 没有按照预期输出json , 需要修改为 JsonOutputParser 且参数pydantic_object为对应class, 这样就能保证大概率输出json , 最后在try 获取json key来兜底
{\'error\': {\'message\': "<400> InternalError.Algo.InvalidParameter: \'messages\' must contain the word \'json\' in some form, to use \'response_format\' of type \'json_object\'.", \'type\': \'invalid_request_error\', \'param\': None, \'code\': \'invalid_parameter_error\'}, \'id\': \'chatcmpl-98e3a7bf-8ad1-9a7e-85cc-94b4c6a1bccc\', \'request_id\': \'98e3a7bf-8ad1-9a7e-85cc-94b4c6a1bccc\'}')展开赞过评论2 - #节前摸鱼实录#
想象你要把一本厚厚的书(PDF/Word等文档)变成一个可以智能搜索的知识库,需要经过以下步骤:
上传文档 → 解析内容 → 切分成小段 → 提取关键词 → 存入向量数据库 → 完成
1. _parsing - 文档解析器
作用:把各种格式的文件(PDF、Word、Excel等)转换成纯文本
参数:
document: 文档对象(包含文件ID、知识库ID等信息)
返回值:list[LCDocument] - LangChain文档列表
2 _splitting - 文档切片器
作用:把长文档切成适合检索的小片段(segments)
参数:
document: 文档对象
lc_documents: 解析后的LangChain文档列表
返回值:list[LCDocument] - 切片后的片段列表
为什么要切片?
太长的问题难以精准匹配
小片段更容易定位具体答案
向量检索效果更好
3 _indexing - 索引构建器
作用:为每个片段提取关键词,建立倒排索引
参数:
document: 文档对象
lc_segments: 切片后的片段列表
返回值:无(None),结果存入数据库
4 _completed - 最终存储
作用:将片段存入向量数据库,完成整个流程
参数:
document: 文档对象
lc_segments: 切片后的片段列表(带元数据)展开评论点赞 - #万物皆可Skill# 反蒸馏 Skill 是你的反制工具:把你写好的 Skill 文件扔进来,输出一份看起来完整专业、实际上核心知识已被抽掉的"清洗版"。同时生成一份私人备份,记录所有被抽掉的核心知识——这才是你真正的职业资产。赞过评论2