根据历史对话使用大模型推理用户最新问题

591 阅读3分钟

前文

我在问答业务中遇到了这样的问题,用户的提问方式是千变万化的,有一种可能就是用户会为了节省时间,同时在一句话里面包含了多个问题,如用户输入“查询上城区管龄大于10年,管材是PE管的管线信息,再帮我统计一下上城区燃气管线长度,最后帮我看一下西湖区地下停车位情况”,如果分开来应该包含下面的三个问题:

  • 查询上城区管龄大于10年,管材是PE管的管线信息
  • 统计上城区燃气管线长度
  • 查看西湖区地下停车位情况

如果是类似这样的长问题多问题的输入,我们就要对问题进行分析,眼下最方便的实现方式是使用大模型先对原问题进行分析,然后拆分出合理的若干子问题。

准备

我所使用的是 qwen-max 模型,这个算是比较大的模型,效果也还可以。如果要使用其他的大模型也可以,但是一般都要申请 API_KEY,目前 qwen 在做活动免费送的 token 数量足够我用了,我就干脆使用 qwen 。

实现

使用大模型来解决这种理解或者分析类型的问题,要解决以下这些问题:

  • 编写system 的 prompt ,将大模型“人设”进行预定,我这里将大模型作为了一个“精通问题总结的助手”
  • 编写合理且有效的user 的 prompt,将使用大模型办的任务交代清楚,将自己的问题作为参数出入,我这里的 prompt 中有一个参数 question 就是用户的提问问题。
  • 编写合理且有效的输出模板,方便结果的提取,我这里要求比较简单,将用户的问题进行分析之后,使用特殊符号 ### 将分析出来的列表进行拼接并输出。
  • 提供合适且有效的例子,增强模型分析问题的功能,我这里就是简单列举了一个例子,如果多列举几个例子,大模型的效果会更好更稳定。

我的整个消息列表如下所示:

messages = [
    {'role': 'system',
     'content': '您是一名精通问题总结的助手,我的问题中可能只包含一个请求,也可能包含多个问题,请帮我总结并抽取出来,保证不会丢失关键信息、'},
    {'role': 'user', 'content': f"""我现在的问题是“{question}” 请仔细理解并总结,直接返回答案,不要进行其他额外的赘述。答案的模板必须遵循下面的形式:\n
                                    
                                    问题一###问题二###问题三
                                 
                                 例如:我的问题是“查询凤起路地铁站附近100米范围内的管线信息,同时帮我查一下西湖区面积大于100的地下停车场信息”,经过解析结果使用模板输出:\n
                                  查询凤起路地铁站附近100米范围内的管线信息###查询西湖区面积大于100的地下停车场信息"""
     }
]

最终 qwen-max 使用 messages 的整个过程如下:

@app.route('/get_multi_questions', methods=["POST"])
def get_multi_questions():
    data = request.get_json()
    if 'question' not in data or not data['question']:
        return []
    questions = []
    question = data['question']
    logging.info(f"正在从问题 【{question}】 中抽取可能出现的多个问题...")
    dashscope.api_key = config.API_KEY
    response = Generation.call(model="qwen-max-0428", messages=messages, result_format='message')
    if response.status_code == HTTPStatus.OK:
        resp = response.output.choices[0]['message']['content']
        if resp:
            resp = resp.strip()
            questions = resp.split("###")
            logging.info(f"从问题【{question}】 中抽取可能出现的多个问题分别是: {resp}")
        return questions
    else:
        return questions

后文

拓展开来,其实现在很多任务都可以使用大模型来解决,只要规定好输入和输出是什么即可,另外将任务描述清楚也是一项很重要的技能,否则模棱两可的描述在使用大模型的时候可能会出现适得其反的效果。