LoRa低秩调参DeepSeek,实现事件等级辅助判断

62 阅读2分钟

站内参考文章: # 分享微调DeepSeek 1.5B模型实现药品对码的过程

首先对于大多数个人、公司来说并没有较多的硬件资源,那要怎么蹭上这波热度并让你的老板开心:固定分类、low b、简单调参就是一个很好的选择。 但不要为了使用而使用,找准使用场景,遵循STAR(场景-任务-行动-结果)。 S:现在用户很顿,不知道怎么分类事件,也没有分类规范,需要一个小功能帮他区分一下事件等级。 T:我的任务就是实现这个没有具体规范的分类功能,但有十万级人为已分类的离线数据。 A:1.寻找模型:找到一个low b模型让公司羸弱的服务器可以承载(甚至我觉得搞个随机森林就行了,无奈老板喜欢最终使用deepseek:7b,,2.清洗数据集:3.模型调参:4.考虑负载熔断:5.部署事宜: R:用户都说好!(当然不能这么说)用户反馈上报流程耗时缩短50%,提高事件上报效率。单月被上层驳回误分类误评级事件数较往月平均降低80%。 low b干大事!

我的具体调参工具: 1.LLaMA-Factory 2.模型对比: 原本是有两个方案: A:轻量化专用模型,适合事件分类规则明确、数据量中等,且需要快速响应。DeepSeek-MoELlama 3(7B/13B) + LoRA。对用的训练思路:

  • 对事件描述文本进行关键词提取(如BERT-TextRank),转化为结构化特征输入。
  • 使用Few-shot Learning减少标注数据依赖。

B:领域大模型+规则纠正,适合事件类型复杂有多模态输入。- Qwen1.5-14B 支持长上下文理解,可处理复杂事件描述文本(如用户上报的模糊描述)。 GLM-4 中文语境理解优秀,适合政务/公共安全领域事件评级。 3.数据清洗:

{  
  "text": "广州市天河区暴雨导致道路积水严重,部分车辆被困。",  
  "label": {"type": "自然灾害", "level": "较大", "result": "已调度排水车辆处置"}  
}  

4.模型部署和业务集成: 训练后合并权重,通过FastAPI提供低延迟推理服务。

总结:由于懒而且有较多训练数据还是选择了A方案。(后续再补充详细操作步骤)