首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
余磬TuT
掘友等级
LLM算法工程师
gogogo!!!
获得徽章 6
动态
文章
专栏
沸点
收藏集
关注
作品
赞
73
文章 57
沸点 16
赞
73
返回
|
搜索文章
最新
热门
LLM代码实现-Qwen(模型微调)
简介 LLM 通用模型在各种任务上表现良好,我们可以将它们用作对目标任务进行微调的基础。 微调允许我们使模型适应目标域和目标任务,使其可以更好地完成我们所需要的特定的任务。 目前模型微调方法主要有 F
LLM代码实现-Qwen(Function Calling)
简介 Function Calling 是一种让 Chat Completion 模型调用外部函数的能力,可以让模型不仅仅根据自身的数据库知识进行回答,而是可以额外挂载一个函数库,然后根据用户提问去函
LLM代码实现-Qwen(挂载知识库)
为什么要挂载知识库? LLM 在回答用户的问题时可能会产生幻觉,或者由于训练数据中不包含用户想要的内容而无法回答,通常情况下我们可以选择微调模型或者外挂知识库来缓解这类问题。微调模型的对数据和算力都有
LLM代码实现-Qwen(下载和调用)
Qwen 基础模型已经稳定训练了大规模高质量且多样化的数据,覆盖多语言(当前以中文和英文为主),Qwen 目前有多个版本:1.8B、7B、14B、72B,同时还开源了 Qwen-VL、Qwe
LLM常见问题(RAG部分)
1. 什么是 Graph RAG? Graph RAG 是由悦数图数据提出的概念,是一种基于知识图谱的检索增强技术,通过构建图模型的知识表达,将实体和关系之间的联系用图的形式进行展示,然后利用大语言模
LLM常见问题(思维链变体部分)
1. 为什么需要思维树 Tree of Thoughts(TOT)? 对于需要探索或预判战略的复杂任务来说,传统或简单的提示技巧是不够的。ToT 维护着一棵思维树,思维由连贯的语言序列表示,这个序列就
LLM常见问题(思维链部分)
1. 什么是思维链提示? 思维链(Chain-of-thought,CoT),指的是一系列有逻辑关系的思考步骤,形成一个完整的思考过程。人在日常生活中,随时随地都会用思维链来解决问题,比如工作、读书经
LLM常见问题(幻觉部分)
1. 什么是大模型幻觉(Hallucination)? 大语言模型的模型幻觉问题是指其可能生成看似合理但实际上不准确或不符合事实的内容。处理大语言模型的模型幻觉问题需要采取一些方法和策略,通过挂载文档
LLM常见问题(Attention 优化部分)
1. 传统 Attention 存在哪些问题? 传统的 Attention 机制忽略了源端或目标端句子中词与词之间的依赖关系。 传统的 Attention 机制过度依赖 Encoder-Decoder
LLM常见问题(优化加速部分)
1. 当前优化模型最主要技术手段有哪些? 当前优化模型最主要技术手段概括来说有以下三个层面: 算法层面:蒸馏、量化 软件层面:计算图优化、模型编译 硬件层面:FP8(NVIDIA H系列GPU开始支持
下一页
个人成就
文章被点赞
173
文章被阅读
38,655
掘力值
903
关注了
7
关注者
36
收藏集
0
关注标签
12
加入于
2023-10-30