首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Snorlax143
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
12
文章 12
沸点 0
赞
12
返回
|
搜索文章
赞
文章( 12 )
沸点( 0 )
Attention升级面
1.传统Attention 存在哪些问题? 传统Attention存在上下文长度约束问题; 传统Attention速度慢,内存占用大; 2. Attention优化方向? 提升上下文长度 加速、减少内
【基于《大模型+向量库》的文档对话】
一、LLMs 存在模型幻觉问题,请问如何处理? 数据清洗和预处理:在训练大语言模型之前,对数据进行仔细的清洗和预处理是至关重 要的。删除不准确、噪声或有偏差的数据可以减少模型幻觉问题的出现。 多样化训
Bug和解决方案
服务器上遇到的bug合集,服务器上遇到的bug合集,服务器上遇到的bug合集,服务器上遇到的bug合集,服务器上遇到的bug合集,服务器上遇到的bug合集
大模型综述
《Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond》论文阅读
Attention is all you need 论文阅读
主流的序列转换模型都是基于复杂的循环神经网络和卷积神经网络,都包含一个encoder和decoder。表现最好的模型通过attention机制连接encoder和decoder。因此,提出一个新的、简
milvus安装
Milvus是一个开源向量数据库,专门用于存储和检索大规模向量数据。大模型在处理自然语言任务时会生成高维向量,Milvus可以高效地管理和查询这些向量数据,从而加速模型的推理和数据检索过程。
Minicpm-V LoRA微调
Minicpm-V2.6------LoRA微调代码解读,官方文档+finetune.py文件的注释
what and why agent
what agent and why agent? agent四大特性、核心组件 agent的未来······
第2章 基于大模型的Agent技术框架
2.1 Agent的四大要素 2.2 Agent的规划和决策能力 2.3 Agent的各种记忆机制 2.4 Agent的核心技能:调用工具 2.5 Agent的推理引擎 2.6 其他Agent认知框架
Qwen2.5のFunction-Calling
Function Calling是指一种能力,让大型语言模型能够调用外部函数或API来执行特定任务。这种功能使得LLM不仅可以生成文本,还可以与外部系统交互,从而提供更实用、更具体的帮助。
下一页
关注了
3
关注者
1
收藏集
0
关注标签
5
加入于
2024-08-16