首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大鲸鱼crush
掘友等级
研⑨生
|
中国人民大学
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
85
文章 85
沸点 0
赞
85
返回
|
搜索文章
最新
热门
TokenSkip:让大模型「跳步骤」推理,速度翻倍
本文将为你层层拆解TokenSkip的算法设计、理论支撑与实战效果。我们从一个简单问题开始:如果模型能“想得更快”,它是否还能“想得更好”?
NVIDIA提出Hymba网络,Mamba+Attenation解决transformer的长序列低效难题
本文详细讲解了NVIDIA 本月提出的 Hymba 模型架构。该架构结合了SSM和transformer,解决了传统架构处理长序列成本过高的问题
详解Transformer 键值 (KV) 缓存
随着模型变得越来越复杂和庞大,推理速度优化变得尤为重要,尤其是对于用户期望即时回复的聊天应用。键值缓存用于提升transformer架构模型的响应速度,本文将深入了解它的工作原理及其应用场景
Tokenformer: 下一代Transformer架构
本文提出了Tokenformer架构,其优势在于增量学习能力:在增加模型尺寸时,无需从头开始重新训练模型,大大降低了成本。 本文由北大和谷歌进行合作,一作是北大在读博士,代码已开源
Adaptive-RAG:基于问题难度的自适应RAG框架
Adaptive-RAG是一种智能化的检索增强生成(简称RAG)系统。与传统RAG系统不同,Adaptive-RAG能够根据用户提问的难度自动选择最合适的处理模式,从而实现最优回答质量
CRAG: 提升RAG鲁棒性的升级版架构
在大型语言模型(LLMs)领域,检索增强生成技术的出现极大地提高了模型的表现。然而,RAG的性能严重依赖于检索文档的质量。为了解决这一问题,研究者提出了纠正式检索增强生成方法CRAG
如何评估检索增强生成(RAG)系统:RAGAS框架与基于LlamaIndex的实现代码
本文首先介绍 RAGAS文章中提出的 RAG 评估指标(这是一个用于评估 RAG 流程的开源框架),然后再以 LlamaIndex 为例,实现整个评估过程。
Qwen1.5模型文本分类微调实战教程
大家好啊!今天咱们来聊聊怎么给大语言模型"调教"一下,让它在文本分类这个任务上玩得更溜。具体来说,我们要用Qwen1.5这个模型来做文章。别看这活儿听着高大上,其实做起来也没那么难。
详解SCRAM安全认证协议
在这个数字化时代,保护在线身份至关重要。SCRAM作为一种先进的认证机制,正在悄然保护着我们的数字生活。它是如何工作的?为什么如此安全?本文将揭开SCRAM的神秘面纱
深入浅出SAML认证机制:原理与基于python的demo实现
大家好!今天我们要聊一个听起来很"高大上"的话题 - SAML。别被这个名字吓到,它其实是我们在互联网世界中的一个重要但低调的朋友。 那么,SAML是什么呢?
下一页
个人成就
文章被点赞
212
文章被阅读
73,016
掘力值
3,311
关注了
3
关注者
79
收藏集
0
关注标签
7
加入于
2022-05-03