首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大鲸鱼crush
掘友等级
研⑨生
|
中国人民大学
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
86
文章 86
沸点 0
赞
86
返回
|
搜索文章
大鲸鱼crush
研⑨生 @中国人民大学
·
22小时前
关注
OpenAI重磅更新:o3-pro模型震撼登场,价格暴降80%
兄弟们,OpenAI最近又放大招了!两项重大更新:o3模型的价格直降80%;发布了全新的o3-pro模型。...
0
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
1月前
关注
从零构建智能对话系统:LangGraph + DeepSeek-R1 + Agentic RAG
这篇教程将讲解如何结合多种先进技术,构建一个功能强大的智能对话系统。即使你对AI领域知识不甚了解,也能轻松跟上这个教程的步伐。...
8
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
1月前
关注
Qwen3 本地部署指南:打造完全离线的AI助手
Qwen3 是阿里巴巴 Qwen 团队推出的最新开源大语言模型,它提供了令人印象深刻的性能,同时具备高度模块化和强大的工具调用能力。本指南将详细介绍如何在本地机器上部署 Q...
0
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
1月前
关注
深度学习特征融合策略梳理与指南
说到深度学习的特征融合,最近在做一个分割项目,在特征融合方面踩了不少坑,想和大家详细分享一下我的经验和理解。...
0
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
1月前
关注
PyTorch 模型训练常用加速技巧:让你的训练过程飞起来!
本文主要分享了使用pytorch训练深度学习模型时候,可以使用的十个提升模型训练速度的技巧,无需购买新硬件,即可将模型训练速度提升一倍以上...
1
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
1月前
关注
UNITE:如何用不到0.04%的计算量实现更优的大模型集成
本文讲解了ICLR 2025 Spotlight 中的UNITE这篇论文,这篇论文提出了一种大模型集成算法,通过较低的计算开销实现了模型集成与性能提升...
1
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
1月前
关注
基于PyTorch的混合专家模型实现指南
嘿,各位码农朋友们!最近我在研究这个叫"混合专家"(MoE)的模型架构,感觉这玩意简直是把我们写代码的思路搬到了AI领域,太有意思了。今天就跟大家分享一下我的心得和实现过程...
0
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
3月前
关注
TokenSkip:让大模型「跳步骤」推理,速度翻倍
本文将为你层层拆解TokenSkip的算法设计、理论支撑与实战效果。我们从一个简单问题开始:如果模型能“想得更快”,它是否还能“想得更好”?...
0
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
5月前
关注
NVIDIA提出Hymba网络,Mamba+Attenation解决transformer的长序列低效难题
本文详细讲解了NVIDIA 本月提出的 Hymba 模型架构。该架构结合了SSM和transformer,解决了传统架构处理长序列成本过高的问题...
1
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
5月前
关注
详解Transformer 键值 (KV) 缓存
随着模型变得越来越复杂和庞大,推理速度优化变得尤为重要,尤其是对于用户期望即时回复的聊天应用。键值缓存用于提升transformer架构模型的响应速度,本文将深入了解它的工...
0
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
5月前
关注
Tokenformer: 下一代Transformer架构
本文提出了Tokenformer架构,其优势在于增量学习能力:在增加模型尺寸时,无需从头开始重新训练模型,大大降低了成本。 本文由北大和谷歌进行合作,一作是北大在读博士,代...
5
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
8月前
关注
Adaptive-RAG:基于问题难度的自适应RAG框架
Adaptive-RAG是一种智能化的检索增强生成(简称RAG)系统。与传统RAG系统不同,Adaptive-RAG能够根据用户提问的难度自动选择最合适的处理模式,从而实现...
1
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
8月前
关注
CRAG: 提升RAG鲁棒性的升级版架构
在大型语言模型(LLMs)领域,检索增强生成技术的出现极大地提高了模型的表现。然而,RAG的性能严重依赖于检索文档的质量。为了解决这一问题,研究者提出了纠正式检索增强生成方...
6
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
8月前
关注
如何评估检索增强生成(RAG)系统:RAGAS框架与基于LlamaIndex的实现代码
本文首先介绍 RAGAS文章中提出的 RAG 评估指标(这是一个用于评估 RAG 流程的开源框架),然后再以 LlamaIndex 为例,实现整个评估过程。...
1
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
9月前
关注
Qwen1.5模型文本分类微调实战教程
大家好啊!今天咱们来聊聊怎么给大语言模型"调教"一下,让它在文本分类这个任务上玩得更溜。具体来说,我们要用Qwen1.5这个模型来做文章。别看这活儿听着高大上,其实做起来也...
1
2
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
10月前
关注
详解SCRAM安全认证协议
在这个数字化时代,保护在线身份至关重要。SCRAM作为一种先进的认证机制,正在悄然保护着我们的数字生活。它是如何工作的?为什么如此安全?本文将揭开SCRAM的神秘面纱...
0
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
10月前
关注
深入浅出SAML认证机制:原理与基于python的demo实现
大家好!今天我们要聊一个听起来很"高大上"的话题 - SAML。别被这个名字吓到,它其实是我们在互联网世界中的一个重要但低调的朋友。 那么,SAML是什么呢?...
0
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
10月前
关注
深入浅出JSON Web Token(JWT)认证机制:概念与具体实现demo
大家好!今天我们要聊一个在现代Web开发中非常流行的话题 - JSON Web Token,简称JWT。听起来很高大上,对吧?别担心,我们会把它掰开揉碎,让每个人都能轻松理...
3
1
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
10月前
关注
深入浅出python代码混淆:原理与实践
大家好!今天我们来聊一个有趣又神秘的话题 - Python代码混淆。听起来很高大上,是不是?别担心,我会用最简单的方式带你揭开它的神秘面纱。...
3
评论
分享
大鲸鱼crush
研⑨生 @中国人民大学
·
10月前
关注
这个网站也太炸裂了!将 GPT 原理的详细细节可视化出来了!
冲浪时候发现一个神奇网站,其将GPT模型完全可视化,并为每一步都给出了明晰的解释。 每一步展示数学原理,模型网络结构,参数构造和运行过程!可以精确到每一帧观察大模型结构变化...
1
评论
分享
下一页
个人成就
文章被点赞
224
文章被阅读
80,704
掘力值
3,516
关注了
3
关注者
85
收藏集
0
关注标签
7
加入于
2022-05-03