首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
居然JuRan
掘友等级
给我一个酸菜的缸,腌透悲伤
|
无用组织协会会长
大模型教程 公众号 【码上有模力】
获得徽章 17
动态
文章
专栏
沸点
收藏集
关注
作品
赞
257
文章 151
沸点 106
赞
257
返回
|
搜索文章
最新
热门
面字节豆包大模型岗,三轮技术面都问了啥?
算法面经|字节豆包大模型方向,三轮技术面复盘 一共三轮技术面,整体从 模型与推理优化 → 训练与对齐 → RAG 与产品思考 逐步深入,面试官风格偏理性讨论,问题非常贴近真实大模型研发流程。这里简单整
AI自动画界面?Google这个开源神器让前端工程师失业了
AI自动化界面?Google这个开源神器让前端工程师"失业"了 当产品经理说"给我画个界面",AI说"我来" 你有没有遇到过这种场景:产品经理拿着需求文档找到你,说"这个功能需要一个搜索框、几个筛选条
AI工具"翻车"现场:为什么你学了那么多,还是用不好AI?
当AI让死人"复活"创业:一场真实的翻车现场 今天,我用AI查了个资料,结果差点被气笑了。 我想了解一下Anthropic这家公司(就是做Claude那家),于是问了某个国内知名的AI产品:"Anth
终于有人把大模型讲明白了:LLM 从入门到精通全解析
当计算机开始"学习":一场从指令到智能的范式革命 过去一年,人工智能彻底改变了世界的运行方式。ChatGPT的出现让几乎每个行业都感受到了震动,从写作到编程,从客服到法律咨询,我们与技术互动的方式正在
一张日落照片,为什么传统数据库"看不懂"?揭秘向量数据库的魔力
一张日落照片的困境:为什么传统数据库"读不懂"它? 想象一下,你刚刚拍了一张绝美的日落山景照片——层峦叠嶂的山峰轮廓,天空被染成橙红色,云层像燃烧的火焰。你想把它存进数据库,以后方便检索。 如果用传统
大模型瘦身术:量化与蒸馏技术全解析
为什么要给大模型"瘦身"? 在AI技术飞速发展的今天,大语言模型已经成为各行各业的得力助手。但你是否知道,部署一个大模型的成本有多高? 一个千亿参数级别的模型,不仅需要占用大量的存储空间,在实际运行时
全量微调 vs LoRA:一篇文章彻底搞懂参数高效微调
引言:微调很重要,但成本能降96%吗? 当我们拿到一个大语言模型(如Llama、Qwen)时,常常发现它在某些任务上表现不够好。这时候,**微调(Fine-tuning)**就成了提升模型能力的关键手
部署大模型需要多少GPU显存?一文教你精准计算
引言:部署大模型的第一道门槛 当我们准备部署一个大语言模型并提供服务时,最先遇到的问题往往是:我到底需要准备多少GPU显存? 这不仅关系到硬件成本,更直接影响服务的并发能力和响应速度。今天,我们就以L
DeepSeek-R1-Distill-Qwen-7B vLLM 部署调用
本文介绍了使用vLLM框架部署和调用DeepSeek-R1-Distill-Qwen-7B模型的方法。vLLM是一个高效的大语言模型推理系统,具有内存管理优化、高吞吐量和易用性等特点。文章提供了环境准
抽丝剥茧的Transformer详解
注意力机制是自然语言处理(NLP)中基于Encoder - Decoder 的**神经机器翻译**(Neural Machine Translation )系统的一种改进。后来,这种机制被用于其他领域
下一页
个人成就
文章被点赞
265
文章被阅读
53,417
掘力值
2,789
关注了
30
关注者
207
收藏集
1
关注标签
13
加入于
2019-01-16