首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
Ann_
掘友等级
💙
💜
获得徽章 18
动态
文章
专栏
沸点
收藏集
关注
作品
赞
3
文章 2
沸点 1
赞
3
返回
|
搜索文章
最新
热门
RoBERTa:优化训练流程,让 BERT 更强
RoBERTa RoBERTa 是 Facebook AI 提出的 BERT 改进版本,全名是 Robustly Optimized BERT Pretraining Approach。它并没有改变
ALBERT:参数共享让 BERT 更轻更强
之前写过BERT,不了解BERT的同学可以看这个:【翻译】图解BERT、ELMo等 最近在面试,陆陆续续也收到了一些offer,但都不是很满意。还在继续找,所以闲着没事也会回顾一些基础知识。今天就说一
【翻译】MoE图解指南
原作信息 A Visual Guide to Mixture of Experts (MoE) 在看最新发布的大型语言模型(LLMs)时,你可能经常会在标题中看到 “MoE” 这个词。那么,这个 “M
【翻译】LLM智能体图解指南
LLM智能体图解指南 —— 探索单智能体与多智能体的核心组成部分 大语言模型智能体(LLM Agents)现在越来越常见,似乎已经逐渐取代了我们熟悉的“普通”对话式大模型。这些强大的能力并不是轻而易举
【翻译】图解deepseek-R1
AI大模型蓬勃发展,各个厂家百花齐放。在AI持续发展的历程中,deepseek是一个重要的节点。对机器学习研发圈来说,它的意义重大,原因包括: 开源权重,还有更小型、精简的版本, 分享并展示了如何复现
function call到MCP技术演进
可能你们也发现了,很多人都会把 Function Call 和 MCP 放在一起讲。但是讲着讲着,噼里啪啦一堆信息,看完之后大家虽然知道这两个东西是什么,却很难理解它们之间到底是什么关系,更不知道为什
Prompt Engineering:如何让大模型按要求“工作”
题接上回, 前两天同事提了个需求,被我怼了。他说现在有一些客服数据,和对应的分类,直接用deepseek分类感觉分的不是很准确,能不能做个东西让分类更精确。 我说:咱们自己调一个模型。 他:能不能用提
RAG:让AI回答更“靠谱”
前两天同事提了个需求,被我怼了。他说现在有一些客服数据,和对应的分类,直接用deepseek分类感觉分的不是很准确,能不能做个东西让分类更精确。 我说:咱们自己调一个模型。 他:能不能用RAG? 我:
ViT模型张量维度变化过程和代码解析
之前挖坑说要详细讨论一下ViT的计算过程,现在填坑。主要是根据模型论文图和论文提供的源码两部分分析。
Transformer多模态领域挖坑之作:ViT模型详细讲解
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale
下一页
个人成就
文章被点赞
2,400
文章被阅读
382,773
掘力值
12,808
关注了
99
关注者
1,068
收藏集
0
关注标签
0
加入于
2020-04-01