首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
天何言哉
掘友等级
算法工程师
大模型预训练全流程经验
获得徽章 10
动态
文章
专栏
沸点
收藏集
关注
作品
赞
26
文章 24
沸点 2
赞
26
返回
|
搜索文章
天何言哉
算法工程师
·
7月前
关注
【vision transformer复现】vit整体架构
本文内容主要为vision transformer整体架构如何实现(包括pytorch 及 paddle版代码) 来自笔者学习paddle vit课程笔记,经过整理得来,如...
0
评论
分享
天何言哉
算法工程师
·
7月前
关注
大模型基础面试——从序列进入transformer说起(一)
【本文正在参加金石计划附加挑战赛——第一期命题】 序列输入模型(分词,embedding) 首先我们输入两句话: “我爱你中华” “你是我的眼。” 那么 它们经过token...
0
评论
分享
天何言哉
算法工程师
·
10月前
关注
einsum的不同情况
爱因斯坦求和约定(Einstein summation convention),简称EinSum,是一种表示多重索引运算的简洁记号。它不仅可以表示外积,还可以表示点积、矩阵...
0
评论
分享
天何言哉
算法工程师
·
10月前
关注
【可视化】详解RoPE代码与数学证明
题前注明: 本文的数学证明主要借鉴YaRN论文中对于RoPE的表述,小白也能看得懂,看不懂那可能是我表达有问题,请尽情提出批评建议 关于后文$e^{im\theta}$的可...
2
1
分享
天何言哉
算法工程师
·
1年前
关注
源码看MGM
众所周不知,mgm 源自于llava,那么它们在代码上有什么区别呢? 它们的投影层一致 llava_llama与mgm_llama 主要是forward函数的区别 llav...
0
评论
分享
天何言哉
算法工程师
·
1年前
关注
精度fp32、fp16、bp16的表示范围计算
题前: 学tensorRT捡起来考研的时候就写错了的浮点数的表示范围计算,我哭了鸭,我总算把这个知识点学会了啊,王道教我的时候就没教会啊TAT TLDR 指数位均为1表示特...
2
评论
分享
天何言哉
算法工程师
·
1年前
关注
超长源码:根据tensorRT源码对比学习int8量化
引入 我们其实可以看到看到trt_samples_onnx_mnist.cpp中也有对int8的处理,那么为什么还需要sampleINT8.cpp专门对int8进行处理呢?...
0
评论
分享
天何言哉
算法工程师
·
1年前
关注
TensorRT_sample_onnx_MNIST逐行中文解析
TensorRT_sample_onnx_MNIST逐行中文解析// DEFINE_TRT_ENTRYPOINTS宏用于定义TensorRT常用代码中的入口点,这些入口点通...
0
评论
分享
天何言哉
算法工程师
·
1年前
关注
面试:python内存管理原理及流程
你将得到: 完整的面试回答 一些结合业务的面试问题 结合参考文献可以更容易理解原理 图什么的后续会补的啦~ 面试的时候可以这么回答~ 首先,在内存分配上,如果超过256KB...
3
评论
分享
天何言哉
赞了这篇文章
头文件
工程师 @会持续更新自己工作学习中的积累
·
4年前
关注
面试必备:Python内存管理机制
Python作为一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言,与大多数编程语言不同,Python中的变量无需事先申明,变量无需指定类型,程序员无需关心内存管...
23
9
分享
天何言哉
算法工程师
·
1年前
关注
抖音v1版(以消息接口为例)
本篇为青训营大项目笔记,用于查漏补缺,尚未整理供食用。 注:下文的第二版指的是第一个版本合代码之后的第二版即v1版,而原始仓库的v2版本应为添加grpc微服务架构的版本,本...
0
评论
分享
天何言哉
算法工程师
·
1年前
举报
今天帮学长安装了可以在本地纯cpu 推理最高不超过8GB内存的模型外挂知识库版本,不过模型本身限制token太少以至于任务完成度不佳。
晚上还跑了datawhale 的baseline,时间序列模型使用三种树模型进行模型融合,因为设置的学习率太低收敛速度慢,想到是否可以动态调节学习率,学到了一些动态学习率衰减的方法,比如step decay等
展开
青训营-快乐出发
分享
评论
点赞
天何言哉
算法工程师
·
1年前
关注
datawhale夏令营机器学习笔记(一) | 时间序列回归预测baseline1
本文中包含的思考: 什么是时间序列回归预测问题? 为什么时间序列回归预测问题可以使用CatBoost,LightGBM、XGBoost等树模型? 为什么说树模型能够比较好地...
0
1
分享
天何言哉
算法工程师
·
1年前
举报
昨天提交了接口PR,今天下载了IDEA,jetbrain有东西的啊,这不用输命令行了诶……虽然感觉输命令行手敲还是更geek一些……apifox感觉也挺好用的样子~再说一遍!go真的太强了!!!没有之一,太方便了!优雅!只能说优雅!
青训营-快乐出发
分享
评论
点赞
天何言哉
算法工程师
·
1年前
举报
接口写完啦🫣没想到这么简单……其实是gpt的功劳,接口说明里面的数据类型是dal.message的数据类型,service做一个数据结构转换,返回一个interface接口,controller.message里组装response.
咱就是说,go确实好用啊!!爱了爱了!
青训营-快乐出发
分享
评论
点赞
天何言哉
赞了这篇文章
winjeg
小小程序员 @自由职业者
·
6年前
关注
Golang 推荐的命名规范
很少见人总结一些命名规范,也可能是笔者孤陋寡闻, 作为一个两年的golang 开发者, 我根据很多知名的项目,如 moby, kubernetess 等总结了一些常见的命名...
32
评论
分享
天何言哉
赞了这篇沸点
用户968584064433
1年前
举报
#挑战每日一条沸点#
Day08,今天学习HTTP框架,干货满满,加油
青训营-快乐出发
赞过
分享
评论
1
天何言哉
算法工程师
·
1年前
关注
交叉验证&模型集成 | datawhale夏令营NLP赛道第三阶段打卡笔记(二)
前言 根据净好大佬的两份笔记, 这里记录一下交叉验证和模型集成. 交叉验证是在kaggle教程里学的, 模型集成是抱佛脚学的. A榜笔记:https://tvq27xqm3...
1
1
分享
天何言哉
算法工程师
·
1年前
举报
今天在看目标检测综述🫣百度目标检测训练营的ppt做的可好了~
话说其实综述论文也很多,但是应该怎么找一篇好的综述论文?很多综述论文也是在浪费时间,比如人大的那个llm 综述🫠整了一堆名词解释是什么鬼……我看综述是要看名词解释吗?这又不是看法学论文,要抠概念细节!我想看的是历史啊喂!Tmd 说到这就气……
青训营-快乐出发
分享
评论
点赞
天何言哉
算法工程师
·
1年前
举报
码一下这个链接,之后按这个写文章啦嘻嘻~当然其实应该说是学习……就很理想,系统学习什么的我最爱了~🤭原来批标准化不是数据预处理方法呀……
一份简短又全面的数学建模技能图谱:常用模型&算法总结
cloud.tencent.com
青训营-快乐出发
分享
评论
点赞
下一页
个人成就
文章被点赞
47
文章被阅读
21,992
掘力值
940
关注了
9
关注者
15
收藏集
0
关注标签
9
加入于
2022-08-07