首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
周末程序猿
掘友等级
鹅厂程序猿
代码搬运工
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
101
文章 100
沸点 1
赞
101
返回
|
搜索文章
赞
文章( 100 )
沸点( 1 )
机器学习|从0开始大模型之模型DPO训练
上一篇如何使用LoRA训练大模型,但是模型的效果不是很好,可以看如下对话: ... 对话的偏好不是我们想要的答案,所以需要继续微调训练,这篇文章就介绍DPO。
机器学习|从0开始大模型之位置编码
上一篇完成DPO的训练,但是模型的输出效果不好,因此在找原因,于是将理论重新过一遍,以发现每个环节需要优化的地方,本文就是理论知识:《Transformer模型中的位置编码》。
Kaze AI 最强在线水印去除工具,强是真的强,贵也是真的贵
Kaze AI:最强在线水印去除工具 Kaze AI[5] 是一款在线水印去除工具,注册即赠送 3 积分。其去除效果堪称目前市面上最强。不过,目前仅提供在线版本,且无 API 可用,价格也相对较高。有
相比 Postman,Bruno 为何如此优秀?
Bruno 是一款快速、Git 友好的开源 API 客户端,旨在彻底改变以 Postman、Insomnia 和其他类似工具为代表的现状。
机器学习|从0开始大模型之模型LoRA训练
继续《从0开发大模型》系列文章,上一篇用全量数据做微调,训练时间太长,参数比较大,但是有一种高效的微调方式LoRA。 1、LoRA是如何实现的? 在深入了解 LoRA 之前,我们先回顾一下一些基本的线
ChatGPT|Prompt中的CoT和ReAct
我们在写Prompt可能经常遇到不准确或者无法获得外部知识,因此本文讲述CoT和ReAct如何运作并提高大语言模型准确性。 第一部分:CoT(思维链) 1、什么是CoT 通用的Prompt: CoT
云原生二十篇|Kubernetes核心原理
本文主要介绍k8s的核心原理,包括浅析各个模块的运行逻辑和k8s中的网络通讯。 第一部分:模块 核心架构 以上是在k8s中的各个模块,下面就来详细介绍一下各个模块的作用和原理。 1、API Serve
开源项目|高性能内存分配库mimalloc
简介 mimalloc 是微软研究院在2019年发表并开源的一个新的内存分配库(https://github.com/microsoft/mimalloc)。
云原生二十篇|详解Prometheus
监控一直是我们在开发过程中老生常谈的话题,大多数开发认为监控是运维的工作,我们只需要关注业务逻辑,打印对应的日志,增加上报数据,或者是用一些轻量的开源监控即可,是这样么? 其实随着云原生的架构演进,微
机器学习|从0开发大模型之PyTorch2.0
最近在忙一些AI相关的项目,也看了一些资料,而很多内容没有系统的总结,虽然研究生阶段是搞机器学习的,但是这个领域的发展太快了,一年不学就已经跟不上了😂,为了解决系统的总结一些知识点,于是我又开始了漫长
下一页
个人成就
文章被点赞
251
文章被阅读
72,443
掘力值
2,720
关注了
81
关注者
157
收藏集
5
关注标签
41
加入于
2019-03-06