首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
lvzi
掘友等级
获得徽章 8
动态
文章
专栏
沸点
收藏集
关注
作品
赞
46
文章 44
沸点 2
赞
46
返回
|
搜索文章
最新
热门
python科研项目 写代码指南
科研的特点 不同于开发,需求随时改 实验参数特别多 可复用性差,一个实验结束基本,如果效果不好 几乎可以宣告这部分代码没用了 写代码指南 多用字典管理 python是脚本语言,重写比找原来逻辑更快 大
直观看待temperature的影响
LLM中temperature起作用的方式朴实无华,softmax函数的特性使得 小数之间更加接近,大数之间更加分离 它的输出结果如下,
grpo思考
deepseek用的grpo训练,我觉得不符合一个不断迭代的思路,因为大量用户带来了大量对话数据,这部分数据在grpo训练中没有得到有效利用(当然,收集到了真实的用户输入数据也是很有价值的,可以作为r
【开发需求】离线huggingface
市面上竟然没有开源的轲离线部署的huggingface网站,实现 model和dataset上传下载
【开发需求】prompt管理中心
vscode中有插件/侧边栏 显示 所有prompt保存在云端,调用获取,实现多端同步 thats all 市面上已有项目 prompthub,但是不维护了,本地client没有获取auth toke
多人共用服务器抢gpu脚本
```bash #!/bin/bash # 设置检测间隔时间(秒) CHECK_INTERVAL=5 while true; do # 使用 nvidia-smi 获取所有 GPU 的显存使用情况 G
LLM领域一些词语解释
reward hacking 解释:一类现象:cot错的,结果对的 例子。 出处:(2022)Scaling Laws for Reward Model Overoptimization
sby文件分析
``` [tasks] basic bmc nofullskip prove cover noverific cover basic cover : default [options] cover:
开发一个完整的python包,需要知道的
pypi打包发布 文档 changelog setup.cfg文件怎么写 LICENSE 发版 本文以nlpertools包为例,分别介绍以上五个部分 1. pypi打包发布 参照6. 发版 2. 文
NLP面试问题整理[2018年-已过时]
开放域实体关系抽取 它的结果不是用于构建知识图谱,而是存储大量的候选关系。依据置信水平来进行使用。 bert embedding的lookup BERT如何处理超过512字符 masked
下一页
个人成就
文章被点赞
52
文章被阅读
31,421
掘力值
1,110
关注了
7
关注者
4
收藏集
0
关注标签
8
加入于
2022-07-20