首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
HuggingFace
掘友等级
开发者社区
|
HuggingFace
The AI community building the future.
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
319
文章 319
沸点 0
赞
319
返回
|
搜索文章
最新
热门
让 LLM 来评判 | 选择 LLM 评估模型
基础概念 什么是评估模型? 评估模型 (Judge models) 是一种 用于评估其他神经网络的神经网络。大多数情况下它们用来评估生成文本的质量。 评估模型涵盖的范围很广,从小型的特定分类器 (例如
让 LLM 来评判 | 基础概念
基础概念 什么是评估模型? 评估模型 (Judge models) 是一种 用于评估其他神经网络的神经网络。大多数情况下它们用来评估生成文本的质量。 评估模型涵盖的范围很广,从小型的特定分类器 (例如
自动评估基准 | 一些评估测试集
一些评估测试集 如果你感兴趣的任务已经得到充分研究,很可能评估数据集已经存在了。 下面列出了一些近年来开发构建的评估数据集。需要注意的是: 大部分数据集有些 “过时”,因为它们是在 LLM 出现之前构
基于开放模型的推理时计算缩放
过去几年,大语言模型 (LLM) 的进程主要由训练时计算缩放主导。尽管这种范式已被证明非常有效,但预训练更大模型所需的资源变得异常昂贵,数十亿美元的集群已经出现。这一趋势引发了人们对其互补方法的浓厚兴
自动评估基准 | 技巧与提示
过去几年,大语言模型 (LLM) 的进程主要由训练时计算缩放主导。尽管这种范式已被证明非常有效,但预训练更大模型所需的资源变得异常昂贵,数十亿美元的集群已经出现。这一趋势引发了人们对其互补方法的浓厚兴
自动评估基准 | 设计你的自动评估任务
设计你的自动评估任务 选择数据集 做评估时,你可以选择现有的数据集 (参考 一些评估数据集 页面) 作为测试集,也可以设计自己的数据集。有一点非常重要,请注意:评估的结果与评估的数据集质量高度相关 。
自动评估基准 | 基础概念
基础概念 注:本文内容与我写的 通用评估博客 存在部分重叠 什么是自动评估基准? 自动化基准测试通常按照以下方式工作:你希望了解你的模型在某些方面的表现。这些“某些方面”可以是一个明确定义的具体任务,
人工评估 | 技巧与提示
技巧与提示 建议阅读本文之前先阅读 "Using human annotators" 部分。本文将介绍使用人工标注构建评估数据集时的一些实用建议。 任务设计 简单至上:标注任务避免不必要的复杂。将标注
欢迎 PaliGemma 2 – 来自 Google 的新视觉语言模型
我们很高兴迎来 Google 全新的视觉语言模型 PaliGemma 2,这是 PaliGemma 的一个新版本。与其前代产品一样,PaliGemma 2 使用强大的 SigLIP 进行视觉处理,但在
Hugging Face 机器人技术新突破
这次我们的 LeRobot 团队联合 @therobotstudio 和 @NepYope 打造了全新腱驱动(Tendon-driven)技术,以快、更准、更灵活的超凡表现,让机器人手部控制进入全新时
下一页
个人成就
优秀创作者
文章被点赞
1,226
文章被阅读
329,557
掘力值
13,715
关注了
0
关注者
789
收藏集
0
关注标签
11
加入于
2023-01-04