首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
hojyn
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
5
文章 5
沸点 0
赞
5
返回
|
搜索文章
最新
热门
LLM评估系列(二):LLM 乱输出难控?五篇顶会论文教你用 LLM 评估器破解五大关键场景
1 评估有害性 1.1 构建流程 论文展示了如何利用 LLM 评估器对潜在有害响应进行评判,那些被判定有害响应会被重新生成以降低危害性。下图展示了论文中CAI框架训练流程的步骤:该流程包括一个监督学习
RAG深度解读:AI如何“边查资料边作答”,告别“胡说八道”?
一、什么是检索增强生成(RAG)? RAG(Retrieval-Augmented Generation,检索增强生成)是一种融合检索信息与生成答复能力的AI技术。 它由Facebook于2020年提
LLM评估系列(一):别再死磕人工评估!破解使用LLM 评估器的三大核心难题
前言 LLM 评估器是利用LLM评估另一个 LLM 响应质量。如今,LLM能够解决越来越多的复杂任务或开放式的任务,例如长篇文本摘要、翻译以及多轮对话等。同时,传统的评估方法在评估LLM回答的好坏方面
别再先分块了!Late Chunking:长上下文嵌入模型如何终结 RAG 检索不准的魔咒?
一、前言 在 2023 年 10 月jina ai发布了一个具有8k上下文长度的开源嵌入模型,早期的或者小型的嵌入模型通常只有512tokens,和openai同类型的embedding模型对比如下:
LLM应用评估终极指南
评估大型语言模型(LLMs)的输出对于构建稳健的 LLM 应用程序的人来说至关重要,这已不是什么秘密。然而,LLM 评估仍然非常困难——尤其是在决定测量什么以及如何测量方面。
RAG优化策略总结
一、背景 目前LLM虽然已经具备了强大的能力,但是在某些情况下,它们仍可能无法提供准确的答案。目前 LLM 面临的主要问题有: 信息偏差/幻觉: LLM 有时会产生与客观事实不符的信息,导致用户接收到
个人成就
文章被阅读
966
掘力值
104
关注了
22
关注者
1
收藏集
3
关注标签
9
加入于
2019-11-07