首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
人工智能
华山风清扬
创建于2024-11-27
订阅专栏
我的人工智能学习笔记
等 5 人订阅
共46篇文章
创建于2024-11-27
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
深入解析 BERT 的 WordPiece 子词分割机制:理论与实践
笔者看书时,看到书中提到的这个 WordPiece,只是短短的一句带过。 于是查了些资料,做了深入了解。 BERT 使用的 WordPiece 词元化方法是一种基于子词分割的技术,其目的是有效地解决自
什么是人工智能领域的 dspy 框架
在人工智能和机器学习领域中,DSPY 是一个非常具有潜力的概念,其全称是 "Data-Driven Supervised Predictive Yield"。它代表了一种基于数据驱动的监督预测收益的框
什么是人工智能领域的 LangChain
在人工智能与自然语言处理领域的不断发展中,新的工具和框架不断涌现,以简化构建复杂应用的过程。LangChain 便是其中一项令人瞩目的技术。LangChain 是一种专为支持语言模型的应用程序而设计的
浅谈数据挖掘中的监督学习,半监督学习和无监督学习
监督学习是机器学习中的一种常见类型。其基本思想是计算机在有明确标签的数据上学习,利用这些已知的信息来推导出未来未知的数据。这种学习模式就像在有老师指导的课堂上学习,有人明确告诉你问题的答案,通过反复练
什么是大语言模型的大海捞针指标
“大海捞针指标”在人工智能领域特别是在机器学习和深度学习中,通常指的是在庞大且稀疏的数据集中寻找稀有事件或少见的特征。这个比喻来自于形象化地描述从海量数据中寻找重要信息的难度,类似于从无边无际的大海中
什么是大语言模型的上下文窗口
在大语言模型的使用中,“支持 32k 上下文”的意思是该模型可以处理并记住最多 32,000 个标记(tokens)的输入。这些标记通常是文本的最小组成部分,可以是一个字符、一个单词,或一个词组的部分