首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
人工智能
华山风清扬
创建于2024-11-27
订阅专栏
我的人工智能学习笔记
等 5 人订阅
共46篇文章
创建于2024-11-27
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
解析 Stable Diffusion 模型的 Checkpoint 文件
在机器学习领域,特别是深度学习中,Checkpoint 文件是一个重要的概念,它保存了模型的权重参数和优化器的状态,以便后续继续训练或用于推理任务。对于 Stable Diffusion(以下简称 S
H100 集群:大语言模型背后的技术引擎
H100 集群指的是基于 NVIDIA Hopper 架构的 H100 GPU 所组成的计算集群。这种集群是为了解决大规模人工智能模型(如 GPT、BERT、DALL·E 等)训练和推理过程中的高计算
Mixture-of-Experts:大语言模型的多路专家架构详解
在现代深度学习领域,尤其是大规模语言模型的研究中,Mixture-of-Experts(简称 MoE)是一种高效的模型架构设计。其核心思想是通过一组独立的“专家”(子模型)来协同完成任务,并根据输入数
FastYolo 模型:高效目标检测的关键技术解析与应用实例
1. FastYolo 模型的基本概念 FastYolo 是一种基于 YOLO(You Only Look Once)系列的目标检测模型,旨在在保证高准确率的同时,显著提升推理速度。它通过优化模型架构
FastYolo 模型:高效目标检测的关键技术解析与应用实例
1. FastYolo 模型的基本概念 FastYolo 是一种基于 YOLO(You Only Look Once)系列的目标检测模型,旨在在保证高准确率的同时,显著提升推理速度。它通过优化模型架构
机器学习中的过拟合与欠拟合现象:理论与实践案例研究
在机器学习领域中,过拟合(Overfitting)与欠拟合(Underfitting)是两个关键但相互对立的现象。理解这两种现象有助于构建更高效、更泛化的模型。下面我们将从理论、实际案例及代码示例等多
动态权重优化:深度学习中的灵活策略与实际应用
动态权重优化(Dynamic Weight Optimization, DWO)是一种旨在根据模型的训练进展、数据特性或任务优先级,动态调整损失函数中各部分权重的策略。在深度学习中,模型通常需要优化一
动态权重优化:深度学习中的灵活策略与实际应用
动态权重优化(Dynamic Weight Optimization, DWO)是一种旨在根据模型的训练进展、数据特性或任务优先级,动态调整损失函数中各部分权重的策略。在深度学习中,模型通常需要优化一
词袋模型:基础理论与实际应用场景详解
词袋模型(Bag of Words,简称 BoW)是自然语言处理(NLP)和文本挖掘领域中的一种经典技术。它的核心思想是将一段文本转化为一个向量,向量的每个维度代表一个词汇,向量的值则是该词汇在文本中
深入解读多头自注意力机制:原理与实践
在现代深度学习模型中,多头自注意力机制(Multi-head Self-attention)是 Transformer 架构的核心组件。它的引入极大地提升了自然语言处理(NLP)任务的效果,使得模型能
先进密集嵌入模型解析与实践:以 voyage-2 为例
在人工智能领域,密集嵌入模型(Dense Embedding Models)是现代自然语言处理(NLP)系统中的核心技术之一。通过将高维的稀疏数据转化为低维的密集表示,这些模型显著提升了文本分类、信息
探讨向量搜索与基于关键词的搜索:概念、应用场合及区别
在现代信息检索与人工智能领域,向量搜索和基于关键词的搜索是两种常见且重要的技术。两者各有适用场景,并在不同的需求下展示了不同的优势与限制。 向量搜索的概念与原理 向量搜索是一种基于向量空间的检索方法,
RAG 应用中的数据召回率及其应用的探讨
深入理解 RAG 应用中的数据召回率及其应用 数据召回率是 RAG(Retrieval-Augmented Generation)应用中一个至关重要的性能指标,它衡量模型在检索阶段中成功找到相关数据的
Milvus:为存储和检索高维向量设计而生的 AI 时代数据库
在当今的大数据时代,非结构化数据正以指数级的速度增长,包括文本、图像、音频和视频等形式。要在这些数据中进行快速高效的搜索和管理,传统的关系型数据库往往显得力不从心。这种背景下,Milvus 作为一款专
为什么 BERT 不采用原始 Transformer 中的正弦-余弦位置编码?
笔者在学习 BERT 架构技术时,看到书中提到了 BERT 没有采用原始 Transformer 中的正弦-余弦位置编码,但是没讲原因。 于是笔者到网上查了一番资料进行了学习。 在机器学习和深度学习的
什么是大语言模型的单词嵌入?
在大语言模型(如 GPT)中,单词嵌入(Word Embeddings)是一个极为重要的概念。它不仅是语言模型理解自然语言的基础,也是模型捕获语义关系的关键环节。通过单词嵌入,模型能够将离散的单词表示
什么是视觉语言基础模型?
2024年接近尾声,在 AI 圈子又传出一条热点新闻: 论文地址: https://arxiv.org/pdf/2412.17799 论文提到,ASAL 利用视觉语言基础模型(如CLIP)来评估模拟结
什么是大语言模型的思维链长度
大语言模型(Large Language Model, LLM)的性能近年来得到了显著提升,尤其是在处理复杂推理任务、回答问题和生成自然语言的场景中。 目前国内外的大模型也是越来越卷,大模型厂商纷纷把
深入解析 BERT 的掩码语言建模及其重要性
今天笔者在研读大语言模型的技术书籍时,学习了掩码语言建模这个章节,和大家分享一些我的理解。 BERT(Bidirectional Encoder Representations from Transf
BERT 的 Next Sentence Prediction:机制与实际应用
最近笔者在研读大语言模型的技术书籍时,遇到了 BERT 的 NSP 这个概念,对其做了一番研究,把我学习的成果以文章的形式梳理出来。 BERT(Bidirectional Encoder Repres
下一页