首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
彼岸花开了吗
掘友等级
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
0
文章 0
沸点 0
赞
0
返回
|
搜索文章
最新
热门
构建AI智能体:九十四、Hugging Face 与 Transformers 完全指南:解锁现代 NLP 的强大力量
HuggingFace是专注于NLP的开源平台,提供丰富的预训练模型、数据集和工具库(如Transformers、Datasets)。其核心优势在于易用性、社区支持和多框架兼容。Transformer
构建AI智能体:九十三、基于OpenAI Whisper-large-v3模型的本地化部署实现语音识别提取摘要
本文介绍了基于OpenAI Whisper-large-v3模型构建的语音识别API服务实践。该系统采用FastAPI框架,支持多语言识别和翻译功能,提供文件上传和Base64编码两种输入方式。项目重
构建AI智能体:九十二、智能协作的艺术:大模型上下文与Token优化指南
本文系统探讨了大模型上下文窗口与Token优化的关键技术。首先阐述了上下文窗口的概念,将其比喻为固定大小的协作白板,决定了模型单次处理的信息容量。详细介绍了扩展上下文窗口的四种方法:改进位置编码(如R
构建AI智能体:九十、图解大模型核心三大件 — 输入编码、注意力机制与前馈网络层
本文深入解析了大模型三大核心技术:输入编码、多头自注意力机制和前馈网络层,从应用视角阐述了它们的工作原理和协同效应。输入编码负责将文本转换为富含语义和位置信息的数学表示;多头自注意力机制通过多专家团队
构建AI智能体:八十九、Encoder-only与Decoder-only模型架构:基于ModelScope小模型的实践解析
本文深入探讨了大模型中的Encoder-only和Decoder-only两种主流架构。Encoder-only(如BERT)采用双向注意力机制,擅长文本理解任务,如分类、问答和情感分析,能同时分析整
构建AI智能体:八十八、大模型编辑:从一本百科全书到可修订的活页本
大模型编辑技术为解决传统语言模型知识固化问题提供了创新方案。该技术通过局部修改、内存增强和外部知识库三种方法实现精准知识更新:局部修改直接调整模型权重;内存增强添加外部记忆模块;外部知识库则结合检索机
构建AI智能体:八十七、KM与Chinchilla法则:AI模型发展的两种训练法则完全解析
摘要: 大模型训练中,如何在有限计算预算(C≈6ND)下最优分配模型参数量(N)与训练数据量(D)是关键挑战。KM扩展法则主张“模型优先”,认为增大N的收益高于D(α=0.076<β=0.103),推
构建AI智能体:八十六、大模型的指令微调与人类对齐:从知识渊博到善解人意
本文探讨了大模型从知识储备到实用助手的进化过程。首先分析了原始预训练模型存在的问题:擅长文本补全但缺乏指令理解能力,可能生成有害或无关内容。然后详细介绍了指令微调技术,通过高质量(指令-输出)数据集教
构建AI智能体:八十五、数据预处理对训练效果的影响:质量过滤、敏感内容过滤与数据去重
摘要:数据预处理是大语言模型训练的关键环节,通过质量过滤、敏感内容过滤和数据去重三重机制显著提升模型性能。质量过滤确保文本规范性和信息密度,敏感内容过滤阻断有害信息,数据去重优化知识分布。实验表明,预
构建AI智能体:八十四、大模型涌现能力的解构分析:从量变到质变的神秘跃迁
大模型涌现能力的出现标志着人工智能发展的一个重要转折点。这些能力不是通过专门编程获得的,而是模型规模达到临界点时自然产生的质变。这种现象不仅证明了规模在人工智能发展中的关键作用,也为我们理解智能的本质
下一页
个人成就
文章被点赞
1
文章被阅读
5,517
掘力值
1,191
关注了
0
关注者
8
收藏集
0
关注标签
7
加入于
2025-08-30