首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
安全风信子
掘友等级
实习安全工程师
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
30
文章 30
沸点 0
赞
30
返回
|
搜索文章
安全风信子
实习安全工程师
·
4天前
关注
48_动态架构模型:NAS在LLM中的应用
引言 大型语言模型(LLM)在自然语言处理领域的突破性进展,很大程度上归功于其庞大的参数量和复杂的网络架构。然而,随着模型规模的不断增长,计算资源消耗、推理延迟和部署成本等...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
47_历史里程碑:从ELIZA到Transformer
引言:跨越半个世纪的对话AI演进之旅 在当今的数字时代,我们已经习惯于与智能助手对话、向大语言模型提问,甚至依赖它们生成创意内容。然而,这看似理所当然的人机对话能力,实际上...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
46_LLM幻觉问题:来源与早期研究_深度解析
引言:幻觉——大型语言模型的阿喀琉斯之踵 大型语言模型(LLM)在自然语言处理领域展现出了令人惊叹的能力,能够生成连贯的文本、回答复杂问题、进行创意写作,甚至在某些专业领域...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
45_混合专家模型:MoE架构详解
引言:从密集到稀疏的模型架构革命 在大语言模型的发展历程中,参数规模的扩张一直被视为提升性能的主要途径。然而,随着模型参数达到数百亿甚至数千亿级别,传统的密集型模型架构面临...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
44_Falcon与Phi:高效开源模型
深度解析:数据质量对小模型的独特提升 引言 在大语言模型的发展历程中,长期存在一种主流观点:模型参数量越大,性能越好。然而,随着计算资源消耗和能源成本的持续攀升,这种"越大...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
43_PaLM与Gemma:谷歌LLM演进
引言:谷歌在大语言模型领域的探索之路 在人工智能发展的浪潮中,谷歌一直扮演着关键的技术引领者角色。从最初的神经机器翻译到如今的通用人工智能,谷歌通过持续的技术创新推动着自然...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
42_大语言模型的计算需求:从GPU到TPU
引言:大语言模型时代的计算革命 随着2025年大语言模型技术的持续突破和规模化应用,计算资源已成为推动AI发展的关键驱动力。从最初的CPU计算,到GPU加速,再到专用AI加...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
41_涌现能力:从zero-shot到in-context学习
引言 在人工智能领域,2022年以来,大语言模型(LLM)展现出的一系列惊人能力引发了广泛关注。其中最令人着迷的现象之一,就是涌现能力(Emergent Abilities...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
40_大模型优化与压缩技术:2025年的实践与突破
2025年,随着大语言模型的规模和复杂度不断提升,模型优化与压缩技术已成为AI产业落地的关键瓶颈和研究热点。根据最新统计,顶级大语言模型的参数规模已突破万亿级别,如Deep...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
39_统一多模态理解与生成:2025年的技术融合与创新_深度解析
想象一下,未来的AI助手不仅能够理解你的文字和语音,还能像人类一样自然地解读图像、视频,甚至能够根据你的描述创作出高质量的图像和视频内容。这种全面的多模态能力,正在从科幻变...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
38_多模态模型:CLIP的视觉-语言对齐_深度解析
想象一下,当你看到一张小狗在草地上奔跑的图片时,你的大脑立刻就能将视觉信息与"小狗"、"草地"、"奔跑"等概念联系起来。这种跨模态的理解能力对于人类来说似乎是理所当然的,但...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
37_开源LLM:LLaMA与Mistral的突破_深度解析
在人工智能领域,2025年已经成为开源大语言模型的黄金时代。从Meta的LLaMA系列到欧洲初创公司Mistral AI的创新突破,开源LLM正在重塑整个AI生态系统的格局...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
36_T5与编码器-解码器架构
T5(Text-to-Text Transfer Transformer)是由Google Research于2019年提出的一种革命性的预训练语言模型。它的核心创新在于提...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
35_BERT与RoBERTa:优化编码器模型
目录 1. BERT模型概述:双向编码器的突破 2. Transformer编码器架构详解 3. BERT预训练策略与实现细节 4. RoBERTa的诞生:优化BERT的挑...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
34_GPT系列:从1到5的架构升级_深度解析
目录 引言:GPT系列的革命性旅程 GPT-1:奠基之作(2018) 2.1 核心架构设计 2.2 预训练与微调范式 2.3 实验与性能 GPT-2:规模扩展与零样本学习(...
0
评论
分享
安全风信子
实习安全工程师
·
4天前
关注
33_LLM的定义与规模化:参数与计算力
引言:大语言模型的崛起与规模效应 在人工智能发展的长河中,2022年底ChatGPT的横空出世标志着大语言模型(LLM)时代的正式开启。自那时起,LLM技术以惊人的速度演进...
0
评论
分享
安全风信子
实习安全工程师
·
5天前
关注
32_语音到文本:Whisper与LLM集成_深度解析
第1章:Whisper语音识别技术概述 1.1 Whisper模型简介与发展历程 OpenAI的Whisper作为一款开源的语音识别系统,在过去几年中经历了显著的演进。20...
1
评论
分享
安全风信子
实习安全工程师
·
5天前
关注
31_NLP数据增强:EDA与NLPAug工具
一、引言:数据增强在现代NLP中的核心价值 在自然语言处理(NLP)领域,高质量的标注数据是构建高性能模型的基础。然而,获取大量准确标注的数据往往面临成本高昂、耗时漫长、覆...
1
评论
分享
安全风信子
实习安全工程师
·
5天前
关注
29_序列标注技术详解:从HMM到深度学习
1. 序列标注概述 序列标注(Sequence Labeling)是自然语言处理(NLP)中的一项基础任务,其目标是为序列中的每个元素分配一个标签。在NLP领域,序列标注技...
1
评论
分享
安全风信子
实习安全工程师
·
5天前
关注
28_主题建模详解:从LDA到BERTopic - 深度解析与教学
1. 引言:主题建模的重要性与发展历程 主题建模(Topic Modeling)是自然语言处理(NLP)领域的核心技术之一,旨在从大量非结构化文本中自动发现潜在的主题结构和...
1
评论
分享
下一页
个人成就
文章被点赞
30
文章被阅读
697
掘力值
117
关注了
0
关注者
1
收藏集
0
关注标签
22
加入于
2025-09-19