首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
大模型算法和实践
magicwt
创建于2023-12-24
订阅专栏
体系化梳理大模型相关的论文,并对相关模型和框架进行实践
等 3 人订阅
共15篇文章
创建于2023-12-24
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
AI智能体工具调用概念梳理和工程实践(ReAct+Function Call+MCP+Manus)
大语言模型基于海量语料训练而成,因此内化了大量已有的知识和信息,但除了输入外,其无法获取到最新信息或私域知识,从而导致幻觉产生。通过引入工具调用机制,AI智能体(AI Agent)可以让大语言模型以R
从ReAct到CodeAct再到OpenManus,解析Manus背后的技术
基于大语言模型的智能体(Agent)技术正在飞速发展,相应的应用也层出不穷。笔者在以下两篇文章中,已分别对基于大语言模型的单智能体和多智能体进行详细的介绍: 《大语言模型Agent综述与实践》; 《基
DeepSeek-V3技术报告翻译
最近,DeepSeek发布的DeepSeek-V3作为开源大语言模型,以其极强的模型性能、极低的训练成本,吸引了众多关注,而DeepSeek-V3取得如此令人惊艳的效果,源于DeepSeek的研究团队
基于大语言模型的多智能体综述和实践
随着大语言模型的横空出世,生成式AI应用也在不断发展,图1列出了生成式AI应用的分级,共分为5级: L1 Tool,人类完成所有工作,基本没有任何显性的AI辅助,只是比较简单的工具,会被逐渐升级淘汰;
大语言模型Agent综述与实践
Agent是一个由来已久的概念,其可以表示一个能够感知环境、做出决策并采取行动的系统。在大语言模型横空出世之前,Agent的研究与应用已经经历了长期的发展,最近一个发展的高潮是基于强化学习的Agent
Sora相关技术解读
2024年2月16日,OpenAI发布了视频生成模型Sora,其能基于已有的文本描述、图片和视频生成新的视频,且生成的视频可支持不同尺寸和时长(最长可达1分钟),并可模拟真实物理世界的相关特性
从DDPM到DALL-E2和Stable Diffusion——扩散模型相关论文阅读(4)
DALL-E2 2022年OpenAI发表了论文《Hierarchical Text-Conditional Image Generation with CLIP Latents》,其中发布了基于文本
扩散模型论文阅读笔记
扩散模型(Diffusion Model)是继GAN、VAE后的一种生成式模型。《Denoising Diffusion Probabilistic Models》是UC Berkeley于2020年
从DDPM到DALL-E2和Stable Diffusion——扩散模型相关论文阅读(1)
扩散模型(Diffusion Model)是继GAN、VAE后的一种生成式模型,而目前在文生图领域比较流行的工具,如DALL-E2、Imagen、Stable Diffusion等,均是以上述扩散模型
从DDPM到DALL-E2和Stable Diffusion——扩散模型相关论文阅读(3)
Classifier Guidance Improved DDPM虽然对DDPM进行了改进,但在一些大数据集上(如ImageNet 256×256)生成图片的实验效果(FID)仍是低于GAN。因此,O
RAG论文阅读笔记
RAG(Retrieval-Augmented Generation,检索增强生成)由Facebook在2020年发表的论文《Retrieval-Augmented Generation for Kn
Mac本地部署大模型体验AIGC能力
介绍 随着ChatGPT的横空出世,国内互联网大厂、创业公司纷纷加了AIGC赛道,不断推出各种大模型
从DDPM到DALL-E2和Stable Diffusion——扩散模型相关论文阅读(2)
基于扩散模型生成图片的算法DDPM于2020年被提出。2021年OpenAI发表的论文《Improved Denoising Diffusion Probabilistic Models》,对DDPM
AIGC系列-CLIP论文阅读笔记
前言 随着ChatGPT的横空出现,AIGC迅速成为当下最热门的技术领域,但是构建ChatGPT的底层相关研究——NLP、多模态、大模型已陆续发展多年。作为一位非算法的研发工程师,本着持续学习、保持进
AIGC系列-GPT论文阅读笔记
前言 随着ChatGPT的横空出现,AIGC迅速成为当下最热门的技术领域,但是构建ChatGPT的底层相关研究——NLP、多模态、大模型已陆续发展多年。作为一位非算法的研发工程师,本着持续学习、保持进