
获得徽章 7
- 近期,OpenAI 发布通用视觉大模型 Sora ,这也是继文本模型ChatGPT和图片模型Dall-E之后,又一极具颠覆性的大模型产品,人们重新思考了生成式 AI 在视觉内容创作领域的应用前景,内容创作工作流有望被颠覆。
我们今天要为大家分享的这篇博文,作者认为 Sora 代表了Transformer、NaViT、扩散模型等一系列视觉AI技术的融合创新,是迈向通用人工智能的重要一步。
作者首先简要介绍了Sora的功能,然后详细梳理了支持Sora的各项核心技术内容,包括Transformer、ViT、ViVit、MAE、NaViT、扩散模型、Latent Diffusion Models以及最关键的Diffusion Transformer。最后,作者预测Sora未来将进一步拓展应用范围,进军三维建模领域,并最终成为类似物理引擎的通用分析工具,为视觉内容创作甚至其他各个领域带来革命性进步。Sora的诞生预示着多模态AI将逐步走向成熟与普及,人类想象力的边界将得到进一步拓展。
作者:Baihai_IDP
链接:juejin.cn
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。展开赞过评论1 - 随着 LLM 赋能越来越多需要实时决策和响应的应用场景,以及用户体验不佳、成本过高、资源受限等问题的出现,大模型高效推理已成为一个重要的研究课题。为此,Baihai IDP 推出 Pierre Lienhart 的系列文章,从多个维度全面剖析 Transformer 大语言模型的推理过程,以期帮助读者对这个技术难点建立系统的理解,并在实践中做出正确的模型服务部署决策。
本文是该系列文章的第一篇,作者的核心观点是:透彻理解 Transformer 解码器的推理过程,是实现大语言模型高性能服务的基础。
作者通过解析文本生成的流程,明确了启动阶段和生成阶段的概念,并指出了键值缓存在其中起到的关键作用,为后续优化方法做好了理论铺垫。
作者:Baihai_IDP
链接:juejin.cn
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。展开等人赞过评论4 - 随着 GPT-4 等大语言模型(LLM)的蓬勃发展,人们开始关注它们在社会伦理、安全性和偏见等方面的表现。
本文探讨了 LLM 在偏见、毒性和越狱方面的最新研究进展。作者的核心观点是,LLM 仍存在一定的偏见问题,但相关公司正在努力改进,LLM 的整体发展趋势是向好的。
作者首先介绍了 OpenAI、Google 等公司采取的伦理政策措施,以及通过微调技术降低 LLM 偏见的具体做法。然后分多个角度讨论了最近有关检测和减轻 LLM 偏见的研究工作。最后分别从医学、政治、性别等多个维度,详细讨论了近期有关 LLM 越狱、偏见和毒性的论文成果。这些研究为继续优化 LLM 提供了有价值的洞察。
LLM 存在的偏见问题日益受到重视。相关公司和研究人员正在积极采取措施以减轻甚至消除偏见,提高模型的可控性。我们有理由相信未来这一问题能够得到持续改善,LLM的应用前景极其广阔。
作者:Baihai_IDP
链接:juejin.cn
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。展开等人赞过评论4 - 随着大语言模型(LLM)在Chatbots领域的广泛应用,如何有效评估这些基于LLM的Chatbots的质量变得日益重要,这也是一个极具挑战性的问题。
本文作者认为可以从质性评估(qualitative)和通过程序评估(programmatic)这两个维度对基于LLM的Chatbots进行评估。
作者详细探讨了以下几个方面的内容:(1)质性评估可以通过主观判断和用户打分反馈两种方式进行;(2)通过程序进行评估现市面上存在多种工具,但也存在固有的主观性问题,评价标准和题库质量能够直接影响评估结果;(3)作者基于LegalTechBot项目详细描述了结合上述两种评价方式的具体实践流程。
评估Chatbots仍然面临许多挑战,需要不断探索更科学合理的方法。本文分享了作者的实践、探索历程,能够为Chatbots相关从业人员后续研究提供参考。展开等人赞过评论4 - 随着大语言模型(LLM)在Chatbots领域的广泛应用,如何有效评估这些基于LLM的Chatbots的质量变得日益重要,这也是一个极具挑战性的问题。
本文作者认为可以从质性评估(qualitative)和通过程序评估(programmatic)这两个维度对基于LLM的Chatbots进行评估。
作者详细探讨了以下几个方面的内容:(1)质性评估可以通过主观判断和用户打分反馈两种方式进行;(2)通过程序进行评估现市面上存在多种工具,但也存在固有的主观性问题,评价标准和题库质量能够直接影响评估结果;(3)作者基于LegalTechBot项目详细描述了结合上述两种评价方式的具体实践流程。
评估Chatbots仍然面临许多挑战,需要不断探索更科学合理的方法。本文分享了作者的实践、探索历程,能够为Chatbots相关从业人员后续研究提供参考。展开评论点赞 - #生成式 AI 的下一阶段将走向何方?
编者按: 最近,随着ChatGPT的出现,很多人认为人工智能领域进入了大探索时代。然而这仅仅只是生成式 AI 发展的第一幕。
我们今天要给大家带来的这篇文章认为,生成式 AI 已经进入第二幕,即整合时代,不同系统和企业之间将出现广泛合作,以定制解决方案将 AI 能力深度嵌入各行各业。
文章详细阐述了第二幕的几个特征:(1)科技巨头纷纷与 AI 初创公司建立合作伙伴关系;(2)将生成式 AI 无缝嵌入已有产品成为主流;(3)内容公司与模型公司达成授权协议;(4)AI 与设备、系统集成;(5)初创公司通过 API 为大公司提供服务。
生成式 AI 正在重塑软件世界,小公司的长期生存面临挑战,开源仍然至关重要。未来第三幕可能是物联网与 AI、合成生物学的深度融合。我们有理由相信未来会出现更多惊喜。
作者:Baihai_IDP
链接:juejin.cn
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。展开赞过评论3 - 检索增强生成(RAG)系统最近备受关注,ChatGPT的火爆更让这类系统成为广泛讨论的热点。我们今天为大家带来的这篇文章,作者Matt Ambrogi的核心观点是:构建一个基本可用的RAG系统非常简单,但要使其达到实际生产可用的程度则异常困难,需要我们投入大量精力。
为此,作者详细介绍了10种策略,包括清洗数据、尝试不同索引类型、优化分块策略、使用 Base Prompt、使用元数据过滤、使用查询路由、研究重排序、使用查询转换、微调嵌入模型、使用 LLM 生态相关工具等,这些策略都可能不同程度地提高RAG系统的性能。
总体而言,本文对于RAG系统开发者极具参考价值,值得仔细阅读和实践。展开等人赞过评论4 - 近日,美国科技巨头 Google 宣布推出其认为规模最大、功能最强大的人工智能模型 Gemini,这种技术能够处理视频、音频和文本等不同内容形式的信息。那么机器学习模型与人类智能相比,谁的学习效率高? 许多人认为,人类大脑在学习效率上要远远优于我们目前训练的任何机器学习模型。面对这样的观点,本文作者进行了一番有趣的计算与思考。
今天为大家带来的这篇文章,作者的核心观点是:从接受的原始训练数据量来看,三岁小孩子的学习效率并没有明显优于主流大语言模型。
本文为我们提供了一个有趣的视角,来审视人类智能与机器智能之间的关系。可能为我们对两者进行更系统地比较提供参考。当然,仅仅从信息量的角度来看问题还不够全面,我们还需要考虑学习过程中的许多其他因素。不过,这绝对是一个值得思考的新视角。
作者:Baihai_IDP
链接:juejin.cn
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。展开赞过评论3 - 我们如何才能更好地控制大模型的输出?
本文将介绍几个关键参数,帮助读者更好地理解和运用 temperature、top-p、top-k、frequency penalty 和 presence penalty 等常见参数,以优化语言模型的生成效果。
文章详细解释了这些参数的作用机制以及如何在质量与多样性之间进行权衡。提高 temperature 可以增加多样性但会降低质量。top-p 和 top-k 可以在不损失多样性的前提下提高质量。frequency penalty 和 presence penalty 可以增加回复的词汇多样性和话题多样性。
最后,文章提供了参数配置的具体建议和技巧,供读者参考使用。选择合适的参数能显著提高语言模型的表现,更是进行 prompt engineering 的重要一环。
作者:Baihai_IDP
链接:juejin.cn
来源:稀土掘金
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。展开赞过评论1