我们正在使用的 GPT、Gemini、Kimi、Cursor、豆包、通义千问等对话 AI 语言大模型,都属于计算机科学和人工智能的一个分支 自然语言处理(Natural Language Processing,NLP) 领域,使用了 NLP 主流架构 Transformer 的 大型语言模型(Large Language Models,LLMs) ,或者具备 多模态信息融合 能力的 多模态模型(Multi-modal Models) 。
如何区分 LLMs 和多模态模型?
通常根据它们的输入输出形式和应用场景来区分:
- LLMs(大型语言模型) 主要处理文本数据,能够理解和生成文本。它们的输入是文本,输出也是文本。应用场景包括文本生成、对话系统、文本理解、机器翻译、文本分类等。
- 多模态模型(Multi-modal Models) 处理多种类型的数据,通常涉及多模态信息融合(如图像、文本、视频、音频等)。这些模型能够在一个共享的表示空间中整合不同模态的信息,支持的应用场景包括图像描述、图像问答、文本生成图像、视频理解等。
AlphaFold2:AI 在生物学中的突破
令我印象挺深的是今年的诺贝尔化学奖颁发给了开发出能够 预测蛋白质的复杂结构 的 AI 模型 AlphaFold2。这个模型能够从蛋白质的氨基酸序列中直接预测蛋白质的 3D 结构,并且精度达到了原子级别。它被认为解决了困扰人类 50 年的蛋白质折叠难题,至于预测有什么用?可以帮助研究人员理解这些蛋白质如何在疾病中发生变化,从而提供新的治疗思路,利用好的话能够有利于药物设计 和 靶向治疗,造福全人类。
AlphaFold2 的原理和架构:
AF2的原理和架构使用端到端的深度神经网络,结合了注意力机制的Transformer,模型通过机器学习算法,利用已知的蛋白质结构数据来预测目标蛋白质的结构。通过这种方式,AlphaFold2实现了在极高精度下的蛋白质结构预测
参考文献:AlphaFold2原理和架构及其在生物学和医学领域的应用
其他计算机科学和人工智能相关类型
强化学习 (Reinforcement Learning, RL)
强化学习是一种用于决策和控制问题的机器学习方法。它通过与环境的交互,学习如何做出最优决策。RL 通过奖惩机制(奖励信号)来引导智能体学习最优行为,经过反复试错,不断优化策略,以最大化预定目标。
- 应用场景:自动驾驶、游戏 AI、机器人控制、金融决策等。
- 典型模型:Q-learning、Deep Q-Network(DQN)、AlphaGo。
强化学习最著名的应用之一就是 AlphaGo,该系统成功击败了世界围棋冠军,标志着 AI 在决策领域的突破。
生成对抗网络 (Generative Adversarial Networks, GAN)
生成对抗网络(GAN)是一种生成模型,广泛应用于图像生成、超分辨率、风格迁移、文本生成等任务。GAN 由两个部分组成:生成器 和 判别器。生成器生成尽可能真实的样本,而判别器则试图区分生成样本和真实样本。两者通过对抗训练,生成器不断改进,最终能够生成高质量的合成数据。
- 应用场景:DeepFake(深度伪造)、图像生成、艺术风格转换、超分辨率成像等。
- 典型模型:DCGAN(深度卷积生成对抗网络)、StyleGAN、CycleGAN。
GAN 技术带来了许多震撼性的应用,如 DeepFake 技术,这一技术虽然引发了一些伦理和法律问题,但也展现了生成模型的巨大潜力。
这篇文章也是我用各个厂家的AI 语言大模型引导回答就这么整合出来的。总之使用起来模型之前各有千秋,文章内容东拼西凑,至于准确性我知不道,期间也学到不少相关的知识,但愿不是左耳朵进右耳朵出,不然耽误我吹牛逼。