大模型

大模型

大模型

大模型相关技术

等 27 人订阅共60篇文章创建于2023-10-17

思维链(CoT)助力大模型提示词工作更高效

CoT可以解决对LLM 进行微调，或者通过少量提示来教会 LLM 的局限性。在本文中将探讨 CoT 提示以及如何应用 CoT 提示提升 LLM 的业务表现能力。

1年前
2.2k
3
评论

大模型提示词工程技术与艺术

大语言模型（LLM）可以在提示词工程（Prompt Engineering）的帮助下处理数学问题和常识推理等复杂任务，提示词可以指定所需的输出格式、提供先验知识或引导 LLM 完成复杂任务。

1年前
2.0k
6
评论

回顾与展望：关于大语言模型，你需要知道的在这里

随着大语言模型的到来，人工智能正在学习如何交流、理解和生成类似人类的文本。本文将盘点大语言模型技术，探讨 LLM 是什么、工作原理、为什么备受瞩目，以及如何塑造我们的未来。

1年前
1.1k
4
评论

大语言模型 (LLM) 窥探未来

从初步尝试到成为人工智能领域的万千宠爱，一种又一种的技术突破，使得大语言模型如同站在巨人的肩膀肩上，窥探着未来智能世界的无限可能。

1年前
940
5
评论

使用 Llama Index 进行模糊字符串匹配

模糊匹配是指在不完全相同的情况下找到相似字符串的过程，在文本搜索、数据清洗、自然语言处理等领域都极为重要。本文介绍模糊字符串匹配技术LlamaIndex。

1年前
1.5k
2
评论

OpenAI GPT模型演进之路（四）

自 2015 年 OpenAI 成立以来，它已经成为了人工智能领域的一股强大力量。本系列文章将回顾 GPT 模型的发展历程，分析其关键的技术突破和创新，以及探讨其对未来人工智能发展的影响。

1年前
717
2
评论

OpenAI GPT模型演进之路（三）

自 2015 年 OpenAI 成立以来，它已经成为了人工智能领域的一股强大力量。本系列文章将回顾 GPT 模型的发展历程，分析其关键的技术突破和创新，以及探讨其对未来人工智能发展的影响。

1年前
476
1
评论

微软在人工智能领域的华丽转身

本文将深入剖析微软在人工智能领域的最新举措，从硬件创新到平台构建，再到数据平台的核心角色，揭示微软如何通过技术创新和战略规划，持续保持在人工智能领域的领导地位。

1年前
157
1
评论

OpenAI GPT模型演进之路（二）

自 2015 年 OpenAI 成立以来，它已经成为了人工智能领域的一股强大力量。本系列文章将回顾 GPT 模型的发展历程，分析其关键的技术突破和创新，以及探讨其对未来人工智能发展的影响。

1年前
901
点赞
评论

OpenAI GPT模型演进之路（一）

自 2015 年 OpenAI 成立以来，它已经成为了人工智能领域的一股强大力量。本系列文章将回顾 GPT 模型的发展历程，分析其关键的技术突破和创新，以及探讨其对未来人工智能发展的影响。

1年前
727
1
评论

BERT：从理解语言到产生语言

尽管 BERT 模型在今天很少以原始形式使用，但这种模型架构仍有很多值得借鉴的地方。本文介绍其中具有代表性的 BERT 模型，探讨 BERT 的工作原理及在 NLP 中的应用。

1年前
928
点赞
评论

A Structured Self-Attentive Sentence Embedding：自注意力机制

A Structured Self-Attentive Sentence Embedding 提出了一种新的结构化自注意力句子嵌入模型，旨在通过引入自注意力机制来提高句子嵌入的精度和可解释性。

1年前
759
点赞
评论

Sequence to Sequence Learning with Neural Networks：序列到序列学习方法

在机器学习领域，序列到序列的学习任务一直是一个巨大的挑战。然而，随着神经网络的发展，尤其是深度神经网络（DNNs）和长短期记忆网络（LSTM）的出现，让我们看到了解决这一问题的希望。

1年前
645
点赞
评论

Neural Machine Translation by Jointly Learning to Align and Translate：输入输出注意力机制

注意力机制是当下深度学习中的后起之秀，了解强大的注意力技术的起源有助于我们掌握许多基于其延伸出的发展，本文将介绍这个注意力机制背后的逻辑。

1年前
311
点赞
评论

部署 ChatGLM3：从0开始实现聊天机器人

智谱AI在2023中国计算机大会（CNCC）上推出了全自研的第三代基座大模型ChatGLM3，本文将介绍如何基于 ChatGLM3 搭建客户端，从0开始实现一个聊天机器人。

1年前
1.6k
2
评论

LangChain 与 Chroma 的大模型语义搜索应用

本文探索如何使用 LangChain 和 Chroma DB 进行语义搜索，讨论索引文档、检索语义相似的文档、实现持久化、集成大语言模型 (LLM) 以及使用问答和检索器链。

2年前
1.8k
2
评论

Attention Is All You Need：Transformer 模型

Attention Is All You Need最初被提出作为自然语言处理中 RNN 网络的替代品，是注意力机制使用方面的一大进步，是对Transformer 模型的主要改进。

2年前
940
1
评论

Chroma：构建高性能向量数据库

Chroma 是一个备受欢迎的向量数据库，它具有出色的性能和灵活性，可用于各种应用，从自然语言处理(NLP)到计算机视觉(CV)。本文帮助入门并开始构建属于自己的向量数据库。

2年前
2.0k
点赞
2

LangChain：自然语言处理新范式

随着大语言模型 (LLM) 的引入，自然语言处理已成为互联网上的热门话题。LangChain 是一个开源框架，使开发人员能够开发由大语言模型支持的应用程序，本文将将带您走进 LangChain 的世界

2年前
529
1
评论

Prompt：掌握AI生成文本的关键工具

Prompt是使用AI 技术的关键工具，本文将深入探讨 Prompt 的基本概念和使用方法，帮助更全面地了解这个强大的AI生成工具。

2年前
1.1k
点赞
评论