本章内容包括:
- 为什么几乎所有产品都可以通过AI得到增强
- AI驱动的产品与“传统”软件有何不同
- AI项目常见失败原因
- AI系统的思维模型
- AI产品构建者所需技能
让我们先来一句大胆的宣言:如果你的业务涉及数字产品或服务,AI可以增强甚至彻底改变它。AI能够基于客户数据优化营销策略,自动化处理日常客户支持任务。AI还能为现有产品扩展新功能,比如智能搜索和智能聊天机器人。AI甚至可以成为新兴颠覆性产品的基础,比如Vercel的v0.dev,能让你以前所未有的速度构建和部署应用。AI已经来了,能有效整合AI的企业将拥有竞争优势。
当然,要获得这些好处,必须改变你开发和管理产品的策略、工具与流程。AI给产品开发带来了新挑战,从处理不完美的数据到管理不可预测的输出。许多项目失败,并非因潜力不足,而是团队缺乏创造这些产品的专业知识和框架。常见陷阱包括价值主张不明确、数据质量差、期望不切实际,以及低估定制化所需的工作量。
本书将引导你成功创建并交付AI驱动的产品。你将打下坚实的AI核心概念基础;掌握与技术与非技术团队合作的实用方法;探索能让你基于真实用户反馈快速创建、测试和迭代产品想法的工具;并学会如何应对新技术部署中伴随的不确定性和挑战。
1.1 用AI构建产品:现实检验
假设你是一支技术娴熟、管理良好的团队中的产品经理。你的公司提供一个金融分析平台,但它并不像一个现代化、简洁的数据产品。相反,它更像是一个堆满表格和各种可视化图表的仪表盘。这个平台主要被投资专业人士使用——资产经理、分析师以及其他量化分析师。尽管他们非常认可你们全面且可靠的数据库,但他们对用户体验越来越感到沮丧(参见图1.1示例)。他们在复杂的功能迷宫中挣扎,但你的分析显示他们仅使用了10%到20%的功能。你添加的功能越多,他们反而越多地提出个性化分析和筛选选项的需求,让你疲于应对各种请求。
与此同时,生成式人工智能(GenAI)的热潮无处不在——你的同行们都在议论它,高层领导也宣称它是能让你的产品获得竞争优势的游戏规则改变者。你的团队很棒,但你们对 AI 毫无经验。接下来该怎么办?
经过一番激烈的头脑风暴、几次用户访谈,以及大量的市场和竞争对手调研后,你决定加大投入,专注打造一个对话功能。你认为,通过在仪表盘中加入聊天界面,让用户可以用自然语言提问,将让用户体验更加流畅和灵活。
开发人员开始投入项目,兴致勃勃地试验像 GPT-4 和 Claude 这样的超大语言模型(LLM)。很快,他们遇到了难题——意想不到的成本、隐私问题和合规疑问,而这些问题无人能给出明确答案。一个月后,原型完成了,但表现惨淡。模型在测试数据上表现良好,但在真实场景的查询面前却屡屡失误。追根溯源,问题出在 AI 流水线的起点。一位从未与真实用户沟通过的数据工程师负责组建训练数据,导致数据并未贴合用户需求,模型学到了错误的模式。如今,这个错误赤裸裸地反映在最终用户的体验中。
作为工程师和用户之间的桥梁,你接过了掌舵权。你开始采访用户,收集真实的反馈,编写了一套基于真实问答对的测试集,确保模型符合实际需求。在不断调优模型的过程中,你意识到最初的野心——实现与数据的任何自由对话——过于乐观。相反,你需要聚焦于特定类型的问题和意图。这对你的用户体验设计师来说是个意外挑战。界面需要超越一般的聊天功能,引导用户提出模型能有效处理的问题。你们共同尝试了面向 AI 的界面元素,比如提示模板和建议。
最终上线时,情况参差不齐。聊天机器人依然难以承受用户的期待。尽管你努力引导用户提出合适的问题和意图,他们依然抛来意外的请求——有的过于复杂,有的偏离主题,甚至有的带有恶意误导。有些恶意用户甚至试图让模型提供未经授权的投资建议,迫使开发人员设置严格的防护措施。你急忙改进用户体验,增加更多建议、固定问题类型和操作指引。
尘埃落定后,尽管机器人存在局限,用户逐渐接受了它,满意度也在慢慢提升。不幸的是,还有一部分保守怀疑派,他们抵制新方案,坚持使用旧版本。虽然最终顺利发布,但整个过程异常疲惫,远远超出了最初的时间表。你决心下一次在规划和开发上做得更好。现在,让我们退一步,回顾这段旅程中的关键经验教训。
1.2 回顾总结
你召集团队进行回顾,总结那些拖慢开发进度的错误和挑战:
- 为了用 AI 而用 AI —— 高层领导指示你使用 AI,你则是先打造了一个解决方案,却没找到真正的问题。新功能对部分用户来说勉强有用,但很多用户还没准备好用聊天机器人,仍然继续使用传统仪表盘。
- 数据不匹配 —— 你的团队未能将用户需求与训练和评估模型所需的数据对齐。这是一个常见误区,必须学会在数据和用户之间架起桥梁。
- 最佳实践:数据对齐意味着确保用于 AI 训练的数据反映真实的用户需求和场景。数据不匹配会导致输出内容与实际需求无关。比如,一个基于过时或通用投资数据训练的金融分析聊天机器人,难以回答用户当前具体需求的问题。
- 过于关注最先进的 LLM —— 你的工程师被 AI 的热潮冲昏头脑,过度追求最新模型,结果模型规模过大、成本过高。同时,他们忽视了数据和用户体验,没有将数据、用户体验和模型有机结合,打造出一个完整的应用。
- 界面缺乏引导 —— 极简的聊天界面让用户自由发问,但你的模型无法应对如此多样的请求,尤其是在产品生命周期初期。明确的引导和保护机制可以引导用户的意图,限定在 AI 能够处理的范围内。
- 用户期望过高 —— 数字世界充斥着各种夸张宣传,每个产品都自称最好、最快、最便宜。一个容易出错的 AI 系统——尤其是刚开始时——会和你所传递的美好形象产生冲突。虽然现实的沟通可能没那么吸引人,但它有助于逐步建立信任。
- 缺乏系统化的迭代学习 —— 你像瀑布式项目管理那样,设定了固定截止日期并交付。持续反馈对 AI 成功至关重要,而最好的反馈来自于生产环境。学会早期上线,同时避免错误过多吓跑用户,通过优化逐步成熟。
团队会议后,你反思自己的表现。显然,你低估了挑战,认为自己现有的项目管理能力足以应对新的 AI 功能。在项目的日常混乱中,你完全忽视了自己的战略角色,没有为这次及未来的 AI 增强塑造激励人心的愿景。为了下一次更成功,你计划学习以下技能:
- 发现 AI 机会与估算价值创造 —— 识别并定义 AI 和自动化能创造最大价值的任务和用例。
- 理解 AI 技术 —— 掌握 AI 的“内部运作”,以有效协调跨职能产品团队的工作,并随着技术进步不断更新知识。
- 数据工作 —— 评估和监督数据获取策略,确保训练数据与用户需求对齐。
- 设计 AI 用户体验 —— 创建并管理超越图形界面的用户体验,巧妙应对 AI 的局限性。
- 管理利益相关者 —— 高效沟通 AI 相关事宜,与内外部利益相关方协作。
面对 AI 的复杂性和新颖性,你需要一个结构化框架,将技术、用户和商业三大维度结合起来。这个框架可作为你的锚点——当你迷失时,回归它以重新审视全局,分析依赖和权衡。引入 AI 系统的解剖学——一个指导你 AI 开发的整体思维模型。
1.3 AI系统的结构剖析
对于AI系统,有很多不同的思考方式。当你启动聊天机器人项目时,你让团队成员从各自的角度来构想系统。结果非常多样化:工程师绘制了可能的架构图,用户体验设计师规划了用户旅程,而数据科学家则设计了一条数据流动的管道。在项目启动会议上,大家也提出了截然不同的问题:
工程师——“我们会调用大语言模型(LLM)的API来处理用户提问并将其转化为SQL查询。我们怎么找到这个任务最合适的模型?”
用户体验设计师——“速度很重要,但信任更关键。投资专业人士期望得到可靠的答案。如果AI出错了怎么办?如何避免错误被忽视?”
数据科学家——“这取决于我们训练的效果。我们需要对话日志来微调模型,但没有历史数据。我们该如何启动日志收集?”
合规官——“这是个大问题。如果AI开始提供投资建议,我们会有麻烦。我们需要设立保护机制——是阻止某些话题、加免责声明,还是确保AI只总结已有数据而不生成新的见解?”
每个团队成员都从自己关注的视角来看待系统——技术可行性、用户体验、数据质量以及合规风险。作为产品经理,你处在核心位置,需要确保最终产品不仅功能齐全,还要可靠、用户友好并符合法规。图1.2中的思维模型捕捉了这些不同的维度。
你可以将这个模型作为蓝图,用来规划任何AI项目,协调团队及其他相关方,并随着时间推移不断根据新见解更新你的方案。接下来几节,我们将回顾该模型的组成部分,并针对我们的场景进行具体说明。
1.3.1 机会空间
我们先从业务角度出发——机会空间。如果你没有针对明确且高价值的机会,客户就看不到你的产品价值,自然不会购买或使用。相反,聚焦最佳机会能最大化AI为你的业务带来的潜力。
机会
你的AI应当解决客户现有的(或潜在的)需求、痛点或愿望。在我们的例子中,管理层被外部对AI的热情所驱动,迫使你去创造一个机会。这种“追新”思维在技术变革期间很常见,每个人都想看看新技术能带来什么。有时这会有好结果,但大多数情况下,如果你能让技术无缝匹配以客户为中心的机会,反映你所创造的价值,会更有利。机会也可以更具战略性,或者来自公司已有资源。比如,你可以利用公司多年来积累的数据集,结合AI发挥价值。或者,你团队里有一位具备机器学习背景的工程师,准备直接启动AI项目。
价值
明确机会后,你需要了解可以提供的价值。在我们的例子中,价值体现在为用户提供更灵活且个性化的现有数据访问。仪表盘中用户只能看到一小部分数据,这些数据是设计者预先固定配置的;而通过对话式访问,用户能够调用全部数据,并在特定时刻获取相关数据点。这种提升是切实可感的,使你能够提升定价并吸引更多用户。除了用户体验,AI还能通过自动化重复任务和“增强”人工输出质量(针对更复杂的任务)创造价值。
引入AI意味着需要在基础设施、开发和专业技能上进行前期投资。在此之前,请确保AI相比传统方案甚至人工流程,能带来显著价值。举例来说,如果你想用AI生成营销文案,该方案应当节省用户时间,即使他们还需要对AI生成的内容做大量编辑。在第2章,你将学习发现、评估及优先排序AI机会的流程。
1.3.2 解决方案空间
现在,让我们转向解决方案空间,在这里我们将创造价值,同时减轻可行性和可用性风险。初学团队往往只关注AI模型,但完整的解决方案空间包括三个组成部分:数据、智能(包括AI模型)和用户体验。AI治理要求会对这三者中的每一个形成约束。
数据
任何AI产品都离不开数据——这是用于训练、微调和评估模型的原材料。在我们的例子中,训练和测试数据是自然语言问题和对应SQL查询的配对。获取足够且高质量的数据通常是AI团队最大的痛点。毕竟,数据质量直接决定输出质量,从而决定你能提供的价值。我们的团队最初未能将训练数据与实际情况对齐,导致模型在面对真实用户请求时崩溃。你可能听说过“垃圾进,垃圾出”的原则,但其实数据不一定是垃圾也可能失败——任何细微的不对齐、偏差或覆盖不足都会严重影响用户体验。相反,从一开始就成功收集和管理数据,可以成为战略优势和竞争壁垒的重要组成部分。
智能
如果数据是原材料,如何把它转化为最终用户价值?这就是AI的核心,也就是我们心智模型中的智能组件。价值可以通过各种AI算法和模型来提取和生成。每个模型需要接受特定类型的输入,比如文本、图像、时间序列等。在我们的例子里,输入是用户提出的与数据相关的问题。模型需要输出特定含义的结果——在我们的案例中,是生成结构化的SQL查询以从数据库获取所需数据。要“教会”通用的大语言模型(LLM)完成这项任务,可以采用少量示例提示(few-shot prompting),为每个输入提供成功转换的示例。
正如钢铁这类原材料可以通过不同方式加工和塑形以适应不同用途,数据也可以被不同模型处理。例如,分类模型会为输入产生类别标签,生成模型会生成后续的序列内容,依此类推。
为什么这个组件不叫“模型”?因为你的系统配置很可能远比单一模型复杂。大多数应用依赖复合型AI系统,多个模型协同工作,并与其他工具和数据库集成。最后,鉴于技术还处于早期阶段,你的系统可能还需要某种人工监督。例如,聊天机器人可能会将特别复杂或模糊的请求转给人工客服,而不是直接尝试回答。
产品构建者需要扎实理解AI技术,以识别合适技术,设计复合解决方案,同时规避AI开发中的陷阱。第4至9章将带你逐步了解各种AI方法,从预测型AI到最新的生成式和智能代理AI应用。
用户体验
到目前为止,你的后端已经从数据中提炼出价值。现在,你需要确保用户能够获得这些价值。这就是UI的工作。在我们的例子中,界面是现有仪表盘上的对话式附加功能。AI根本性地改变了我们使用软件的方式,从确定性、可预测的流程转向更灵活、易出错和概率性的流程。产品构建者必须优先考虑信任,确保在这演变过程中吸引并引导用户。这意味着提供大量透明度和指导,管理AI错误,并允许用户对AI表现提供反馈。第10章你将学习应对这些挑战的策略和设计模式。
最佳实践:许多AI模型表现为“黑箱”,难以理解其输出过程。这种不透明性会阻碍信任和可用性。信心分数、模型行为清晰解释和正确使用指南等功能可以增强透明度。
AI治理
最后,AI引入了新的风险,需要管理和最小化。对于金融聊天机器人,主要风险是合规和责任。无论用户如何尝试,AI模型不应提供可执行的投资建议。可通过设置护栏限制模型响应类型来缓解风险。风险因应用而异,涵盖安全、伦理和公平等多个方面,可以通过心智模型的任一组成部分进行管理。举几个例子:
- 偏见和歧视可在数据层面加以解决。
- 隐私问题可通过自托管AI模型避免将敏感客户数据发送至云端。
- 针对误导性、有害请求的响应可在智能层面通过额外护栏阻断。
- 用户体验可以“保护”用户免受某些AI错误影响,避免基于错误输出做出错误决策。
第11章将教你如何识别和管理不同类型AI应用的治理风险。现在,让我们用图1.3中的简洁心智模型总结金融聊天机器人的关键考量。
请注意,这些组件之间存在大量相互依赖关系。一个领域的决策往往会波及其他领域,带来权衡与机遇,例如:
- 数据影响智能。训练数据的范围和质量决定了AI模型的可靠性和准确性。如果由于隐私限制导致数据有限,模型可能需要额外的微调或限制使用场景。
- 智能影响用户体验。AI模型的概率性质影响着UI中如何管理错误。例如,对话式聊天机器人可能需要输入建议或后备选项来有效处理意外查询。
- 治理约束数据和用户体验。隐私法规或伦理考量可能禁止收集某些类型的数据,限制模型性能。在用户体验方面,治理可能要求透明度或禁止某些输出,如可执行的投资建议。
1.4 通过本书学习
本书提供了构建AI驱动产品的全面视角。为了帮助你深入理解技术及其产品管理影响,我们将聚焦以下关键领域:
- AI系统各组件的细粒度结构和框架
我们将进一步分解和分析图1.2中展示的每个组件,使你能够系统性地思考AI,并在AI旅程中做出明智决策。 - 坚实的技术基础
核心目标是赋予你扎实的技术底蕴。掌握这些知识后,你能评估AI创意的可行性,更加动手进行原型设计和实验。无论是验证假设还是快速构建概念证明,都能增强你与工程师和数据科学家的协作自信。 - 多样化场景
为激发AI在不同环境中的发展,本书涵盖了B2B和B2C等不同业务场景,涉及初创企业和成熟公司。通过这些示例,你将了解AI如何应用于不同问题,激发创新,并为广泛用户创造价值。 - AI的基础理念和概念
尽管AI领域的工具和框架不断演进,许多基础概念相对稳定。比如,2024-25年最火热的AI趋势之一是智能代理,但你知道智能代理的概念早在1995年(由Stuart Russell和Peter Norvig所著的经典书籍《Artificial Intelligence: A Modern Approach》中)就已被正式提出吗?本书中的教训很可能长期适用。附录还提供了当前AI工具生态的概览。若需最新AI用例、工具与技术动态,请参考Anacode的AI雷达(anacode.de/ai-radar)。 - 促进跨学科协作
AI项目需要工程师、用户体验设计师、数据科学家和领域专家等多角色紧密合作。为帮助你培养同理心和理解,本书在边栏提供了角色专属解读(例如第5章的“工程师专栏:语言模型输出结构化”)。理解各角色的优先事项和挑战,将助你在团队中促进有效沟通与协同。
到本书结束时,你将能够驾驭AI的复杂性,领导跨学科团队,构建真正产生影响的AI产品。现在,让我们开始吧。
首先要问的是,为什么你会启动一个AI开发项目——无论是你自己、你的上司还是团队其他成员发起?仅仅因为“AI很火”是不够的。任何开发都需要明确的机会来证明投资的合理性。
下一章,我们将探讨AI的机会空间,学习如何系统地构思、优先排序并塑造高影响力的AI项目。这将是你将AI潜力转化为现实的第一步。
总结
作为产品经理,你需要准备好调整自己的方法和思维方式。你必须亲自参与AI技术,接受其不确定性和概率性特点。
- 基于明确的、以用户为驱动的机会或战略业务目标开展AI项目,而非盲目追随潮流或领导指令。
- 用具体案例将你的数据与真实用户需求和场景对齐,以提升模型的性能和相关性。
- 积极参与原型设计、测试和实验,更好地使AI能力符合产品需求。
- 构建AI系统时,使用本章前面图1.2中的思维模型,理解并管理数据、智能、用户体验和治理之间的相互依赖关系。
- 透明沟通AI的能力和局限,避免夸大其词、无法兑现。
- 创建引导用户行为、提供透明度并缓解概率性AI系统固有错误的用户体验。
- 在AI开发的每个阶段实施保障措施,识别并应对隐私、偏见和公平性等风险。
- 专注于用合适的模型高效解决问题,避免不必要地追求最前沿的解决方案。
- 通过理解不同团队角色(工程师、设计师、数据科学家)的优先事项和挑战,促进同理心和协同一致。
- 推出AI功能时,制定清晰的评估和迭代路线图,利用用户反馈持续提升准确性、易用性和采纳率。