平衡以人为本和技术优先的思维
考虑你正在解决的问题是否需要人工智能解决方案
在探索使用人工智能系统为产品充能的可能性时,重要的是要平衡人工智能的能力和预期用户的需求。
以人为本的方法始于确定人们需要帮助的真正问题。这种方法的关键是阐明和验证你的假设,即你的产品将解决什么问题,它将为谁解决这些问题,以及在什么情况下解决这些问题。
相比之下,技术优先的方法通常从探索技术的能力和局限性开始,以确定它如何解决不同的问题或满足用户需求。这是人工智能产品的一种流行方法,已经被许多人使用,但需要具体的底层改进,比如利用安全分类器来改善用户体验。
这两种方法都可以产生人们喜爱的伟大产品设计。与任何以人为本的设计过程一样,无论是否是人工智能产品,与人交谈、查看数据和观察行为都可以帮助你平衡以人为本和技术至上的方法。
决定人工智能是否增加了独特价值
一旦你确定了你想要解决的问题,你就需要确定哪些可能的解决方案需要人工智能,哪些是人工智能有意义地增强的,哪种类型的人工智能最适合解决你的问题,哪些解决方案没有从人工智能中受益,甚至被人工智能削弱。
例如,高价值的任务可能会被人工智能打乱,让那些不想自动化或增强的人感到懊恼。
重要的是要质疑在你的产品中添加人工智能是否会改善或倒退用户体验。花点时间批判性地考虑将人工智能引入你的产品可能会如何改善或倒退用户体验。
风险
情况可能有高风险或低风险。想象一下,人们可能会使用你的系统输出的情况类型,并评估他们应该在多大程度上相信它是准确和精确的,或者是创造性和全面的
用户上下文
人们往往对如何与技术沟通和互动抱有社会期望,这可能会使人工智能解决方案或多或少变得合适。想象一下,在你的产品的可能背景下,人们会如何回应人工智能的输出。
成本
人工智能解决方案的成本各不相同,但可能比启发式系统需要更多的能量和计算能力。考虑一下,与基于规则或人类的解决方案相比,持续使用人工智能解决方案的成本有多高。
了解问题的本质
确认您正在解决正确的问题
在制定解决方案之前,必须对您希望解决的问题建立全面的理解。第一步是尽可能清楚地描述问题,并与代表目标用户的广泛人群一起验证你的框架。
一种开始的方法是采访你正在为之构建的人群中的“极端”用户,以及你试图解决的问题对这些人群的普遍程度。提出问题以揭示问题以前未知的细微差别。哪些社会技术驱动因素可能会影响人们对问题的体验?问题的频率是多少,问题发生的背景和严重程度是什么?问题的关键触发因素是什么,它对人们的影响是什么?考虑到人工智能技术对用户交互有反应,也可以改变产品体验,问题在未来会如何演变?
人们对同一问题的经历可能大不相同
人们将以不同的方式、不同的频率和生命中的不同时刻经历同样的设计问题。身份的某些方面(例如社会经济、语言、位置、身体属性、性别)会影响人们如何体验与大多数目标受众不同的产品。因此,在产品开发过程中的许多转折点,尽早从不同人群那里获得意见非常重要。
识别人工智能需要在这些身份维度上成功解决的潜在子问题,以确定如何在产品中最好地使用人工智能以及何时不使用。
人工智能系统嵌入到更广泛的技术和用户环境中
在产品中使用人工智能模型通常涉及创建一个此类模型系统,以相互交互并与其他技术交互,帮助人们实现目标。
例如,推荐系统通常与安全分类器和强化学习方法结合使用,以便人们以适合特定环境且安全的方式收到与其需求相关的建议。
如果你的产品使用的是新的人工智能模型,或者你对其性能不太确定,那么一个好的第一步是查看文档,如模型卡或数据卡,以了解模型实用性和可用性之间的差异。
GUIDING QUESTIONS
理解问题的本质
这个问题有多普遍?
它影响谁?
这个问题如何影响不同的个人?
在不同的群体和身份维度中,这个问题是如何变化的?
问题的影响是否会随着时间的推移而变化?
了解人们如何构建问题
问题可以是确定性的,也可以是开放性的
在现实世界中解决问题时,人们倾向于创造性地思考,在陌生的环境中即兴发挥,并将其生活经历考虑在内。了解人们如何以及何时考虑“解决”问题的现有期望可以帮助建立人工智能模型和产品政策的成功标准。
为了使人工智能系统取得成功,定义系统的目的以使人工智能体系的行为与用户的意图相一致是很重要的
用户通过一个称为规范的过程向人工智能系统表达他们的目标。规范对齐描述了引导人工智能系统实现预期结果的能力。
当人工智能系统的行为与用户的意图不匹配时,就会出现问题。这些不对中可能导致性能不佳或安全性受损。在某些情况下,失调可能会导致人工智能系统学习一个意外的目标,并根据该目标而不是用户的意图(有时称为奖励黑客)采取适当的行动。
在设计人工智能产品时,重要的是了解人们如何构建问题,以便工程团队能够根据用户体验研究,将用于构建人工智能系统的模型规范与用户体验团队确定为自然、有用、有益和安全的行为相一致。
主要目标
我们应该用我们的产品或应用程序为人们解决什么问题?用户的主要目标是什么?用户希望人工智能系统为他们做什么来帮助他们实现目标?
次级目标
用户将问题分解为哪些替代目标、依赖关系或子问题?这些是否与用户希望解决的主要目标或更大的问题一致?在解决更大的问题之前,需要哪些技能或用户必须解决哪些辅助问题?
描述不足
问题的哪些部分是假设的知识,但用户没有明确指定?您将如何发现这些知识以帮助用户?
优化
有哪些不同的方法来优化问题?为一个子目标进行优化是否会损害另一个子目标?人工智能系统能否混淆各种问题并学习有害行为?
身份维度设计
人工智能在不同文化、背景和身份维度中的表现可能不均衡
如果训练数据中缺乏表示,如果数据标签反映不公平的偏见,并且如果模型没有根据广泛接受的偏见基准(例如,BBQ、WinoBias)进行评估,则您的人工智能系统可能会无意中强化历史偏见,甚至引入新的偏见。在进行研究时,确保了解不同群体对效用的看法,他们如何表达意图,以及他们如何预期使用的不同后果
此外,不同的人以不同的方式体验相同的设计问题。考虑有充分记录的历史,即社区在身份的不同维度上被边缘化的人的不公平人工智能结果。或者相反,如果大多数群体由于过度纠正而被边缘化。边缘化群体对生成性人工智能系统可能如何不同地为他们执行的期望可能与大多数群体期望的生成性人工智系统可能执行的方式不同。
听取反映您的预期用户多样性的许多观点有助于主动避免不公平的偏见。除了在发布前对您的人工智能系统或产品结果进行对抗性测试以实现公平性外,您还可以帮助避免创建无意中排除、最小化或取代特定人群、文化及其标记和职业的产品。
考虑与产品受众相关的各种身份维度
生成人工智能模型的输出是全新的机器生成内容,因此这些内容的可预测性不如其他类型的机器学习。生成性人工智能输出可以包括可能说明定型观念或历史上不准确的文本信息或图像的图像或语句。识别目标用户身份的各个维度可以帮助您了解如何训练、调整和测试生成性人工智能模型,从而避免在人工智能结果中强化与身份相关的偏见或与身份相关、事实上不准确的幻觉。要考虑的身份维度可以包括(在非详尽列表中):
- 年龄
- 残疾
- 教育和识字
- 地理
- 社会经济地位
- 技术熟练程度
此外,考虑这些维度可能如何交叉,并可能受到其他因素的影响,如预期用户的文化、种族、宗教、性取向和身体属性,视情况而定,以实现模型为预期受众输出的目标和产品战略。
GUIDING QUESTIONS
了解人们目前如何界定问题
人们如何看待这个问题?
他们如何体验这个问题?
他们的社会技术背景如何影响他们如何构建或体验这个问题?
在身份的维度上,这些相似或不同之处是什么?
利用参与式或推测式设计方法
考虑使用推测和关键设计实践中的参与式方法来评估人工智能模型的潜在下游影响。这些方法将引发关于您希望通过人工智能模型实现的结果类型的讨论,并帮助您识别您想要避免或减轻的风险和行为。使用这些来优先考虑短期用户体验干预,同时规划整个产品生命周期的长期战略。
人工智能和非人工智能系统的类型
传统AI——分类、回归和推荐
利用现有的编目信息来选择内容和/或对新示例做出决策或预测。这些系统的用途:
- 自动化,如优化效率。例如,智能家庭恒温器,使个人的家舒适,也提高了类似恒温器的效率随着时间的推移。
- 识别整个类别的实体,例如当照片应用程序使用人脸检测来识别照片中的人时,以及当同一个人出现在许多照片中时,人脸识别来记录;或识别口述软件的特定语言,该软件需要为不同的用户或地理位置以及各种语音风格工作。
- 显示动态内容,而不是标准界面,以提高效率。例如,人工智能可以自动从小型企业的现有网站中提取内容,并将其转化为与客户相关的在线广告。这可以节省小企业主的时间,并为特定的人群提供关于其产品或服务的有用信息。
- 向不同的个人推荐不同的内容,如电影或歌曲的个性化建议。
- 根据现有数据预测事件,例如确定某个位置在周末可能的拥挤程度。
- 检测随时间变化的低发生率事件;例如,信用卡欺诈不断发展,个人很少发生,但在一个大的群体中经常发生。人工智能可以学习这些不断演变的模式,并在出现新的欺诈类型时检测它们。
- 通过为大量用户遵循模式,加快流程,为特定领域提供可预测的机器人或代理式体验,例如预订酒店或将客户呼叫导向正确的部门。
生成式AI——大型语言、扩散和前沿模型
根据输入生成新内容,如文本、图像或其他媒体的人工智能。这些系统的用途:
- 通过使用多个变量模拟复杂场景(例如,编写代码文档或模拟真实渲染),减少用户在使用专业或专家工具时的认知负荷和/或疲劳。
- 使用人工智能生成的来自多个来源的信息摘要,在独特的演示文稿中生成动态响应。
- 使用与用户相关的图像、视频和文本,回答关于具有个性化信息的企业或场所的上下文相关问题。
- 增强用户在不同媒体上的创造力和表达能力。
- 执行协作任务,以帮助用户探索或提出想法,重新组合内容,并个性化整体体验。
- 为特定用户或组织(如数字助理)提供包含的代理或机器人程序体验,以提供个性化结果或自动化低风险任务。
基于规则或非人工智能系统-启发式
使用一组预定义的规则或受控逻辑而不是人工智能来做出决策或解决问题。这些系统的用途:
- 无论上下文或用户输入如何,都要保持可预测性,这是至关重要的,以便人们可以退出特定的用户旅程或反转操作,而不会出现任何意外错误。
- 提供存储的或有限的信息。例如,信用卡条目表单简单、标准,并且对于不同的用户没有高度不同的信息需求。
- 最大限度地减少人工智能可能发生的代价高昂的错误,因为错误的成本非常高,并且超过了成功率小幅度提高的好处,例如建议越野路线以节省几秒钟的旅行时间的导航指南。
- 当用户需要理解特定建议的基本原理或想要比人工智能系统提供的更一致的解释时,向他们提供简单的解释。
了解人们如何解决问题
为生成性人工智能进行设计需要对开放式场景进行额外的思考和考虑
单个生成人工智能模型可以执行涉及创建新的或新颖内容的多个任务,例如文本、图像、代码、合成数据或其他媒体。通过对话语言,人们能够更直接地与生成人工智能系统互动。这与以前的在线或移动应用程序体验不同,在这些体验中,它们可能会与可预测或容易预测的有序内容序列交互。
映射任务的现有工作流可以帮助您找到人工智能解决用户需求的机会。为了理解解决您的产品要解决的问题的必要步骤,请浏览人们当前如何完成与您正在解决的问题相关的流程,并确定哪些部分可以用人工智能自动化或增强。
看看人们如何使用与你类似的人工智能
利用用户旅程或服务设计模板来记录人们如何与您自己的现有产品和与之一起使用的其他产品交互。如果您的团队还没有产品,请了解如何使用当前的人工智能解决方案,以及它们的缺点。
为了了解人们可能如何使用像您这样的产品,您还可以在Google AI Studio等工具中原型化您的想法,并查看人们对结果的感觉。如果你已经有了一个工作的人工智能驱动的产品,请通过用户研究来测试你的假设。如果您还没有人工智能驱动的产品,请考虑执行“绿野仙踪”测试。人们所面临的挑战可以是告诉问题的原因,或者更深层问题的症状。使用这种理解来指导有关将人工智能集成到产品中的决策。