在本章中,我们将探讨如何应用生成型人工智能(GenAI)来总结文档,这是各个行业中一种无价的能力。然而,在深入具体的用例之前,必须认识到,由GenAI驱动的搜索智能支持多种用例,除了文档总结外,还包括测试用例生成、支持文本、音频和视频数据的文档搜索,以及各种分析业务用例。然而,我们的重点将放在金融服务领域的一个引人注目的用例上,其中文档摘要可以简化流程并增强合规性工作。
为了说明这一用例,让我们考虑一个情境:一个金融服务公司面临审阅大量客户申请的艰巨任务。这些申请通常跨越多页,涵盖了各种信息,包括个人详细信息、财务历史、投资目标和风险分析。
手动审阅并提取每份申请的关键要点是一个耗时且容易出错的过程,尤其是在处理大量提交的情况下。在这种情况下,基于GenAI的摘要功能可以发挥重要作用,通过高效地提取最关键的信息,并确保遵循合规性指南,提供不仅能够总结,还能够聚焦于需要关注的方面,从而提升用户体验。
通过利用GenAI模型的自然语言理解和生成能力,公司可以开发一个智能系统,分析合规性文件,识别关键细节并生成简洁的摘要。这些摘要随后可以无缝地集成到下游流程中,如风险评估、投资组合构建或客户入职工作流。
需要注意的是,这个用例并不是要替代合规官员的工作,而是通过GenAI增强他们的工作,优化工作质量和效率。
本章将通过参考在第4章《生成型人工智能批处理与实时集成模式》中提出的GenAI集成框架,进一步展开实例分析。首先定义了在金融服务行业中总结客户申请的用例,以简化流程并增强合规性工作。接下来,提出了一种基于Google Cloud的云原生、无服务器架构,用于批量处理这些客户申请。
接下来,我们将深入探讨管道的入口点,即在Google Cloud Storage(GCS)中创建的对象,触发云函数启动摘要处理过程。我们将强调提示预处理的重要性,将领域特定的知识和合规性指南纳入提示中。
我们将讨论推理阶段,在此阶段,将量身定制的提示和客户申请内容提交给Google Gemini(通过Vertex AI),以生成简洁的摘要。
我们还将讨论结果后处理,包括将摘要数据导入数据库,并提供多种展示摘要的方式,如专用应用程序或与现有系统的集成。最后,我们将提供在Google Cloud上实现所提解决方案的示例代码。
用例定义
在这个示例用例中,我们将处理10-K表格的摘要用例。10-K表格旨在为投资者和监管机构提供公司财务状况、运营和风险因素的透明度。对于大型复杂公司而言,细节可能跨越数百页。
总结公开公司提交的详尽的10-K年度报告可以为金融服务公司解锁巨大的价值。这些冗长的文件,通常超过数百页,包含有关公司业务运营、财务表现、风险因素和战略的关键信息。然而,手动分析这些文件是一个极其耗时且低效的过程。通过利用先进的人工智能能力生成简洁的10-K摘要,金融机构可以加速其分析过程,同时确保一致地提取最相关的细节。这些摘要为投资专业人员提供了对关键财务指标、竞争洞察、潜在风险和未来展望的快速访问,从而使他们能够做出更有信息支持的投资决策和投资组合监控。
此外,摘要后的10-K报告可以无缝集成到金融公司现有的研究工作流、合规性流程和决策支持系统中。这种自动化的方法提升了可扩展性,使分析师能够迅速处理大量报告。同时,它还减少了手动分析过程中可能发生的人为错误或疏漏。因此,金融服务公司可以通过AI驱动的10-K摘要,利用优化的投资分析、改进的风险管理实践以及更明智的资本配置策略,从而在业务中获得竞争优势——最终有助于提升回报和运营效率。
手动审阅这些表格可能是一个耗时且容易出错的过程,特别是在处理大量表格时。金融服务专业人员必须仔细分析每个部分,识别关键信息,并确保准确理解客户的需求和风险概况。
通过利用GenAI驱动的摘要方法,金融机构可以简化各种手动流程,从每个表格中提取最显著的信息,同时遵循合规性标准。这些摘要随后可以帮助金融顾问和投资组合经理快速掌握客户情况并做出明智的决策。以下图表通过解释在设计提示时将使用的不同组件来说明这一点。
此外,这些摘要可以无缝集成到下游流程中,如风险评估、投资组合构建或客户入驻工作流,减少手动数据输入的需求并最小化错误的风险。
合规官员也可以通过将特定规则和指导方针纳入提示中,从GenAI驱动的摘要中受益。例如,摘要模型可以被指示突出潜在的警示信号,例如财务信息的不一致性或声明的风险承受能力与投资目标之间的差异。通过及时发现这些问题,合规团队可以主动解决这些问题,确保遵守监管要求并减少潜在风险。
此外,GenAI模型生成的摘要可以作为未来客户互动的宝贵参考点,使金融顾问能够快速审查客户情况,并提供个性化的建议或推荐,最终改善客户体验并加强客户关系。
架构
基于第5章《集成模式:批量元数据提取》中讨论的架构,在第一个批处理示例中,我们将采用类似的云原生、无服务器方法,在Google Cloud上处理客户申请的批量总结。这个可扩展的架构利用了多种服务,允许我们无缝集成AI模型并存储生成的摘要。
该架构将包含以下组件:
- 对象存储(Google Cloud Storage) :这个高度可扩展且耐用的对象存储将用于存储客户申请,文件格式可以是PDF、Word文档或结构化数据文件。
- 消息队列(Google Cloud Pub/Sub) :将使用消息队列来协调数据流并管理客户申请的处理。
- 处理组件(Google Cloud Functions) :Cloud Functions将作为处理组件,执行总结任务并调用大语言模型(LLM)。
- 大语言模型(Google Gemini) :我们将利用强大的大语言模型,如托管在Vertex AI上的Google Gemini,执行实际的总结任务。
- 数据库(Google BigQuery 或 Cloud Firestore) :生成的摘要将以结构化格式存储在关系型数据库(BigQuery)或文档数据库(Cloud Firestore)中,具体取决于需求。
这些组件之间的交互如图所示:
以下是架构流程的详细分解:
- 客户申请被上传到Google Cloud Storage,一旦文件进入存储桶,便触发云函数。
- 云函数从Cloud Storage读取申请列表,并将消息发布到Pub/Sub主题,实际上创建了一个待处理的申请队列。
- 另一个订阅了Pub/Sub主题的云函数,将为队列中与每个消息相关联的申请触发。
- 这个第二个云函数调用托管在Vertex AI上的大语言模型(例如,Google Gemini),将申请内容作为输入并附带定制的提示信息。
- 大语言模型处理申请,利用其自然语言理解能力生成简明的摘要,同时遵循任何指定的规则或指导原则。
- 生成的摘要随后以结构化格式(例如,BigQuery或Cloud Firestore)存储,供进一步分析、集成和使用。
这种无服务器架构提供了多个优势,包括自动扩展、成本效益(按使用付费)以及与其他Google Cloud服务的无缝集成。此外,它还允许与现有工作流的轻松集成,使金融机构能够在不显著干扰现有流程的情况下,利用GenAI驱动的总结功能。
入口点
与前一章类似,我们的批处理管道的入口点将是一个在Google Cloud Storage(GCS)中创建的对象。当客户申请被上传到指定的GCS存储桶时,将触发一个云函数,启动总结过程。
在这个用例中,我们将利用Google Gemini的强大功能,它是一种先进的GenAI模型,以其自然语言理解和生成能力而闻名。Gemini将分析上传的客户申请,智能地提取最重要的信息并生成简洁的摘要。
为了确保符合监管要求并遵循特定的指南,我们将把规则和指令融入到提供给Gemini的提示中。这些规则可能包括突出潜在的警示信号、确保风险承受能力与投资目标之间的一致性,或者根据合规要求强调申请的特定部分。
通过结合Gemini的先进推理能力和量身定制的提示及规则,我们可以生成不仅能够捕捉客户申请精髓的摘要,还能促进高效的审查和决策过程,同时保持合规性。
提示预处理
我们将从制定一个有效的提示开始,以引导GenAI模型生成准确且符合合规要求的总结。在此案例中,我们将利用金融服务行业中合规官员和主题专家的见解,来了解需要在总结中捕获的关键信息。
需要强调的是,这个提示的意图是提供合规指南可能的样例,但这绝不代表现实世界的合规实例,也不打算用于分析商业资料。
根据这些见解,我们将开发一个模板或一组指南,概述需要包括在总结中的关键部分和数据点。这个模板将作为我们提示的基础,确保GenAI模型生成的总结与金融服务公司的具体要求相符。
此外,我们将结合合规官员提供的规则和指南,确保总结符合相关法规和行业最佳实践。这些规则可能包括指示突出潜在的差异、不一致之处或需要进一步审查或调查的关注点。
如你所见,通过设计提示并将领域特定的知识和合规指南融入其中,我们可以利用GenAI的强大功能,生成不仅简洁且准确的总结,还能提供与合规性和监管要求相关的见解,最终简化申请审核过程,同时降低潜在风险。
prompt_template_beggining = """
You are an expert compliance analyst.
Your task is to extract information from the sign up forms obtained.
1. Carefully analyze the document provided as context.
2. Write an intro paragraph for the company so the senior compliance analyst can quickly understand who the customer is.
3. Following the guidance for approved businesses add a paragraph after the intro explaining why the business is supportable or not.
4. Add another paragraph below explaining where the company is.
5. Always think step by step.
<supportable_businesses>
Summary of Prohibited & Restricted Businesses
This document outlines the types of businesses and activities that are generally not allowed or require prior approval to use payment processing services. These restrictions exist due to legal requirements, financial partner rules, and compliance and risk management policies of payment processors.
Types of Businesses:
High-Risk Jurisdictions and Persons: Businesses operating in or dealing with sanctioned countries and individuals.
Prohibited Businesses: Activities involving illegal products or services, adult content, certain financial services, marijuana, unfair practices, weapons, etc.
Restricted Businesses: Activities requiring prior written approval from the payment processor, such as CBD, financial products, pharmaceuticals, non-fiat currency, and more.
Jurisdiction-Specific Prohibited Businesses: Additional restrictions based on specific countries, such as India, Japan, Malaysia, Mexico, Singapore, Thailand, UAE, and the US.
Prohibited Uses of Payment Processing Services:
Misrepresentation of identity or business.
Facilitating transactions for undisclosed merchants.
Using the service as a virtual terminal.
Processing without actual goods or services.
Evasion of chargeback monitoring.
Sharing cardholder information.
Misuse of intellectual property.
Prohibitions for Card Issuing Products:
Consumer use for personal expenses.
International use outside of the registered jurisdiction.
Lending without proper licensing and approval.
Abusive practices like free trial abuse and scalping.
Non-compliance with marketing and user experience guidelines.
Inactivity for 12 consecutive months.
Incorrect integration type for employee/contractor cards.
Business Analyst Recommendations:
Based on this information, a business analyst should pay close attention to the following types of businesses:
Financial Services: This is a broad category with many restrictions and nuances. It's crucial to understand the specific requirements for lending, crowdfunding, money transmission, etc.
Regulated Industries: Industries like CBD, pharmaceuticals, and tobacco require careful consideration of compliance and legal aspects.
High-Risk Businesses: Businesses prone to fraud or abuse, like travel reservation services and multi-level marketing, need thorough risk assessments.
Emerging Technologies: Activities involving cryptocurrency, NFTs, and other new technologies should be evaluated based on current regulations and the payment processor's policies.
Jurisdiction-Specific Restrictions: Businesses operating in or targeting specific countries need to be aware of additional prohibitions and requirements.
Additional Considerations:
Business Model: Restrictions often depend on the specific business model and how the service is used.
Compliance: Understanding and adhering to relevant regulations is essential to avoid account closure or other consequences.
Risk Management: Businesses should have robust risk management practices to mitigate potential financial and legal risks.
Transparency: Maintaining clear and accurate information about the business and its activities is crucial for approval and continued use of payment processing services.
By carefully considering these factors, a business analyst can help ensure that businesses comply with the payment processor's policies and operate successfully within the platform.
</supportable_businesses>
<document>
"""
prompt_template_end="""
</document>
Response:
"""
推理
在推理阶段,我们将把提示和客户应用内容提交给通过Vertex AI提供的Google Gemini模型。Vertex AI平台提供了一个强大且可扩展的环境,用于部署和管理GenAI模型,确保高性能和企业级安全性。
在我们的示例中,我们使用的是一组示例数据集,包含了注册我们虚构的金融服务公司的公司信息。推理代码将对整个数据集进行处理,并添加延迟以防止超出可用配额。根据云提供商或设置的不同,您可能有不同的推理配额,这通常与QPS(每秒查询)或QPM(每分钟查询)有关。在我们的示例中,我们的限制是每分钟6次查询。
以下代码片段将结果文本内容填充到一个数组中。您可以进一步自定义此过程,例如评估安全属性或处理空结果。例如,在空结果的情况下,您可以标记该文档并将其发送到队列进行进一步处理。
import time
summaries = []
for doc in docs:
result = generate(prompt_template_beggining,str(doc),prompt_template_end)
#sleep 10 seconds to not exceed 6 QPM
time.sleep(10)
summaries.append(result.text)
print(result.text)
在思考更复杂的推理管道时,我们需要关注以下步骤:
- 由GCS中新客户应用的到来触发的云函数,将检索应用内容和定制的提示。
- 云函数调用Vertex AI上的Gemini模型,传递应用内容和提示作为输入。
- Gemini处理应用内容,利用其自然语言理解能力生成简洁的总结,并遵循提示中规定的规则和指南。
- 生成的总结返回到云函数,进行进一步处理和存储。
通过利用Gemini的强大功能和Vertex AI的可扩展性,我们可以高效地处理大量客户应用,及时生成准确且符合合规要求的总结。
结果后处理
一旦LLM处理完客户应用,它将以结构化格式(如JSON或标记语言)返回总结。我们管道中的下一步是将这些总结导入数据库,以便高效地存储和检索。
具体的导入策略将取决于我们选择使用的数据库类型。例如,如果我们选择像BigQuery这样的关系型数据库,我们将需要将总结数据点映射到适当的表结构,确保适当的规范化并遵守数据完整性原则。
另一方面,如果我们决定使用像Cloud Firestore这样的文档数据库,导入过程将更为简单,因为这些数据库本身设计用于存储层次结构数据。在这种情况下,我们可以直接以原始格式导入总结,利用数据库高效存储和查询复杂数据结构的能力。
无论选择哪种数据库类型,设计一个确保数据一致性、可扩展性和性能的导入策略至关重要。这可能包括实施批量导入、索引和分区等策略,以优化数据库的性能并确保高效检索总结数据。
结果展示
在展示由客户应用生成的总结时,需要考虑多个因素,包括目标受众、预期用途以及与现有系统和工作流程的集成。
一种方法是开发一个专门的应用程序或仪表板,允许金融顾问、投资组合经理和合规官员轻松访问和审阅这些总结。该应用程序可以提供过滤、排序和搜索等功能,使用户能够根据特定标准(如客户风险档案、投资目标或GenAI模型识别的潜在风险信号)快速定位和分析总结。
此外,应用程序还可以提供可视化工具,以更直观和视觉吸引人的方式呈现总结数据。例如,可以使用图表和图形来展示客户的财务概况、风险承受能力和投资目标,为金融顾问提供一目了然的全面概览。
另一种方法是将总结直接集成到现有的客户关系管理(CRM)系统或客户入驻工作流中。这种集成将允许金融顾问和合规官员无缝访问总结,而不影响他们已经使用的工具和平台,从而减少对现有流程的干扰。
此外,这些总结还可以用于自动化和决策支持。例如,可以训练基于规则的系统或机器学习模型,分析总结并提供建议或风险评估,进一步提升客户入驻和投资组合管理流程的效率和准确性。
无论选择哪种展示方式,都必须确保以安全和合规的方式呈现总结,遵循行业规定和数据隐私标准。应实施访问控制和授权机制,以确保敏感的客户信息仅对授权人员开放。
在本章的GitHub目录中,您将找到完整的代码和对本章所述所有组件如何互相配合的分析。特别注意框架中的每个组件如何相互作用。
总结
在本章中,我们探讨了在金融服务行业中应用GenAI对客户申请进行总结的案例。我们首先定义了问题陈述,金融机构需要高效地审查和提炼长篇客户申请中的关键信息,同时确保遵守监管要求。
我们强调了在此背景下,GenAI驱动的总结功能的价值,它能够提取关键细节,简化下游流程,并促进更有根据的决策制定,同时遵守合规标准。
接下来,我们提出了一个基于Google Cloud的云原生、无服务器架构来处理客户申请的批量处理总结。这个可扩展的设置利用了多个服务,包括Cloud Storage、Pub/Sub、Cloud Functions,以及像BigQuery或Cloud Firestore这样的数据库,实现了AI模型的无缝集成和生成的总结存储。
我们接着深入讨论了提示预处理的过程,强调了将特定领域知识和合规指南融入提示中的重要性。通过与主题专家和合规官员的合作,我们能够编写提示,指导GenAI模型生成准确且符合合规要求的总结。
推理阶段涉及将量身定制的提示和客户申请内容提交给Google Gemini(通过Vertex AI)。Gemini强大的自然语言理解和生成能力,加上精心设计的提示,使得生成简洁且富有洞察力的总结成为可能。
我们还涵盖了后处理步骤,例如将总结数据导入数据库,并讨论了呈现总结的不同方法,包括专用应用程序、仪表板,或与现有CRM系统和工作流的集成。
总体来说,本章提供了一个实用的框架,利用GenAI的力量简化金融服务行业客户申请的审查和分析,同时确保遵守监管要求并启用更高效和更有信息的决策过程。
在下一章中,我们将探索一个聚焦于意图分类的实时应用案例,利用GenAI技术。