def solution(n, array):
result = 0
for i in range(n):
L = 0
for j in range(i):
if array[j] > array[i]:
L = j + 1
R = 0
for k in range(i + 1, n):
if array[k] > array[i]:
R = k + 1
break
max_value = L * R
if max_value > result:
result = max_value
return result
代码解释
-
初始化结果变量
- 首先,定义
result并初始化为 0,这个变量将用于存储最终的MAX(i)的最大值。
- 首先,定义
-
遍历数组
- 使用
for循环遍历数组中的每一个元素,索引为i,范围是从 0 到n - 1。
- 使用
-
计算
L(i)- 对于每个
i,初始化L为 0。然后再嵌套一个for循环,从 0 到i - 1(即j的范围是0 <= j < i)遍历数组。 - 当找到
array[j] > array[i]时,更新L为j + 1(因为题目中要求是从 1 开始计数,而索引是从 0 开始的)。
- 对于每个
-
计算
R(i)- 初始化
R为 0。再使用一个for循环,从i + 1到n - 1(即k的范围是i + 1 <= k < n)遍历数组。 - 当找到
array[k] > array[i]时,更新R为k + 1并立即break跳出循环,因为只需要找到最小的满足条件的k。
- 初始化
-
计算
MAX(i)并更新结果- 计算
max_value = L * R。 - 如果
max_value大于result,则更新result为max_value。
- 计算
-
返回结果
- 最后,返回
result,即MAX(i)在1 <= i <= N范围内的最大值。
- 最后,返回
在if __name__ == "__main__"部分,调用solution函数并检查结果是否等于预期值(这里是 8)。如果需要测试更多的样例,可以在if __name__ == "__main__"部分添加更多的测试代码。
代码中的L和R是什么意思?
可以优化这段代码吗?
如何解决时间复杂度过高的问题? 关于大模型的微调(或称精调)、预训练、重新训练、乃至从头训练,这是一个相当大的话题,不仅仅需要足够的知识和经验,还需要大量的语料数据、GPU硬件和强大的工程能力。别说一节课了,我想两三个专栏也不一定能讲全讲透。不过,我可以提纲挈领地把大模型的训练流程和使用方法给你缕一缕。这样你就能体验到,在LangChain中使用自己微调的模型是完全没问题的。
大语言模型发展史
说到语言模型,我们不妨先从其发展史中去了解一些关键信息。
Google 2018 年的论文名篇Attention is all you need,提出了Transformer架构,也给这一次AI的腾飞点了火。Transformer是几乎所有预训练模型的核心底层架构。基于Transformer预训练所得的大规模语言模型也被叫做“基础模型”(Foundation Model 或Base Model)。
在这个过程中,模型学习了词汇、语法、句子结构以及上下文信息等丰富的语言知识。这种在大量数据上学到的知识,为后续的下游任务(如情感分析、文本分类、命名实体识别、问答系统等)提供了一个通用的、丰富的语言表示基础,为解决许多复杂的NLP问题提供了可能。
在预训练模型出现的早期,BERT毫无疑问是最具代表性的,也是影响力最大的模型。BERT通过同时学习文本的前向和后向上下文信息,实现对句子结构的深入理解。BERT之后,各种大型预训练模型如雨后春笋般地涌现,自然语言处理(NLP)领域进入了一个新时代。这些模型推动了NLP技术的快速发展,解决了许多以前难以应对的问题,比如翻译、文本总结、聊天对话等等,提供了强大的工具。
当然,现今的预训练模型的趋势是参数越来越多,模型也越来越大,训练一次的费用可达几百万美元。这样大的开销和资源的耗费,只有世界顶级大厂才能够负担得起,普通的学术组织和高等院校很难在这个领域继续引领科技突破,这种现象开始被普通研究人员所诟病。
预训练+微调的模式
不过,话虽如此,大型预训练模型的确是工程师的福音。因为,经过预训练的大模型中所习得的语义信息和所蕴含的语言知识,能够非常容易地向下游任务迁移。NLP应用人员可以对模型的头部或者部分参数根据自己的需要进行适应性的调整,这通常涉及在相对较小的有标注数据集上进行有监督学习,让模型适应特定任务的需求。
这就是对预训练模型的微调(Fine-tuning)。微调过程相比于从头训练一个模型要快得多,且需要的数据量也要少得多,这使得作为工程师的我们能够更高效地开发和部署各种NLP解决方案。
图中的“具体任务”,其实也可以更换为“具体领域”。那么总结来说:
- 预训练:在大规模无标注文本数据上进行模型的训练,目标是让模型学习自然语言的基础表达、上下文信息和语义知识,为后续任务提供一个通用的、丰富的语言表示基础。
- 微调:在预训练模型的基础上,可以根据特定的下游任务对模型进行微调。现在你经常会听到各行各业的人说:我们的优势就是领域知识嘛!我们比不过国内外大模型,我们可以拿开源模型做垂直领域嘛!做垂类模型! —— 啥叫垂类?指的其实就是根据领域数据微调开源模型这件事儿。
这种预训练+微调的大模型应用模式优势明显。首先,预训练模型能够将大量的通用语言知识迁移到各种下游任务上,作为应用人员,我们不需要自己寻找语料库,从头开始训练大模型,这减少了训练时间和数据需求;其次,微调过程可以快速地根据特定任务进行优化,简化了模型部署的难度;最后,预训练+微调的架构具有很强的可扩展性,可以方便地应用于各种自然语言处理任务,大大提高了NLP技术在实际应用中的可用性和普及程度,给我们带来了巨大的便利。
好,下面咱们开始一步步地使用开源模型。今天我要带你玩的模型主要是Meta(Facebook)推出的Llama2。当然你可以去Llama的官网下载模型,然后通过Llama官方 GitHub 中提供的方法来调用它。但是,我还是会推荐你从HuggingFace下载并导入模型。因为啊,前天百川,昨天千问,今天流行Llama,明天不就流行别的了嘛。模型总在变,但是HuggingFace一直在那里,支持着各种开源模型。我们学东西,尽量选择学一次能够复用的知识。