使用魔搭社区完成LLM初体验
大型语言模型简介
-
大模型,即大型语言模型(Large Language Model),是指通过深度学习技术训练得到的、参数量极大的神经网络模型。
-
大模型就像是一个超级智能的电脑程序,它非常善于理解和生成人类的语言。想象一下,如果你教一个小孩子学会说话,你需要花很多时间和他说很多话,给他读很多故事书,慢慢地他就能理解更多的词汇和句子,并开始自己说出有意义的话来。大模型也是这样,只不过它是通过读取互联网上大量的文字信息来“学习”各种语言的用法。因为它学了很多很多的信息,所以它可以写故事、回答问题、甚至模仿不同的写作风格,就像一个非常博学的人一样。当你跟它交流时,它能根据你提供的信息给出合理的回应。
-
传统的开发方式需要编写具体的代码来实现功能,而使用 LLM 的新方法则是通过输入提示(prompt),由模型直接生成输出结果,这大大简化了开发流程,并且在某些情况下可以完全替代传统编程。
魔搭社区的优势
- 在国内,魔搭社区作为最大的AI模型开发平台之一,汇集了大量的开源大模型资源和工具,为广大开发者提供了一个理想的实验和创新环境。
- 它不仅提供了丰富的预训练模型供用户选择,还支持云端AI环境,使得模型的部署和测试变得更加便捷。与闭源的解决方案相比,如 OpenAI 提供的服务,开源模型如 CoZe、Qwen 和 Kimi 等,因为其透明性和灵活性而受到更多开发者的青睐。
从理论到实践:情感分析案例
为了更好地理解如何利用魔搭社区进行 LLM 开发,我们以情感分析为例。情感分析是指确定一段文本所表达的情感倾向,比如正面、负面或中性。
1.选择模型库
大模型中的大是指参数大,LLM训练出来的参数可达上百亿,覆盖了全球的知识 。每个模型上的
B就是指bilion。32B就是指720亿\
2.选择Notebook快速开发
3.选择CPU环境启动
4.选择python
什么是Notebook?
- Notebook 开发是指使用集成开发环境(IDE)中的一种特定形式——交互式笔记本(Interactive Notebook),如 Jupyter Notebook,来进行代码编写、执行、文档记录和可视化展示。它允许开发者在同一文档内混合编写代码、运行结果、解释性文本和多媒体内容
- Notebook 开发就像是在一个超级智能的电子笔记本里写程序。在这个笔记本里,你可以一边写代码,一边看到代码运行的结果,还能添加说明文字或图片来解释你的工作。这对于分析数据、做实验或者学习编程的人来说非常方便,因为他们可以在一个地方完成所有事情:写代码、查看结果、记录想法和分享成果。
情感分析
#瑶瑶领先 情感的表达
from modelscope.pipelines import pipeline
# 工具 常量 nlp tasks
from modelscope.utils.constant import Tasks
modelscope (魔搭社区) 中功能很多 , pipelines 可以理解为有很多的管道 ,派出一个管道实现它特定的功能
#情感分析 文本分类
semantic_cls = pipeline(Tasks.text_classification,
'damo/nlp_structbert_sentiment-classification_chinese-base')
大模型的一种:damo/nlp_structbert_sentiment-classification_chinese-base
- pipleline 打开管道
- 选择一项任务 Tasks.text_classification
- 选择模型 damo/nlp_structbert_sentiment-classification_chinese-base
result = semantic_cls(input='遥遥领先')
print(result)
可以看出正面情绪比例最大
情绪更加强烈了,正面的评分也越来越高
result = semantic_cls(input='我被女朋友甩了')
print(result)
result = semantic_cls('以前是没钱买宝马,现在是没钱的,买宝马')
print(result)
这里可以看出它明显误解了文本的意思。这是因为模型训练完之后就不成长了,新的知识就没法加入进来,不太准确,所以需要持续的更新模型,不断的迭代优化。需要喂一些数据 并对数据进行标注。这就是微调大模型
模型迭代的重要性
尽管 LLM 在训练完成后已经具备了一定的能力,但随着时间推移和技术进步,新的知识不断涌现,从上面的例子也可以看出。因此,保持模型的更新至关重要。通过持续地喂入新的数据并对其进行标注,我们可以微调现有的大模型,使其更加精准和适应最新的应用场景。这种迭代过程对于确保模型性能至关重要。
前后端开发者的机遇
对于前后端开发者而言,了解和掌握 LLM 技术意味着拥抱一个全新的时代——端模型时代。小型化、高效的 AI 模型正在进入我们的日常生活,从智能手机到自动驾驶汽车,无处不在。借助 Marscode 等工具,开发者不仅可以提高个人的工作效率,还可以将更多复杂的任务交给大模型来完成,从而专注于创造更具价值的产品和服务。