Python列表到LLM接口:从列表切片到大模型、Notebook实战

33 阅读4分钟

一、AI 开发基础:核心工具与开源生态

1. 阿里 ModelScope 模型空间

ModelScope 是阿里巴巴开源的AI 模型社区与开发平台,是国内开发者快速落地 AI 应用的首选工具之一,核心能力:

  • 开源模型库:覆盖 NLP(自然语言处理)、CV(计算机视觉)、语音、多模态等全品类预训练模型
  • 开源数据集:提供标注好的行业数据集,无需从零采集数据
  • 低代码实验:支持一键运行 NLP、机器学习实验,降低 AI 开发门槛

2. Transformer 架构

Transformer 是现代大模型的底层核心架构,2017 年由 Google 提出,彻底颠覆了传统 NLP 模型:

  • OpenAI 的 GPT 系列、Google Gemini、Anthropic Claude 等所有主流大模型,均基于 Transformer 架构优化而来
  • 它是 2022 年底生成式 AI 浪潮的技术基石

3. Jupyter Notebook 开发神器

Notebook 是 Python 数据分析、AI 学习的标配工具,文件后缀为 .ipynb,核心优势:

  • 支持代码 + Markdown 笔记混编,边写代码边记录思路
  • 逐行运行代码,实时查看结果,适合调试、写报告、做数据分析
  • 替代传统纯代码文件,是机器学习、数据挖掘的首选开发环境

二、Python 核心:List 列表(最灵活的数据结构)

在 Python 中,List(列表)是使用频率最高的数据结构,远优于固定类型的数组(array),设计理念与 JavaScript 的 Array 相似,但更适合数据计算。

1. List 核心特性

  1. 无需提前指定容量:动态扩容,想加多少元素就加多少
  2. 类型无约束:一个列表可同时存储数字、字符串、对象等任意类型数据
  3. Python 专属优势:Python 拥有完善的数值类型(整数、浮点数、高精度数值),适合机器学习、爬虫、数据分析;对比 JavaScript:JS 只有单一 Number 类型,无高精度计算,仅适合页面展示与交互。

2. List 基础代码实操

python

运行

# 1. 创建列表:支持混合数据类型
my_list = [10, "Python", 3.14, True, [1, 2, 3]]
print("原始列表:", my_list)

# 2. 访问元素:通过索引(从 0 开始)
print("第一个元素:", my_list[0])   # 输出:10
print("最后一个元素:", my_list[-1]) # 输出:[1,2,3]

# 3. 修改元素
my_list[1] = "AI 开发"
print("修改后列表:", my_list)

# 4. 追加元素
my_list.append("大模型")
print("追加元素后:", my_list)

三、Python 高效操作:Slice(切片)

切片是 Python 列表的王牌功能,极简语法实现「截取部分元素」,无需编写循环代码,大幅简化开发。

1. 切片核心语法

列表[起始索引:结束索引:步长]

  • 起始索引:默认 0(可省略)
  • 结束索引:不包含该索引对应元素(左闭右开)
  • 步长:默认 1(可省略)

2. 切片代码实操

python

运行

# 定义测试列表
L = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

# 1. 基础切片:取索引 0~2(不包含 3)
print(L[0:3])   # 输出:[0, 1, 2]
# 起始为 0 可省略
print(L[:3])    # 输出:[0, 1, 2]

# 2. 取末尾元素
print(L[-3:])   # 输出:[7,8,9](取最后 3 个元素)

# 3. 全量切片(复制列表)
print(L[:])     # 输出:完整列表

# 4. 带步长切片:隔一个元素取一个
print(L[::2])   # 输出:[0,2,4,6,8]

四、大模型(LLM)开发基础

1. 主流 LLM 厂商与标准

  • 开源基石:Transformer(Google)
  • 头部厂商:OpenAI(GPT)、Google(Gemini)、Anthropic(Claude)、DeepSeek
  • 行业标准:DeepSeek 兼容 OpenAI 接口,降低开发者适配成本

2. 核心接口与 Prompt 工程

  • Completion 接口:大模型最基础的生成接口,输入 Prompt,输出模型生成结果
  • Prompt 工程:清晰、详细地描述业务需求,是大模型输出高质量结果的核心

总结

  1. Python 核心:List 是最灵活的数据结构,切片是高效截取元素的神器,是 AI 开发的基础;
  2. AI 工具:ModelScope 提供开源模型 / 数据集,Notebook 是 AI 开发标配,Transformer 是大模型底层架构;
  3. 开发定位:Python 专注计算与 AI,JS 专注前端交互,LLM 接口 + 优质 Prompt 是大模型应用的核心。