MindSpore 动静统一特性与自定义网络实战一、核心概念：什么是“动静统一”？在深度学习框架中，通常存在两种

一、核心概念：什么是“动静统一”？

在深度学习框架中，通常存在两种图执行模式：

动态图（PyNative Mode）：也就是大家常说的 Eager 模式。代码逐行执行，所见即所得，非常方便调试和打印中间结果。
静态图（Graph Mode）：将神经网络的计算过程编译成一张计算图，然后由底层的 C++ 引擎执行。它的优势在于性能极高，易于进行整图优化和分布式并行计算，尤其是在昇腾 NPU 上能发挥出极致的算力。

MindSpore 的强大之处在于，它通过一套统一的 API 实现了动态图和静态图的无缝切换。在网络开发和调试阶段，你可以使用 PyNative 模式；在部署和追求极致性能时，只需一行代码切换到 Graph 模式，无需重写任何网络结构代码。

模式切换代码示例

import mindspore as ms

# 切换为动态图模式，方便调试
ms.set_context(mode=ms.PYNATIVE_MODE, device_target="Ascend")

# 切换为静态图模式，追求极致性能（推荐在昇腾硬件上训练时使用）
ms.set_context(mode=ms.GRAPH_MODE, device_target="Ascend")

二、实战演练：构建自定义神经网络

了解了核心概念后，我们来动手写代码。MindSpore 中所有的神经网络模型都需要继承 mindspore.nn.Cell基类。我们将构建一个简单的多层感知机（MLP）来拟合数据。

1. 定义网络结构

在 __init__方法中实例化需要的算子（Layers），在 construct方法中定义前向传播的逻辑。这与许多主流框架的习惯高度一致，学习成本极低。

import mindspore.nn as nn
import mindspore.ops as ops

class SimpleMLP(nn.Cell):
    def __init__(self, input_size, hidden_size, output_size):
        super(SimpleMLP, self).__init__()
        # 定义网络层
        self.fc1 = nn.Dense(input_size, hidden_size)
        self.relu = nn.ReLU()
        self.fc2 = nn.Dense(hidden_size, output_size)
      
    def construct(self, x):
        # 定义前向传播过程
        x = self.fc1(x)
        x = self.relu(x)
        x = self.fc2(x)
        return x

# 实例化网络
net = SimpleMLP(input_size=10, hidden_size=16, output_size=1)
print(net)

2. 定义损失函数与优化器

有了网络之后，我们需要定义损失函数（Loss Function）和优化器（Optimizer）。MindSpore 提供了丰富的内置损失函数和优化器库。

# 定义均方误差损失函数
loss_fn = nn.MSELoss()

# 定义 Adam 优化器，传入网络中需要更新的参数
optimizer = nn.Adam(net.trainable_params(), learning_rate=0.01)

三、自动微分与训练逻辑

MindSpore 推荐使用函数式编程（Functional Programming）的范式来进行训练。我们通常会使用 mindspore.value_and_grad来同时计算前向输出和梯度。

1. 编写前向计算函数

我们需要将网络前向计算和损失函数计算封装到一个函数中，这个函数将作为求导的目标函数。

def forward_fn(data, label):
    logits = net(data)
    loss = loss_fn(logits, label)
    return loss, logits

2. 获取梯度计算函数

使用 ms.value_and_grad生成求导函数。我们需要对网络权重（weights）求导，所以设置 has_aux=True（保留前向输出结果）和 weights=optimizer.parameters。

import mindspore as ms

# 生成求梯度函数
grad_fn = ms.value_and_grad(forward_fn, None, optimizer.parameters, has_aux=True)

3. 编写单步训练逻辑

将梯度计算和参数更新封装到单步训练逻辑中。

def train_step(data, label):
    # 计算损失、前向输出和梯度
    (loss, _), grads = grad_fn(data, label)
    # 使用优化器更新参数
    optimizer(grads)
    return loss

4. 模拟训练循环

最后，我们生成一些随机数据，并运行几个 Epoch 来看看训练效果。

from mindspore import Tensor
import numpy as np

# 生成模拟数据 (Batch Size=32)
data = Tensor(np.random.randn(32, 10).astype(np.float32))
label = Tensor(np.random.randn(32, 1).astype(np.float32))

# 模拟训练循环
epochs = 5
print("开始训练...")
for epoch in range(epochs):
    loss = train_step(data, label)
    print(f"Epoch: {epoch+1}, Loss: {loss.asnumpy():.4f}")
  
print("训练完成！")

MindSpore 动静统一特性与自定义网络实战

一、 核心概念：什么是“动静统一”？