from torchvision import datasets# 基于torchvision库的ImageFolder提取图片路径 folder = datasets.ImageFolder(root='动物图片', transform=trans_compose) n = len(folder) n1 = int(n * 0.8) n2 = n - n1 train, test = random_split(folder, [n1, n2])
for i in range(1): running_loss = 0.0
for batchX, batchY in data_loader:
score=model(batchX)
score = torch.squeeze(score)
# 前向传播
loss = lossf(score, batchY)
# 反向传播和优化
loss.backward()
optimizer.step()
running_loss += loss.item()
optimizer.zero_grad()
# 计算准确率
metricsf(score, batchY)
print(loss, metricsf.compute())
# 打印每个epoch的损失和准确率
# 重置评估指标
metricsf.reset()
torch.save(model.state_dict(), '2-2model_test.pth')
def init(self):
super(MyNet, self).init()
self.c1 = nn.Conv2d(3, 32, 7, 2, 3)
self.b1 = nn.BatchNorm2d(32)
self.c2 = nn.Conv2d(32, 64, 5, 2, 2)
self.b2 = nn.BatchNorm2d(64)
self.c3 = nn.Conv2d(64, 128, 3, 2, 1)
self.b3 = nn.BatchNorm2d(128)
self.L1 = nn.Linear(8192, len(folder.classes))
def forward(self, x): out = self.c1(x) out = self.b1(out) out = torch.relu(out) out = self.c2(out) out = self.b2(out) out = torch.relu(out) out = self.c3(out) out = self.b3(out) out = torch.relu(out) out = torch.flatten(out,start_dim=1) out = self.L1(out) return out
class MyNet(nn.Module):
def __init__(self):
super(MyNet, self).__init__()
self.L1 = nn.Linear(X.shape[1],128)
self.L2 = nn.Linear(128,256)
self.L3 = nn.Linear(256,2)
self.B1 = nn.BatchNorm1d(128)
self.B2 = nn.BatchNorm1d(256)
def forward(self, x):
out =self.L1(x)
out =self.B1(out)
out =torch.relu(out)
out = self.L2(out)
out = self.B2(out)
out =torch.relu(out)
out = self.L3(out)
return out
读取员工数据-》检查数据是否正确》数据清洗》数据分析处理》模型加载》根据模型进行推理》输出相应结果》结束
1.XXX消费行为采集指标
用户基本信息:姓名、年龄、性别、职业、联系方式、常住城市。
购车偏好:意向车型(轿车 / SUV 等)、品牌倾向、预算范围、动力类型(燃油 / 电动等)、车身颜色偏好、座位数需求。
消费行为:过往购车次数、置换 / 全款 / 贷款选择、年均行驶里程、保养支出习惯、关注促销活动频率、线上线下购车渠道倾向。
2.评估数据之类的参数指标有那些,如何试试数据审核流程确保数据质量,有哪些审核方法。
常见评估数据参数指标有准确性、完整性、一致性、时效性、有效性。
数据审核流程:先制定计划,接着预处理数据,再实施审核,记录反馈问题,整改后复查,最后撰写报告。
审核方法有人工审核、逻辑检查、对比分析、统计分析、程序审核,可依数据特点灵活选用。
4.数据标注问题(选二条背) 这是一个问答题 5分
- 质量问题:标注规则理解不一致,导致结果偏差;存在漏标、错标现象。
- 效率问题:人工标注耗时长,复杂任务处理缓慢。
- 安全问题:敏感数据标注时可能引发隐私泄露风险。
- 成本问题:大规模数据标注需大量人力,审核成本高。
改进措施(与上面对应的两条背诵)
- 质量优化:制定详细标注指南,强化培训与案例演示;采用交叉审核 + 抽样质检。
- 效率提升:利用 AI 预标注工具减少基础工作量,优化标注工具操作流程。
- 安全保障:数据脱敏处理,限制标注权限,签订保密协议。
- 成本控制:结合半自动化工具,合理分配人力,降低重复劳动成本。